在统计学里,长期以来,有频率学派和贝叶斯学派两大学派,他们互相鄙视对方,就像华山派的气宗与剑宗之争。

这两大学派最根本的观点在于看待世界的方式不同:

  • 频率学派认为世界是客观的,必须通过大量独立采样来获得统计均值,不能先给出一个主观的先验概率(假设);
  • 贝叶斯学派则认为概率是一种信念度,可以有非常主观的先验概率,然后,通过一次次采样结果修正先验概率,使之逼近客观事实。

这两大学派哪个才是正确的?其实都对,只是看待世界的角度不同。但是在现实世界中,除了抛硬币、掷骰子、玩老虎机等少数符合理想数学模型的场景,频率学派才能发挥作用。大多数需要我们估算概率的现实场景,只能用贝叶斯理论来指导实践。

举个例子,假设我住在市区,希望赶上飞机的概率不低于90%,那么我应该提前多久出发呢?我必须试验至少100次,看看样本空间,才能获得一个比较准确的统计均值。然而这是不现实的,因为我一年可能就坐几次飞机。我只能拍脑袋先估一个提前30分钟就够了,结果第三次就没赶上,这说明我必须修正我的先验概率,后续改为提前45分钟,才能提升赶上飞机的概率。

我们再以《狼来了》的故事为例,当小孩第一次喊狼来了,村民听到后可以根据先验概率,比如P(小孩是诚实的)=90%判断赶紧去帮忙,结果发现被骗了,于是大家根据“被骗了”这一证据把后验概率P(小孩是诚实的)调整为60%,第二次又被骗了,于是再次把后验概率调整为20%,等到第三次听见小孩求救时,大家根据P(小孩是诚实的)=20%判断,他大概率还是在说谎,于是没有人去帮忙了。

有的同学会问,你说的这些,都是定性分析,没有定量计算啊!

要把贝叶斯定理用到定量计算,必须得借助计算机。

以吴军老师在中文分词领域举的一个例子来说,对于一个句子:南京市长江大桥,可以有两种划分:

  • 南京市 / 长江大桥
  • 南京市长 / 江大桥

到底哪一种更合理?我们可以计算条件概率:

  • P(长江大桥|南京市) = 出现“南京市”时,出现“长江大桥”的概率;
  • P(江大桥|南京市长) = 出现“南京市长”时,出现“江大桥”的概率。

提前准备好大量的中文语料,计算出任意两个词的条件概率,我们就可以得出哪种分词更合理。

在互联网领域,凡是遇到“当出现xyz时应该推荐什么”这样的条件概率时,也总是能应用贝叶斯理论。

例如,我们在搜索引擎中输入elon这个单词后,搜索框自动给出了联想补全:

elon

怎么实现这个功能?把用户最近搜索的所有可能的单词列出来,然后计算条件概率:

  • P(mask|elon)=0.5
  • P(jerk|elon)=0.1
  • P(university|elon)=0.2

把它们排个序,选出条件概率最大的几个,就是搜索建议。

诸如反垃圾邮件、电商推荐系统等,都是贝叶斯理论在机器学习中的应用。由于需要大量的计算,贝叶斯理论也只有在计算机时代才能广泛应用。

关于信念

我们再回顾一下贝叶斯定理:

稍微改一下,变为:

P(H)是先验概率,P(H|E)是后验概率,P(E|H)/P(E)被称为调整因子,先验概率乘以调整因子就得到后验概率。

我们发现,如果P(H)=0,则P(H|E)=0;如果P(H)=1,则P(E|H)=P(E),P(H|E)=1。

也就是说,如果先验概率为0%或100%,那么,无论出现任何证据E,都无法改变后验概率P(H|E)。这对我们看待世界的认知有重大指导意义,因为贝叶斯概率的本质是信念,通过一次次事件,我们可能加强某种信念,也可能减弱某种信念,但如果信念保持100%或0%,则可以做到对外界输入完全“免疫”。

举个例子,十年前许多人都认为比特币是庞氏骗局,如果100%坚定地持有这种信念,那么他将无视用户越来越多、价格上涨、交易量扩大、机构入市等诸多证据,至今仍然会坚信比特币是骗局而错过无数次机会。(注:此处示例不构成任何投资建议)

对于新生事物,每个人都可以有非常主观的先验概率,但只要我们不把先验概率定死为0或100%,就有机会改变自己的信念,从而更有可能接近客观事实,这也是贝叶斯定理的精髓:

你相信什么并不重要,重要的是你别完全相信它。

留言與分享

托马斯·贝叶斯(Thomas Bayes)是18世纪的英国数学家,也是一位虔诚的牧师。据说他为了反驳对上帝的质疑而推导出贝叶斯定理。贝叶斯定理是一个由结果倒推原因的概率算法,在贝叶斯提出这个条件概率公式后,很长一段时间,大家并没有觉得它有什么作用,并一直受到主流统计学派的排斥。直到计算机诞生后,人们发现,贝叶斯定理可以广泛应用在数据分析、模式识别、统计决策,以及最火的人工智能中,结果,贝叶斯定理是如此有用,以至于不仅应用在计算机上,还广泛应用在经济学、心理学、博弈论等各种领域,可以说,掌握并应用贝叶斯定理,是每个人必备的技能。

这里推荐两个视频,深入浅出地解释了贝叶斯定理:

Bayes’ Theorem 贝叶斯定理

Bayes theorem, the geometry of changing beliefs

如果你不想花太多时间看视频,可以继续阅读,我把视频内容编译成文字,以便快速学习贝叶斯定理。

为了搞明白贝叶斯定理究竟要解决什么问题,我们先看一个现实生活的例子:

已知有一种疾病,发病率是0.1%。针对这种疾病的测试非常准确:

  • 如果有病,则准确率是99%(即有1%未检出阳性);
  • 如果没有病,则误报率是2%(即有2%误报为阳性)。

现在,如果一个人测试显示阳性,请问他患病的概率是多少?

如果我们从大街上随便找一个人,那么他患病的概率就是0.1%,因为这个概率是基于历史统计数据的先验概率。

现在,他做了一次测试,结果为阳性,我们要计算他患病的概率,就是计算条件概率,即:在测试为阳性这一条件下,患病的概率是多少。

从直觉上这个人患病的概率大于0.1%,但也肯定小于99%。究竟是多少,怎么计算,我们先放一放。

为了理解条件概率,我们换一个更简单的例子:掷两次骰子,一共可能出现的结果有6x6=36种:

sample space

这就是所谓的样本空间,每个样本的概率均为1/36,这个很好理解。

如果我们定义事件A为:至少有一个骰子是2,那么事件A的样本空间如下图红色部分所示:

Event A

事件A一共有11种情况,我们计算事件A的概率P(A):

P(A)

我们再定义事件B:两个骰子之和为7,那么事件B的样本空间如下图绿色部分所示:

Event B

事件B一共有6种情况,我们计算事件B的概率P(B):

P(B)

接下来我们用P(A∩B)表示A和B同时发生的概率,A∩B就是A和B的交集,如下图蓝色部分所示:

P(A∩B)

显然A∩B只有两种情况,因此,计算P(A∩B):

P(A∩B)

接下来我们就可以讨论条件概率了。我们用P(A|B)表示在B发生的条件下,A发生的概率。由于B已经发生,所以,样本空间就是B的样本数量6,而要发生A则只能是A、B同时发生,即A∩B,有两种情况。

因此,计算P(A|B)如下:

P(A|B)

同理,我们用P(B|A)表示在A发生的条件下,B发生的概率。此时,分子仍然是A∩B的样本数量,但分母变成A的样本数量:

P(B|A)

可见,条件概率P(A|B)和P(B|A)是不同的。

我们再回到A、B同时发生的概率,观察P(A∩B)可以改写为:

P(B|A)xP(A)

同理,P(A∩B)还可以改写为:

P(A|B)xP(B)

因此,根据上述两个等式,我们推导出下面的等式:

把左边的P(A∩B)去掉,我们得到等式:

最后,整理一下等式,我们推导出贝叶斯定理如下:

这就是著名的贝叶斯定理,它表示,当出现B时,如何计算A的概率。

很多时候,我们把A改写为H,把B改写为E

H表示Hypothesis(假设),E表示Evidence(证据),贝叶斯定理的意义就在于,给定一个先验概率P(H),在出现了证据E的情况下,计算后验概率P(H|E)。

计算

有了贝叶斯定理,我们就可以回到开头的问题:

已知有一种疾病,发病率是0.1%。针对这种疾病的测试非常准确:

  • 如果有病,则准确率是99%(即有1%未检出阳性);
  • 如果没有病,则误报率是2%(即有2%误报为阳性)。

现在,如果一个人测试显示阳性,请问他患病的概率是多少?

用H表示患病,E表示测试为阳性,那么,我们要计算在测试为阳性的条件下,一个人患病的概率,就是计算P(H|E)。根据贝叶斯定理,计算如下:

P(H)表示患病的概率,根据发病率可知,P(H)=0.1%;

P(E|H)表示在患病的情况下,测试为阳性的概率,根据“如果有病,则准确率是99%”可知,P(E|H)=99%;

P(E)表示测试为阳性的概率。这个概率就稍微复杂点,因为它是指对所有人(包含病人和健康人)进行测试,结果阳性的概率。

我们可以把检测人数放大,例如放大到10万人,对10万人进行检测,根据发病率可知:

  • 有100人是病人,另外99900是健康人;
  • 对100个病人进行测试,有99人显示阳性,另有1人未检出(阴性);
  • 对99900个健康人进行测试,有2%=1998人显示阳性(误报),另有98%=97902人为阴性。

下图显示了检测为阳性的结果的分布:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
           ┌───────┐
│100000 │
└───────┘

┌───────┴───────┐
▼ ▼
┌───────┐ ┌───────┐
│ 100 │ │ 99900 │
└───────┘ └───────┘
│ │
┌───┴───┐ ┌───┴───┐
▼ ▼ ▼ ▼
┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐
│ 99 │ │ 1 │ │1998 │ │97902│
└─────┘ └─────┘ └─────┘ └─────┘
│ │
▼ ▼
+ +

所以,对于10万人的样本空间来说,事件E=显示阳性的概率为(99+1998)/100000=2.097%。

带入贝叶斯定理,计算P(H|E):

计算结果为患病的概率为4.721%,这个概率远小于99%,且与大多数人的直觉不同,原因在于庞大的健康人群导致的误报数量远多于病人,当出现“检测阳性”的证据时,患病的概率从先验概率0.1%提升到4.721%,还远不足以确诊。

贝叶斯定理的另一种表示

在上述计算中,我们发现计算P(E)是比较困难的,很多时候,甚至无法知道P(E)。此时,我们需要贝叶斯定理的另一种表示形式。

我们用P(H)表示H发生的概率,用H表示H不发生,P(H)表示H不发生的概率。显然P(H)=1-P(H)。

下图红色部分表示H,红色部分以外则表示H:

P(H)

事件E用绿色表示:

P(E)

可见,P(E)可以分为两部分,一部分是E和H的交集,另一部分是E和H的交集:

根据上文的公式P(A∩B)=P(A|B)xP(B),代入可得:

把P(E)替换掉,我们得到贝叶斯定理的另一种写法:

用这个公式来计算,我们就不必计算P(E)了。再次回到开头的问题:

已知有一种疾病,发病率是0.1%。针对这种疾病的测试非常准确:

  • 如果有病,则准确率是99%(即有1%未检出阳性);
  • 如果没有病,则误报率是2%(即有2%误报为阳性)。

现在,如果一个人测试显示阳性,请问他患病的概率是多少?

  • P(E|H)表示患病时检测阳性的概率=99%;
  • P(H)表示患病的概率=0.1%;
  • P(E|H)表示没有患病但检测阳性的概率=2%;
  • P(H)表示没有患病的概率=1-P(H)=99.9%。

代入公式,计算:

检测为阳性这一证据使得患病的概率从0.1%提升到4.721%。假设这个人又做了一次检测,结果仍然是阳性,那么他患病的概率是多少?

我们仍然使用贝叶斯定理计算,只不过现在先验概率P(H)不再是0.1%,而是4.721%,P(E|H)和P(E|H)仍保持不变,计算新的P(H|E):

结果为71%,两次检测为阳性的结果使得先验概率从0.1%提升到4.721%再提升到71%,继续第三次检测如果为阳性则概率将提升至99.18%。

可见,贝叶斯定理的核心思想就是不断根据新的证据,将先验概率调整为后验概率,使之更接近客观事实。

留言與分享

概率2-连续型随机分布律

分類 基础, 数学
1,均匀分布

若连续型随机变量X具有概率密度

\begin{align*} f(x)= \begin{cases}{1 \over {b-a}} ,a < x < b,\\0\end{cases} \end{align*}

则称X在区间(a,b)上服从均匀分布,记为X〜U(a,b)

分布函数:

\begin{align*} F(x)= \begin{cases} 0, & x < a \\ \frac{x-a}{b-a}, & a \leq x < b \\ 1, & x \geq b \end{cases} \end{align*}

2. 指数分布

若连续型随机变量X具有概率密度:

\begin{align*} f(x)= \begin{cases} \frac{1}{\theta} e^{-x/\theta}, & x > 0 \\ 0, & \text{其他} \end{cases} \end{align*}

其中θ>0为常数,则称X服从参数为θ的指数分布。

易知f(x)≥0,且:

\begin{align*} \int^\infty_{-\infty}f(x)dx = \left[-e^{-x/\theta}\right]^\infty_0 = 1 \end{align*}

分布函数:

\begin{align*} F(x)= \begin{cases} 1-e^{-x/\theta}, & x > 0 \\ 0, & \text{其他} \end{cases} \end{align*}

服从指数分布的随机变量X具有无记忆性:
对于任意s,t>0,有

P{X>s+tX>s}=P(X>t)P\{X>s+t|X>s\} = P(X>t)

证明:

\begin{align*} P\{X>s+t|X>s\} &= \frac{P\{X>s+t\} \cap P\{X>s\}}{P\{X>s\}} \\ &= \frac{P\{X>s+t\}}{P\{X>s\}} \\ &= \frac{1-F(s+t)}{1-F(s)} \\ &= \frac{e^{-(s+t)/\theta}}{e^{-s/\theta}} \\ &= e^{-t/\theta} \\ &= P\{X>t\} \end{align*}

3. 正态分布

若连续型随机变量X具有概率密度:

\begin{align*} f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \end{align*}

其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布,记为X~N(μ,σ²)。

显然f(x)≥0,下面证明:

\begin{align*} \int^\infty_{-\infty}f(x)dx = 1 \end{align*}

t=xμσt = \frac{x-\mu}{\sigma},则:

\begin{align*} σ=(x-μ)/t, t'(x)=1/σ \end{align*}

得到:

\begin{align*} \int^\infty_{-\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx &=\int^\infty_{-\infty}{1 \over {\sqrt{2 \pi}}(x-μ)/t}e^{-t^2 \over 2}dt \\ &= \frac{1}{\sqrt{2\pi}}\int^\infty_{-\infty}e^{-\frac{t^2}{2}}dt \end{align*}

记:

\begin{align*} I = \int^\infty_{-\infty}e^{-\frac{t^2}{2}}dt \end{align*}

则有:

\begin{align*} I^2 = \int^\infty_{-\infty}\int^\infty_{-\infty}e^{-\frac{t^2+u^2}{2}}dtdu \end{align*}

利用极坐标变换:

\begin{align*} I^2 = \int^{2\pi}_0\int^\infty_0 re^{-\frac{r^2}{2}}drd\theta = 2\pi \end{align*}

(p55)


附:

计算:

\begin{align*} \iint_D^\infty e^{-\frac{x^2+y^2}{2}}dxdy \end{align*}

留言與分享

概率1-离散型随机分布律

分類 基础, 数学
1.不放回抽样表达式:

a件产品中抽取n件(不放回),则可能的取法有

\begin{align*} \left( \begin{matrix} a\\ n \\ \end{matrix} \right) =C^n_a=A^n_a/n!= { {a(a-1)...(a-n+1)} \over n!} ={a! \over n!(a-n)!} \end{align*}
伯努利试验,二项分布

设试验E只有两种可能结果:A及非A,则称E为伯努利试验,设P(A)=p (0<p<1),此时P(非A)=1-p.将E独立重复地进行N次,则称这一串重复的独立试验为n重伯努利试验。

标记为
X〜b(n,p).

\begin{align*} P\{X = k\}=\left( \begin{matrix} n\\ k \\ \end{matrix} \right) p^k q^{n-k} \end{align*}

当n=1时,化为二项分布:

\begin{align*} P\{X = k\}= p^k q^{1-k} \end{align*} \begin{align*} \sum_{k=0}^n P\{X = k\}=\sum_{k=0}^n {\left( \begin{matrix} n\\ k \\ \end{matrix} \right) } p^k q^{n-k} =(p+q)^n=1 \end{align*}
泊松分布

设随机变量X所有可能取的值为0,1,2,…,2而取各个值的概率为

\begin{align*} P\{X=k\}={λ^ke^{-λ} \over {k!}} ,k=0,1,2,..., \end{align*}

其中λ>0是常数.则称X服从参数为λ的泊松分布,记为X〜π(λ).

易知,P{X=k}≥0,k=0,1,2,…,且有

\begin{align*} \sum_{k=0}^\infty P\{X = k\}=\sum_{k=0}^\infty {λ^ke^{-λ} \over {k!}}=e^{-λ}\sum_{k=0}^\infty {λ^k\over {k!}}=e^{-λ}e^λ=1 \end{align*}

倒数第二步是泰勒级数(见附表)

泊松定理 设λ>0是一个常数,n是任意正整数,设np=λ,则对于任一固定的非负整数k,有

\begin{align*} \lim_{n \to \infty} \binom{n}{k} p_n^k (1-p_n)^{n-k} = \frac{\color{red}\lambda^k \color{purple}e^{-\lambda}}{\color{red}k!}. \end{align*}

\begin{align*} p_n= {λ \over n} \end{align*}

,有

\begin{align*} {\left( \begin{matrix} n\\ k \\ \end{matrix} \right)}p^k_n(1-p_n)^{n-k}&={\color{blue}{n(n-1)(n-2)...(n-k+1)} \over {\color{red}k!}}{({\color{red}{λ} \over \color{blue}n})^k}{(1-{λ \over n})^{n-k}} \\ &={\color{red}{λ^k \over k!}}{[\color{blue}1 \cdot ({1-{1 \over n})}\cdot ({1-{2 \over n})...(1-{(k+1) \over n})}}]{\color{purple}(1-{λ \over n})^{n}}{(1-{λ \over n})^{-k}} \end{align*}

对于任意固定的k,当n→∞,

\begin{align*} \lim_{n \to \infty}[1 \cdot ({1-{1 \over n})}\cdot ({1-{2 \over n})...(1-{(k+1) \over n})}]=1, \\ \lim_{n \to \infty}(1-{λ \over n})^{n}={\color{purple}e^{-λ}}, \\ \lim_{n \to \infty}(1-{λ \over n})^{-k}=1 \end{align*}

Q.E.D.


泰勒中值定理 如果函数f(x)在含有x₀的某个开区间(a,b)内具有直到(n+1)阶的导数,则对任一x∈(a,b),有

\begin{align*} f(x)=f(x_0)+f'(x_0)(x-x_0)+{f''(x_0) \over 2!}(x-x_0)^2+...+{f^{(n)}(x_0) \over n!}(x-x_0)^n+R_n(x), \end{align*}

其中

\begin{align*} R_n(x)={f^{(n+1)}(\xi) \over ({n+1})!} (x-x_0)^{n+1} \end{align*}

\begin{align*} &x_0=0,f(λ)=e^λ \\ &f(λ)=e^λ \\ &= e^0+{(e^0)(λ-0) \over {1!}}+{(e^0)(λ-0)^2 \over {2!}}+{(e^0)(λ-0)^3 \over {3!}}+...+{(e^0)(λ-0)^k \over {k!}} \\ &= \sum_{k=0}^\infty {λ^k\over {k!}} \end{align*}

留言與分享

11.偏导数(拉普拉斯方程)

分類 基础, 数学

拉普拉斯方程:
验证函数

\begin{align*} z=ln \sqrt{x^2+y^2} \end{align*}

满足方程

\begin{align*} {\partial^2{z} \over \partial{x^2}}+{\partial^2{z} \over \partial{y^2}}=0 \end{align*}

证:因为

\begin{align*} z=ln \sqrt{x^2+y^2} =1/2 ln(x^2+y^2) \end{align*}

所以

\begin{align*} {\partial{z} \over \partial{x}}={x \over(x^2+y^2)} \end{align*} \begin{align*} {\partial^2{z} \over \partial{x^2}}={(x^2+y^2)-2x \cdot x \over(x^2+y^2)^2}={y^2-x^2 \over(x^2+y^2)^2} \end{align*} \begin{align*} {\partial{z} \over \partial{y}}={y \over(x^2+y^2)} \end{align*} \begin{align*} {\partial^2{z} \over \partial{y^2}}={(x^2+y^2)-2y \cdot y \over(x^2+y^2)^2}={x^2-y^2 \over(x^2+y^2)^2} \end{align*}

Q.E.D.


验证函数

\begin{align*} u={1 \over r} \end{align*}

满足方程

\begin{align*} {\partial^2{u} \over \partial{x^2}}+{\partial^2{u} \over \partial{y^2}}+{\partial^2{u} \over \partial{z^2}}=0 \end{align*}

其中

\begin{align*} r =\sqrt{x^2+y^2+z^2} \end{align*}

证:

\begin{align*} {\partial{u} \over \partial{x}}={-1 \over r^2} \cdot {1 \over {2r}} \cdot 2x=-{x \over r^3} \end{align*} \begin{align*} {\partial^2{u} \over \partial{x^2}}=-{1 \over r^3}+ {3 \over r^4}x \cdot {1 \over {2r}} \cdot 2x=-{1 \over r^3}+{3x^2 \over r^5} \end{align*}

同理

\begin{align*} {\partial^2{u} \over \partial{y^2}}=-{1 \over r^3}+ {3 \over r^4}y \cdot {1 \over {2r}} \cdot 2y=-{1 \over r^3}+{3y^2 \over r^5} \end{align*} \begin{align*} {\partial^2{u} \over \partial{z^2}}=-{1 \over r^3}+ {3 \over r^4}z \cdot {1 \over {2r}} \cdot 2z=-{1 \over r^3}+{3z^2 \over r^5} \end{align*}

于是

\begin{align*} {\partial^2{u} \over \partial{x^2}}+{\partial^2{u} \over \partial{y^2}}+{\partial^2{u} \over \partial{z^2}}={-3 \over r^3}+{(3x^2+3y^2+3z^2) \over r^5}=0 \end{align*}

留言與分享

10.向量基本概念

分類 基础, 数学

一,向量的线性运算


1,向量的加减法

(1)交换律 a+b=B+a;

(2)结合律 (a+b)+c=a+(b+c);


2,向量与数的乘法

(1)结合律

\begin{align*} \lambda (\mu \vec{a}) =\lambda (\mu \vec{a})= (\lambda \mu) \vec{a} \end{align*}

(2)分配律

\begin{align*} (\lambda + \mu)\vec{a} =\lambda \vec{a} + \mu \vec{a} \\ \lambda (\vec{a}+\vec{b}) =\lambda \vec{a} + \lambda \vec{b} \end{align*}

定理1 设向量a ≠ 0,那么,向量b平行于a的充分必要条件是:存在唯一的实数λ,使b=λa


向量的模,方向角,投影

向量模的坐标式

\begin{align*} |\vec{AB}|=\sqrt{x^2+y^2+z^2} \end{align*}

A,B两点间距离就是向量AB的模。

\begin{align*} |\vec{AB}|=\sqrt{(x_1-x_2)^2+(y_1-y_2)^2+(z_1-z_2)^2} \end{align*}

方向角和方向余弦

设有两个非零向量a,b,任取空间一点O,
(P298)

留言與分享

9.Γ函数(gamma函数)

分類 基础, 数学

Γ函数:

\begin{align*} \Gamma (s)= \int_0^{+ \infty} e^{-x} x^{(s-1)}dx \ .(s>0) \end{align*}

分别讨论以下两个积分:

\begin{align*} I_1= \int_0^1 e^{-x} x^{(s-1)}dx \ .(s>0) \end{align*} \begin{align*} I_2= \int_1^{+ \infty} e^{-x} x^{(s-1)}dx \ .(s>0) \end{align*}

当s≥1时,I1I_1 是定积分(s看作定值),当0<s<1时,因为

\begin{align*} e^{-x} \cdot x^{s-1} ={1 \over x^{1-s}} \cdot {1 \over e^x} < {1 \over x^{1-s}} \end{align*}

根据比较审敛法2,反常积分I1I_1收敛。

再讨论I2I_2,因为

\begin{align*} \lim_{x \to + \infty} x^2 \cdot (e^{-x}x^{s-1})= \lim_{x \to + \infty} {x^{s+1} \over e^x}=0 \end{align*}

根据比较审敛法1,反常积分I2I_2收敛。
(最后一步洛必达法则)


Γ函数四个性质:

1.递推公式

\begin{align*} \Gamma (s+1) = s \Gamma (s) (s>0) \end{align*}

证: 应用分部积分法,有

\begin{align*} \Gamma (s+1) &= \int_0^{+ \infty} e^{-x} x^s dx \\ &= - \int_0^{+ \infty} x^s de^{-x} \\ &= -([x^se^{-x}]_0^{+ \infty } -s \int_0^{+ \infty} e^{-x}x^{s-1}dx ) \\ &= 0 + s \int_0^{+ \infty} e^{-x}x^{s-1}dx \\ &= s \Gamma (s) \end{align*}

其中

\begin{align*} \lim_{x \to + \infty } x^se^{-x} =0 \end{align*}

可由洛必达法则求得。
显然:

\begin{align*} \Gamma (1) &=\int_0^{+ \infty} e^{-x}x^{s-1}dx \\ &=\int_0^{+ \infty} e^{-x}dx \\ &=[-e^{-x}]^{+ \infty}_0 \\ &=0-(-1) \\ &=1 \end{align*}

反复运用递推公式有:
对于任意的正整数

\begin{align*} \Gamma (n+1)=n! \end{align*}

所以Gamma函数可以看作阶乘的推广

2.当

\begin{align*} s \to 0^+ \end{align*}

时,

\begin{align*} \Gamma (s) ={\Gamma (s+1) \over s},\Gamma (1)=1 \end{align*}

,所以当

\begin{align*} s \to 0^+,\Gamma (s) \to + {\infty} \end{align*}

Γ(s)Γ(s1)=πsinπs (0<s<1)\begin{aligned} \Gamma (s) \Gamma (s-1) ={\pi \over sin \pi s} \ (0<s<1) \end{aligned}

4.在

\begin{align*} \Gamma (s) = \int_0^{+ \infty} e^{-x} x^{(s-1)}dx \end{align*}

作代换

\begin{align*} x=u^2 \end{align*}

,

\begin{align*} \Gamma (s) = \int_0^{+ \infty} e^{-u^2} u^{2(s-1)}2udu = 2 \int_0^{+ \infty} e^{-u^2} u^{2s-1}du \end{align*}

再令2s-1=t有:

\begin{align*} \int_0^{+ \infty} e^{-u^2} u^{2s-1}du = \int_0^{+ \infty} e^{-u^2} u^tdu =\Gamma ({t+1 \over 2}) . (t>-1) \end{align*}

上式
令t=0,则s=1/2,得

\begin{align*} 2 \int_0^{+ \infty} e^{-u^2}du =\Gamma({1 \over 2})=\sqrt{\pi} \end{align*}

以上即为高斯积分

留言與分享

8.反常积分

分類 基础, 数学
反常积分

定义1 设函数f(x)在区间[a,+\infty)上连续,取t>a,如果极限

\begin{align*} \lim_{t \to +\infty} \int_a^tf(x)dx \end{align*}

存在,则称此极限为函数f(x)在无穷区间[a,+\infty)上的反常积分,记作

\begin{align*} \int_a^{+\infty}f(x)dx \end{align*}

此时称反常积分收敛。
-无穷大同理,两个无穷大都收敛,则称无穷限的反常积分。

例: 计算反常积分

\begin{align*} \int_0^{+\infty}te^{-pt}dt \end{align*}

(p是常数,p>0)

解:

\begin{align*} \int_0^{+\infty}te^{-pt}dt &= [\int te^{-pt}dt]_0^{+\infty} \\ &= [-1/p\int tde^{e^{-pt}}]_0^{+\infty} \\ &= [-1/p(te^{-pt}-\int e^{-pt}dt)]^{+\infty}_0 \\ &= [-1/p(te^{-pt}+1/pe^{-pt})]_0^{+\infty} \\ &= [-1/pte^{-pt}]_0^{+\infty}-[1/p^2e^{-pt}]_0^{+\infty} \\ &= -1/p \lim_{t \to +\infty}te^{-pt}-0-1/p^2(\lim_{t \to +\infty} e^{-pt}-1) \\ &=1/p^2 \end{align*}
\begin{align*} &\because de^{-pt}/dt=-pe^{-pt} \\ &\therefore dt= {de^{-pt} \over {-pe^{-pt}}}, e^{-pt}dt = {de^{-pt} \over {-p}} \end{align*} \begin{align*} (uv)'=u'v+v'u \end{align*}

定义2 设函数f(x)在区间(a,b]上连续,点a为f(x)的瑕点,取t>a,如果极限

\begin{align*} \lim_{t \to a^+} \int_t^bf(x)dx \end{align*}

存在,则称此极限为函数f(x)在无穷区间(a,b]上的反常积分,记作

\begin{align*} \int_a^bf(x)dx \end{align*}

此时称反常积分收敛。-a同理。


反常积分的审敛法

定理1 设函数f(x)在区间[a,+\infty)上连续,且f(x)≥0,若函数

\begin{align*} F(x)=\int_a^xf(t)dt \end{align*}

在[a,+\infty]上有界,则反常积分

\begin{align*} \int_a^{+\infty} f(t)dt \end{align*}

收敛


定理2(比较审敛原理) 设函数f(x),g(x)在区间[a,+\infty)上连续,如果0≤f(x)≤g(x)(a≤x≤+\infty),并且

\begin{align*} \int_a^{+\infty} g(x)dx \end{align*}

收敛,则

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

也收敛;如果0≤g(x)≤f(x)(a≤x≤+\infty),并且

\begin{align*} \int_a^{+\infty} g(x)dx \end{align*}

发散,则

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

也发散.


定理3(比较审敛法1) 设函数f(x)在区间[a,+\infty)上连续,且f(x)≥0,如果存在常数M>0及p>1,使得

\begin{align*} f(x) \le {M \over x^p} (a \le x< + \infty ) \end{align*}

则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

收敛;如果存在常数N>0,使得

f(x)Nx(ax<+)\begin{aligned} f(x) \ge {N \over x} (a \le x< + \infty ) \end{aligned}

则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

发散.


定理4(极限审敛法1) 设函数f(x)在区间[a,+\infty)上连续,且f(x)≥0,如果存在常数p>1,使得

\begin{align*} \lim_{x \to + \infty }x^pf(x) \end{align*}

存在,则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

收敛;如果

\begin{align*} \lim_{x \to + \infty }xf(x)=d>0 \end{align*}

\begin{align*} \lim_{x \to + \infty }xf(x)=+ \infty \end{align*}

,则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

发散


定理5 设函数f(x)在区间[a,+\infty)上连续,如果反常积分

\begin{align*} \int_a^{+\infty} |f(x)|dx \end{align*}

收敛,则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

收敛.


定理6(比较审敛法2) 设函数f(x)在区间(a,b]上连续,且f(x)≥0,x=a为f(x)的瑕玷.如果存在常数M>0及q<1,使得

\begin{align*} \int_a^{+\infty} f(x)dx \le {M \over (x-a)^q} (a < x \le b), \end{align*}

则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

收敛.

如果存在常数N>0,使得

\begin{align*} \int_a^{+\infty} f(x)dx \ge {N \over (x-a)} (a < x \le b), \end{align*}

则反常积分

\begin{align*} \int_a^{+\infty} f(x)dx \end{align*}

发散.


定理7(极限审敛法2) 设函数f(x)在区间(a,b]上连续,且f(x)≥0,x=a为f(x)的瑕点如果存在常数0<q<1,使得

\begin{align*} \lim_{x \to a^+ }(x - a )^qf(x) \end{align*}

存在,则反常积分

\begin{align*} \int_a^b f(x)dx \end{align*}

收敛;如果

\begin{align*} \lim_{x \to + a^+ }(x-a)f(x)=d>0 \end{align*}

\begin{align*} \lim_{x \to + a^+ }(x-a)f(x)=+ \infty \end{align*}

,则反常积分

\begin{align*} \int_a^b f(x)dx \end{align*}

发散

留言與分享

7.定积分

分類 基础, 数学

定义 设函数f(x)在[a,b]上有界,在[a,b]中任意插入若干个分点

\begin{align*} a={x_0}<{x_1}<{x_2}<...<{x_{n-1}}<{x_n}=b \end{align*}

把区间[a,b]分成n个小区间

\begin{align*} [x_0,x_1],[x_1,x_2],...,[x_{n-1},x_n], \end{align*}

各个小区间的长度依次为

\begin{align*} \Delta x_1 = x_1-x_0,\Delta x_2 = x_2-x_1,...,\Delta x_n = x_n-x_{n-1}, \end{align*}

在每个小区间

\begin{align*} [x_n,x_{n-1}], \end{align*}

上任取一点ξ(ξ∈[xi-1,xi],作函数f(ξ)与小区间长度Δxi的乘积f(ξ)Δxi(i),并作出和

\begin{align*} S= \sum_{i=1}f(\xi_i) \Delta x_i \end{align*}
定积分基本性质

(1)当a=b时,

\begin{align*} \int^b_a f(x)dx=0 \end{align*}

(2)当a>b时,

\begin{align*} \int^b_a f(x)dx= - \int^a_b f(x)dx \end{align*}

性质1

\begin{align*} \int^b_a [f(x) \pm g(x)]dx = \int^b_a f(x) \pm \int^b_a g(x)dx \end{align*}

性质2

\begin{align*} \int^b_a kf(x)dx = k \int^b_a f(x)dx \end{align*}

性质3

设a<c<b,则

\begin{align*} \int^b_a f(x)dx = \int^c_a f(x)dx + \int^b_c f(x)dx \end{align*}

性质4

如果在区间[a,b]上f(x)≡1,则

\begin{align*} \int^b_a 1dx = \int^b_a dx=b-a \end{align*}

性质5

如果在区间[a,b]上f(x)≥0,则

\begin{align*} \int^b_a f(x)dx \ge 0 (a < b) \end{align*}
积分上限函数及其导数

设函数f(t)在区间[a,b]上连续,并且设x为[a,b]上的一点。在[a,b]定义一个函数,记作

\begin{align*} \Phi (x)= \int^x_a f(t)dt (a \le x \le b ) \end{align*}

定理1 如果函数f(x)在区间[a,b]上连续,则积分上限的函数

\begin{align*} \Phi (x)= \int^x_a f(t)dt \end{align*}

在[a,b]上可导,并且它的导数是

\begin{align*} \Phi' (x)={d \over dx} \int^x_a f(t)dt =f(x) (a \le x \le b ) \end{align*}

若x∈(a,b),设x获得增量Δx,其绝对值足够地小,使得x+Δx∈(a,b),
则Φ(x)在x+Δx∈处的函数值为

\begin{align*} \Phi (x+\Delta x)=\int^{x+\Delta x}_a f(t)dt \end{align*}

由此得函数的增量为

\begin{align*} \Phi (x+\Delta x)-\Phi (x) &= \int^{x+\Delta x}_a f(t)dt - \int^{x}_a f(t)dt \\ &= \int^x_a f(t)dt+\int^{x+\Delta x}_x f(t)dt - \int^{x}_a f(t)dt \\ &= \int^{x+\Delta x}_x f(t)dt \end{align*}

应用积分中值定理有等式
ΔΦ(x)=f(ξ)Δx
即:

\begin{align*} {ΔΦ(x) \over Δx}=f(ξ) \end{align*}

由于f(x)在[a,b]上连续,当Δx→0,ξ→x,因此

\begin{align*} \lim_{\Delta x\to 0}f(ξ)=f(x) \end{align*}

两端取极限即可。

定理2 如果函数f(x)在区间[a,b]上连续,则函数

\begin{align*} \Phi (x)= \int^x_a f(t)dt \end{align*}

就是f(x)在[a,b]上的一个原函数


牛顿-莱布尼茨公式

定理3 如果函数F(x)是连续函数f(x)在区间[a,b]上的一个原函数,则

\begin{align*} \int^b_a f(x)dx=F(b)-F(a). \ \ (1) \end{align*}

证 已知函数F(x)是连续函数f(x)的一个原函数,又根据定理2知道,积分上限函数

\begin{align*} \Phi (x)= \int^x_a f(t)dt \ \ (2) \end{align*}

也是f(x)的一个原函数.于是这两个原函数之差F(x)-Φ(x)在[a,b]上必定是一个常数C,即

F(x)-Φ(x)=C (a≤x≤b) (3)

令x=a.得F(a)-Φ(a)=C,由定理2,得Φ(a)=0,因此F(a)=C,代入式(1),F(a)代入式(3)得

\begin{align*} F(x)- \int^x_a f(t)dt =F(a) \\ \therefore \int^x_a f(t)dt =F(x)-F(a) \end{align*}

将x=b代入,即式(1)

也记为

\begin{align*} \therefore \int^b_a f(x)dx =[F(x)]_a^b \end{align*}

留言與分享

6.不定积分

分類 基础, 数学
基本积分表
\begin{align*} 1. &\int kdx = kx +C \\ 2. &\int x^n dx = {x^{n+1} \over {\mu +1}} +C \ (\mu \neq -1) \\ 3. &\int {dx \over x} = ln|x| +C \\ 4. &\int {dx \over {1+x^2}} = arctan x +C \\ 5. &\int {dx \over \sqrt {1+x^2}} = arcsin x +C \\ 6. &\int cosx \ dx = sin \ x + C \\ 7. &\int sinx \ dx = -cos \ x +C \\ 8. &\int {dx \over cos^2 x} = \int sec^2 x dx=tan x + C \\ 9. &\int {dx \over sin^2 x} = \int sec^2 x dx=-cot x + C \\ 10. &\int sec x \ tanx \ dx = sec x + C \\ 11. &\int csc x \ cot x \ dx = -csc x +C \\ 12. &\int e^x dx =e^x + C \\ 13. &\int a^x dx = {a^x \over ln \ a} + C \\ 14. &\int sh \ x \ dx = ch \ x + C \\ 15. &\int ch \ x \ dx = sh \ x + C \end{align*}
不定积分的性质:

性质1 设函数 f(x)及g(x)的原函数存在,则

\begin{align*} \int [f(x)+g(x)]dx = \int f(x)dx + \int g(x)dx \end{align*}

性质2 设函数 f(x)及g(x)的原函数存在,则

\begin{align*} \int kf(x)dx = k \int f(x)dx \end{align*}
换元积分法

1,第一类换元积分法

定理1 设f(u)具有原函数,u=ψ(x)可导,则有换元公式

\begin{align*} \int f[ \psi(x)]\psi '(x)dx =[\int f(u)du]_{u=\psi(x)} \end{align*}

2,第二类换元积分法

定理2 设x=ψ(t) 是单调的,可导的函数,并且ψ’(t)≠0.又设f[ψ(t)]ψ’(t)具有原函数,则有换元公式

\begin{align*} \int f(x)dx = [ \int f[ \psi (t)] \psi ' (t)dt]_{t=\psi ^{-1} (x)} \end{align*}

其中

\begin{align*} \psi ^{-1} (x) \end{align*}

是x=ψ(t)的反函数.

设f[ψ(t)]ψ’(t)的原函数为Ψ(t),记

\begin{align*} Ψ[ψ^{-1}(x)] = F(x) \end{align*}

,利用复合函数及反函数的求导法则,得到

\begin{align*} F'(x) = {\color{red}{d \Psi \over dt}} \cdot {\color{blue}{dt \over dx}} = {\color{red}f[ \psi(t) ] \psi'(t)} \cdot {\color{blue}{1 \over \psi'(t)}} = f[\psi (t)]=f(x) \end{align*}
分部积分法
\begin{align*} \int u dv = uv - \int v du \end{align*}

留言與分享

作者的圖片

Kein Chan

這是獨立全棧工程師Kein Chan的技術博客
分享一些技術教程,命令備忘(cheat-sheet)等


全棧工程師
資深技術顧問
數據科學家
Hit廣島觀光大使


Tokyo/Macau