一切的讨论的前提是弄明白什么是“大数定律(law of large numbers)”。大数定律是数学领域概率论分之里的一系列定理,包括强大数定律(strong law of large numbers),弱大数定律(weak law of large numbers),以及一致大数定律(uniform law of large numbers),等等。我们通常说的大数定律一般指的是“强大数定律”,它是一个由伟大的前苏联数学家,概率论先驱,科尔莫哥洛夫(Kolmogorov)首先给出严密证明的数学定理,又称“科尔莫哥洛夫强大数定律”。

在我们讨论该定律的技术细节之前,有必要要弄明白什么是“数学定理”。简单的说,一个数学定理包含一个假设前提A以及结论B,并断言由A通过逻辑(矛盾律,排中律)一定可以推导出B。下面是几个简单的数学定理的例子:

定理1(等腰三角形): 如果一个三角形两条边相等,那么这两条边所对的角也相等。

定理2(圆的面积): 一个半径为r的圆的面积为\pi r^2

一个和楼主问题相关的问题是,数学定理是必然的吗?如果你相信逻辑法则,那么数学定理是必然的(必然为真的),至少在数学上是的。如果一个三角形两条边相等,那么这两条边所对的角也一定相等;如果一个圆半径为r,那么它的面积一定是\pi r^2。然而微妙之处在于,数学的世界是一个高度抽象,高度理想化的晶莹剔透的世界,它和我们客观存在的物理世界不是一回事。在我们真实的物理世界里,不存在数学上完美的直线,完美的三角形,或者完美的圆。我们所能观察到的一切几何对象,从数学的角度上讲,都是粗造的:我们的世界里只可能存在是近似的直线,近似的三角形,以及近似的圆。因此,严格的说,一切数学定理的前提条件在真实的世界里都不可能完美的满足,因而数学定理断言的结论在真实的世界里也不可能完美的成立。

假设我用圆规在纸上画了一个半径10cm的圆,现问该圆的面积是多少。如果这是一道中学数学题,那么我们可以这样回答:应用定理2,我们可以算出该圆的面积为100 \pi cm^2。然而真实的情况是,我画的这个圆不会是个完美的圆,我用的纸张也不可能绝对的平整,因此如果用精密的仪器测量它的面积(假设“面积”这个概念仍然有意义),我们会发现测量的结果不精确等于100 \pi cm^2

这个例子想说明的道理无非是,尽管数学定理在数学上是必然为真的,然而由于在真实世界中不存在完美的符合数学定理要求的前提条件,因此我们也不可能完美的得到数学定理预言的结论。一切数学理论在真实的世界里的应用都只能是近似的。重要的是,近似仍然是有用的;因此数学理论是有意义的。

下面回到大数定律。强大数定律是这样陈述的(其它版本大数定律对应的条件和结论略有不同,然而所有大数定律直观意义都是相似的):

------------------ 强大数定律 ------------------

X_1,\ldots,X_n,\ldots是一列独立同分布且L1可积的随机变量。则当n趋近于无穷大时,样本均值

S_n=\frac{X_1 + \ldots + X_n}{n}

依概率1收敛于X1的数学期望。

------------------------------------------

定理的假设前提是所有的X1到Xn必须是独立同分布的随机变量,而且L1可积。关于“独立同分布”,相信大家懂一点概率统计的都能理解;而L1可积则指的是随机变量的绝对值的数学期望为一个有限的值。定理的结论“则当n趋近于无穷大时Sn依概率1收敛于X1的数学期望”则可以直观的理解为,当n非常大的时候,Sn有非常非常大的概率和X1的数学期望几乎相等。

大数定律在数学的世界里是必然的成立的。然而把大数定律应用到真实的世界里,情况当然有所不同,这主要缘于大数定律要求的前提在真实世界里不可能完美的满足。有时我们提供的条件离大数定律要求的前提差得很远(比如随机变量的数学期望非有限值,或者随机变量之间显著相关,或者非同分布),这时应用大数定律只能得出荒谬的结果;有时我们提供的条件离大数定律的前提非常接近,以至于我们认为其中差别可以忽略不计,这时大数定律所断言的结论对我们就是有意义的了。就以抛硬币为例:尽管硬币可能正反面不是完美的均匀,尽管每次抛硬币的行为(不管是用人还是用机器完成)并不可能做到真正的相互独立,尽管每做一次抛硬币试验之后硬币可能会有细微的磨损,尽管试验的环境如温度,空气的流动随着试验的进行可能有微小的变化,等等,但是我们可以有理由认为,大数定律的前提条件非常好的得到了满足:硬币是均匀的,每次抛硬币获得正面和反面的几率都是50%;抛硬币都是一个数学上的随机试验,且每次抛硬币的结果是独立同分布的随机变量。这时我们就可以相信大数定律的结论:假设把硬币正面记为1,反面记为0,把抛很多次硬币以后的结果加起来作平均,那么这个得到的平均值有很大几率几乎等于随机试验的数学期望0.5;这意味着我们总共能得到大约50%正面以及50%反面。

注意:大数定律并不排除“抛10000次硬币结果都是正面”这样的事件。它仍然有可能发生,只是发生的可能性微乎其微以至于没有多少现实意义罢了。

==========================================

下面是对问题的正面回答:

1,为什么实验次数越多,事件出现的频率将会趋近期望值?

数学证明目的就是告诉你“为什么”。

2,但我想问的是,为什么一定会“接近一个值”?

在满足大数定律的前提条件的情况下,样本均值不是“一定会”接近一个值,而只是“有非常大的可能性”会如此,这个可能性随着样本容量的增大而趋近于100%。数学家们发明了若干数学概念描述这样的状态,比如“依概率1收敛”等。

如果大数定律的前提条件没有得到完美的满足(比如在真实的世界里),那么样本均值可能不会趋近于任何一个固定的值。举一个栗子:考虑一个这个随机变量X,它取值为2^n的可能性为2^{-n},这里n为自然数(换言之,X有1/2的可能取值为2,有1/4的可能取值为4,有1/8的可能取值为8,以此类推)。容易看出这个随机变量X的数学期望是无穷大,因此不是L1可积的,它不满足强大数定律的前提条件。如果我们观察到一列独立同分布的X的实现,那么一定会发现样本均值Sn并不会随着n的增加而收敛到任何一个值。

下面两个图是matlab的模拟结果,图里横坐标表示样本大小,纵坐标表示样本均值。第一幅图里用的是服从0-1分布的Bernoulli随机变量,模拟掷硬币的试验。我们可以清楚的看到,当样本量增大时,样本均值趋近于0.5,符合大数定律的结论。第二幅图里用的服从Cauchy分布的随机变量,这个随机变量和上面例子中的随机变量类似,它的数学期望也是无穷大,因而不符合大数定律成立 的前提条件。此时大数定律无效:它的样本均值不会随着样本容量的增大而趋近于某个固定的值。

3,即“偶然中包含必然”这句话是否是必然的?

在大数定律前提条件满足的情形下,是必然的。

3,这是由这个世界本身的性质决定的吗?

一部分是由逻辑决定的(概率的数学理论),一部分是由世界本身的性质决定的(客观世界可以很好的满足大数定律的所需要的前提条件)。

来源:知乎 www.zhihu.com

作者:知乎用户(登录查看详情)

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 19 个回答,查看全部。
延伸阅读:
什么才算是真正的舆情系统?从舆情甄别、模型分析、舆情研判、舆情应对……舆情产品应该是怎样的呢

分享到