思维模型17 - Normal distribution | 正态分布

在不确定的世界里寻找确定性除了大数定律之外,另一个重要的思维模型就是正态分布。

思维模型17 - Normal distribution | 正态分布

在不确定的世界里寻找确定性除了大数定律之外,另一个重要的思维模型就是正态分布。生活中影响事物的因素可能太多太多,尽管这些事物的根本原因可能是未知的,但很多事物都近似的服从正态分布。

正态分布

正态分布又称高斯分布,是一个常见的连续概率分布,它的样子类似于寺庙里的大钟,因此人们又经常称之为钟形曲线。正态分布曲线的样子就像下图,说名字可能不清楚,但很多同学一看到图就恍然大悟,原来这就是正态分布啊。

正态分布

中心极限定理

正态分布在生活中非常常见,之所以叫正态分布,从名字就能看出来,正态是从英文 normal 翻译过来的,英文直译过来就是正常状态的分布或最常见的分布。那么究竟是什么原因导致正态分布如此常见呢?原因就是中心极限定理。它的概念为如果一个指标受到若干独立因素共同影响,且每个因素不能产生支配性的影响,不管每个因素本身是什么分布,它们叠加后影响的这个指标平均值就是正态分布。中心极限定理的三要素,影响因素独立,因素影响程度随机但无法支配,各个因素之间是相加的关系。直接说概念感觉有点抽象,这里用身高来举例说明,影响身高的原因有很多,可能是基因,后期的饮食,成长环境,日常活动等等,多到我们都不知道具体有多少,但是每个因素只能影响一部分(没有某个因素能直接决定身高),而身高就是它们这些因素叠加的结果。这种情况就符合中心极限定理的概念,最后实际情况也是与定理所表达的一致,如果对某个区域做身高的统计,结果就会近似的呈现正态分布。

身高统计

这里我们再拿骰子举例,一个均匀的六面骰子每个面出现的概率都是1/6,在图表的呈现就是一条直线,但如果两个或两个以上骰子点数的分布,就符合正态分布。比如我们拿三个骰子随机掷点,点数分布就是以9点为中心线的正态分布。在这里我们可以把每一个骰子都当作是一个影响因素,3个骰子共同影响最后的点数,但没有一个骰子能直接决定结果,随着我们试验次数的增多统计就会近似的呈现正态分布了。中心极限定理所需要条件与生活中经常能得到实现,这也是为什么生活中有非常多的事物统计分布都近似的符合正态分布。

不怎么顺利的发展史

正态分布的发展应并不顺利,这个概念最早是棣莫弗提出的,棣莫弗在1733年发表的论文中使用正态分布区估计大量抛掷硬币出现正面次数的分布,但当时并没有引起其他学者的注意。就这样在无人问津的状态下过了近一个世纪,1812年,一个叫拉普拉斯的数学家扩展了棣莫弗的理论,重新让正态分布又一次进入了大众的视野,但很可惜的是,这次的重发现也只是打了个水漂,还是没有多少人关注。就这样又过了近一个世纪直到十九世纪末,中心极限定理的重要性才被世人所知,如今中心极限定理和大数定律被认为是概率论中的首席定理。这时候我不禁想到,如果当时能够早一点发现动态分布的重要性,概率学的发展会不会更快更完善些,事情的发展总是伴随着不确定性,不管概率有多小,但是有价值的事物总会随着时间的前进终被世人所发现,这也是大数定理告诉我们的道理。

 皮耶-西蒙·拉普拉斯

启示

睁大眼睛好好看

前面也说了生活中很多事物都是符合正态分布的,比如身高、体重,智商,血压,几乎与社会相关和自然相关的都符合正态分布。但并不是说所有的事情都符合,财富就是一个典型的例子,与身高相同的是财富也会受到多个因素的影响,但财富分布并不符合正态分布。与身高不同的是影响个人财富的因素有很多,包括人脉、教育水平、沟通能力等,但这些因素并不相互独立,比如沟通能力高了可能会增加人脉,家庭财富高了也会影响教育水平等等。各个因素之间是会彼此加强或彼此减弱,这种关系更像是乘法而不是加法。如果各种因素对结果的影响不是相加,而是相乘,那么最终呈现的概率分布会呈现左半部分相对较小,而右边有一个长尾的状态,这就是对数正态分布

 财富分布

怎么用?

看了这么多关于正态分布的内容,应该如何使用呢?说实话我通过搜索,找到了一些质量管理和68-95-99.7法则的说明,但在我的现实生活中并没有什么特别好的例子和使用角度,在这里拿查理芒格使用正态分布的方式来介绍一下,如果遇到符合正态分布的事例需要计算的时候,可以手动去计算一下,而不是只看估计,这能让我们能更加理性的去看待收益和风险,也能避免被一些无良商家承诺高收益而让我们高兴的忘了头脑的情况出现。

我虽然不能准确的说出正态分布的细节,不过我知道他的分布形态,也知道现实生活中许多事件和现在是按照那个方式分布的,所以能做一个大致的计算。这就够用了。——查理·芒格

在这里也希望大家如果在生活中遇到了可以使用正态分布思维模型的情况下,能通过评论告诉我,大家共同学习进步。

总结

正态分布、高斯分布、钟形曲线其实说的都是一件事情。导致正态分布如此常见的原因是中心极限定理,有三个关键条件,第一事情由多种因素,第二因素之间相互独立并无法产生支配性影响,第三,各个因素之间的是相加关系。只要符合这三个条件,不管每个因素是怎么分布的,其叠加后影响的平均值就符合正态分布

学了大数定理,正态分布这种思维模型并不能让我们一夜暴富,而它们给我们的智慧在于就是长期在大概率事件上下注,让我们使用系统的眼光看待问题,帮助我们在某些问题上作出更正确的决定,这也是一种在不确定性的世界中找到确定的成长方法。投资自己,而是长期不断的坚持下去,比如每天坚持锻炼身体,每天抽出一小时读书,在短时间内可能并没有什么效果,但是只要坚持下去,所带来的收益将会是无限的。