考场上那种抓到笔头就爱跳进题海里的感觉,大家可能都有点共鸣。光是在各种公式和推导证明上打转,总认定能拿个分数就能完事了,结局一真正遇到大题,脑子直接嗡鸣上了。

实际上考啥,归根结底就是考你能不能用脑子去理清楚事理,而不只是是堆砌符号。 比如我想讲点关于概率分布的事儿,大量人一上来就盯着方差写,认定只要方差小就好了。但方差实际上是个双刃剑,它既能衡量数据波动,也能反映信息的丰富程度。举个具体的例子,假设有两个样本,A 组的数据是 1, 2, 3,B 组的数据是 100, 101, 102。乍一看 B 组数值大,方差肯定也大,但这并不代表 B 组更“稳”,反而它的数据分布范围忒广,极端值忒多,任何一个值都可能让你质疑人生。

反之,A 组别看数值小,但数据聚拢程度高,每次测出来结局都差不多,误差管住得更好。

这就好比你在做实验,做 A 组实验三天,结局每天大约都在 98% 左右;做 B 组实验三天,结局可能是三天前 1% 的今天可能 99%,一天前 98% 的今天可能 99%,这种不确定性实际上比 A 组要大,故此有时候方差小反而说明模型在管住得更好。自然,方差小也有它的用处,比如你关心的是数据是不是特别稳定,能不能让人放心,那方差小就是好事。但要是你需求的是预测未来的精度,是不是时常会有些天差地别,那方差小可能没那么有吸引力。 再聊聊统计学里的分布难题,特别是正态分布。大量人一听到正态分布就麻醉,认定赶明儿都不用管了,毕竟只要数据来自正态分布,奥卡姆剃刀原则就自动帮你选好了。但现实往往比教科书里复杂。

比如你说你身高服从正态分布,你认定自己肯定能达到 180cm。但正态分布是连续变量,它是累积概率,不是随机变量。

要是你想知道你身高超过 180cm 的概率是多少,那得看具体参数。

要是你们学校均值是 170cm,标准差是 15cm,那超过 180cm 的概率实际上挺低的。但要是你们学校均值是 180cm,标准差是 10cm,那超过 180cm 的概率就是 50%。

这两个例子放在一起,哪怕都是正态分布,结论却彻底反之。

这就像你问一个随机扔骰子的人,它顶多能掷出几点,它只会告诉你“6 点”,绝对不会告诉你"6 点”的概率是多少,出于它只关心的是所有样本里,"6 点”出现了几次,而不是单个人能掷出几点。正态分布是研究者用来处理大量样本、量化不确定性的工具,而不是用来预测单个结局的预言家。

要是非要拿它预测,那结局往往出乎意料,就连有点反直觉。 还有说到假设检验,这个章节有时候让人头秃。大量同学死磕 p 值,总认定 p 值越小越好,别的不管。但 p 值到底是个啥玩意儿?它实际上是说“要是真原假设成立,看到如此极端的数据,概率有多大”。

举个例子,你做个实验测药物疗效,质疑无效(原假设是确实),你设计了个实验,测出来了一半病人有效。

这时候算出来 p 值是 0.03。

要是你认定 0.03 忒小了,就回绝原假设,说这药有效。但换个思路,万一原假设实际上没错呢?也就是说那药确实无效,那你这组数据实际上只是运气好,恰好测出来一半有效,那 p 值 0.03 只是意味着“要是是无效药,看到一半有效的概率只有 3%"罢了。

这个概率本身不代表“无效药”这个假说是假的,它只是表示在无效药的假设下,拿到这种数据的“罕见程度”。

要是 p 值大,比如 0.3,那就意味着“要是是无效药,看到一半有效这种情况形成的概率有 30%",这在无效药的假设下不算罕见,故此你不应当轻易去回绝原假设。

这时候你就能够说,“看,这数据在无效药的假设下也挺常见,故此我不回绝原假设,这药可能的确无效,要么起码数据并不赞成它有效”。

你看,是不是 p 值本身并没有那个“绝对真理”的味道,它只是一个统计量,说明数据在某个假设下形成的频率有多高,而不是直接说明假设真假。 最终说说样本量的选择,这个实际上挺难的,出于数学上有个公式算出来,但实际用起来又挺艺术。大量书里总说样本量要达到多少,但我认定这取决于你关心的是啥。

要是你是要做分类变量,比如性别、血型,样本量只要保证每个类别能算出起码 10 个即可,那 10 个人里要是有 5 个男,5 个女,样本量肯定够了。但要是是连续变量,比如血压、身高,那你得想清楚你愿意承担多大的误差。

要是标准差是 10,那你可能希望样本量总共 100 个人,这样误差不至于忒大;但要是标准差特别大,比如 50,就连 100,那你可能需求起码几千人才能保证结局可信。

这时候直接套用公式可能就不忒合适了,出于样本量大小和数据的方差成反比,数据越分散,需求的样本量就越大。

这就像你拍一张照片,要是光线挺暗,像素点就极少,画面就糊;要是光线刺眼,像素点就多但噪点多。

故此样本量并不是越大越好,而是要和数据的特性、你的研究目标匹配好。 实际上统计学不是让你去背诵一堆公式,而是让你学会如何拿着数据讲话,如何在数据混乱中找到规律,如何在数据和人之间找平衡。考试的时候,别管公式会不会写,别管推导对不对,关键是你能不能用统计的思维去分析难题。

比如看到一堆数据的波动,别一上来就拔高它的方差,先去问问数据的分布是不是正态,是不是有离群值;看到有假设的检验,别一上来就盯着 p 值看,先去问问原假设到底是啥,数据在假设下到底罕见不罕见。

这样才能避免掉进那些死记硬背公式、却看不懂数据的陷阱里。统计学的魅力就在于它不给你标准答案,只让你去探索数据背后的真故事,而不是让你去背诵那些冷冰冰的符号。