亨利·龐加萊 (JulesHenri Poincaré)是法國數(shù)學(xué)家、天體力學(xué)家、數(shù)學(xué)物理學(xué)家、科學(xué)哲學(xué)家,1854年4月29日生于法國南錫,1912年7月17日卒于巴黎。龐加萊的研究涉及數(shù)論、代數(shù)學(xué)、幾何學(xué)、拓撲學(xué)、天體力學(xué)、數(shù)學(xué)物理、多復(fù)變函數(shù)論、科學(xué)哲學(xué)等許多領(lǐng)域。
提到龐加萊,可能人們最先想到的是著名的“龐加萊猜想”,不過這一小節(jié)我們聊聊龐加萊一段真實又有趣的故事,這個故事對于理解數(shù)理統(tǒng)計中假設(shè)檢驗這個模塊很有幫助。
我們買一些食品時,食品的重量多少會有些浮動,例如面包包裝袋的重量標識可以這樣寫:
表示面包的重量應(yīng)該是1000g,但由于種種原因可能會有50g的誤差。龐加萊是個每天都會吃面包的人,他也遇到了同樣的事,一個面包師聲稱賣給龐加萊的面包平均重量是1000g,上下浮動50g。這位面包師每天都會賣個龐加萊一個面包,面對這位忠實的顧客,他沒有絲毫的防備,按照自己的買賣方式每天賣個這位數(shù)學(xué)天才1個面包,不過這位面包師的噩夢也從此開始。
在龐加萊眼中,面包應(yīng)有重量1000g,上下浮動50g,用數(shù)學(xué)語言來表達就是:面包的重量服從期望為1000g,標準差為50g的正態(tài)分布。作為一個嚴謹?shù)臄?shù)學(xué)家,龐加萊每天都會將買來的面包稱重,前9天的記錄數(shù)據(jù)(單位g)如下:
981 972 966 992 1010 1008 954 952 969
這組數(shù)據(jù)的期望(平均數(shù))為x=978.2,盡管期望小于1000g,但也有50g的浮動,從感覺上盡管有些不爽但也難說有問題,不過對于身為數(shù)學(xué)家的龐加萊有8成的把握認定面包師在制作過程中偷工減料。但此時證據(jù)難說確鑿,龐加萊決定按兵不動,繼續(xù)記錄了16天,累計25個數(shù)據(jù)如下:
25天的記錄數(shù)據(jù)的平均數(shù)為978.7g,略有增加,但此時龐加萊有95%的把握認定面包師在制作過程中偷工減料。
龐加萊果斷舉報給質(zhì)檢部門,當(dāng)質(zhì)檢員到來時,面包師百般抵賴,聲稱自己做的面包就是以1000g為基準做的,最多有上下50g的誤差,從龐加萊提供的數(shù)據(jù)中,全部符合他描述的規(guī)律,一時間質(zhì)檢工作人員也無可奈何。但這位面包師可能還不認識他的對手,一位精通假設(shè)檢驗的數(shù)學(xué)家,下面是龐加萊的證詞:
第一點.如果面包師的說法的正確的,則每個面包的質(zhì)量X服從以1000g為期望,50g為方差的正態(tài)分布
這點倒是沒什么問題,好像25個面包的每一個都服從這個規(guī)律。但是25個面包的平均值也服從正態(tài)分布,這就是重要的第二點。
第二點.25個面包的平均數(shù)也服從正態(tài)分布,期望依然是1000,不過方差卻改變了,計算公式如下:
也就是說25個面包的平均重量服從以下正態(tài)分布:
面包師和質(zhì)檢人員表示沒聽懂,這能說明什么?龐加萊給出了通俗的解釋:一個面包的重量波動的會大一點,多個面包的平均重量的波動范圍就會小很多。就想你投擲骰子,投擲1次可能的點數(shù)是1到6中的任意一個,但是如果你投擲100次骰子,這100次總數(shù)的平均值基本就是3.5這個常數(shù),不信您可以試試。面包師和質(zhì)檢員基本理解了這個道理,繼續(xù)聽龐加萊的第三點說明。
第三點.既然25個面包總重量的均值服從期望為1000g,方差為10g的正態(tài)分布,我們先看看正態(tài)分布數(shù)據(jù)的分布特點,如圖:
從上圖中可以看出,95.44%的數(shù)據(jù)落入以期望1000g為中心,2倍方差為浮動(即20g)的范圍里,即[980,1020]。換句話說,如果面包師嚴格按照1000g為基準,50g為浮動制作面包,那么25個面包質(zhì)量的平均值,將有95.44%的可能性落入[980,1020]這個范圍里,相反低于980g或者高于1020g的概率還不到5%,所以面包師一定故意偷工減料了。
聽過了龐加萊對假設(shè)檢驗的科普,質(zhì)檢員對面包師做了處罰,面包師也承認自己確實是以980g為基準做的面包,并同意做出改正。