身邊的統(tǒng)計學
《曲阜師大報》2011年校園十大新聞中的第三項是,統(tǒng)計學增列為博士一級學科授權(quán)點。
統(tǒng)計是什么?好像很清楚,又覺得不太清楚。新華詞典的解釋是:指對某一現(xiàn)象有關(guān)數(shù)據(jù)的搜集、整理、計算和分析等。1月13日,北京衛(wèi)視“身邊”訪談節(jié)目中,主持人拿了一個西瓜,問里面有多少粒瓜籽?有的觀眾說,吃了以后數(shù)一下就知道了;有一位觀眾說,把西瓜分成八塊,吃完一塊數(shù)一下瓜籽,再乘以8。北京市統(tǒng)計局長說,前面觀眾的辦法是計數(shù),后一位則是統(tǒng)計,這一解釋似是通俗版的統(tǒng)計。唐詩“山僧不解數(shù)甲子,一葉落知天下秋”是文學版的統(tǒng)計??梢钥闯鼋y(tǒng)計的核心思想就是,由部分推斷全體。
統(tǒng)計Statistics一詞源于意大利文的 stato,它有“國家”和“情況”的含義。后來哥廷根大學的阿亨瓦爾把關(guān)于國家、組織、人口、軍隊、領土、資源等項的學問稱為“國勢學”,還創(chuàng)造了一個新的德文詞匯“statistik”,即統(tǒng)計學。1787年,英國的齊默爾默譯為英文statistic。19世紀,統(tǒng)計學傳入日本,日本學者譯成漢字統(tǒng)計學。
一、統(tǒng)計規(guī)律性。生活中的困果關(guān)系我們很熟悉。如果擲一枚硬幣,則可能出現(xiàn)正、反兩種情況。法國人蒲豐擲了4040次,擲出正面2048次,頻率為0.5070。英國統(tǒng)計學家皮爾遜擲過24000次,出現(xiàn)正面12012次,頻率為0.5005。在自然條件下,男女嬰兒的出生率也是穩(wěn)定的,法國數(shù)學家拉普拉斯曾調(diào)查了倫敦、彼得堡、柏林等地的資料,得到男嬰出生 率 22/43。 但 他 調(diào) 查 巴 黎1745———1784年的資料時,卻得到男嬰出生率為25/49,拉普拉斯對這樣的差異很奇怪。后經(jīng)了解,巴黎附近一地區(qū)有棄男嬰的習俗,修正這一人為因素后,男嬰出生率也穩(wěn)定在22/43左右。這些現(xiàn)象正是恩格斯指出的:“在表面上是偶然性起作用的地方,這種偶然性始終受內(nèi)部隱蔽著的規(guī)律支配的,而問題只是在于發(fā)現(xiàn)這些規(guī)律?!边@種大量不確定現(xiàn)象中的頻率穩(wěn)定現(xiàn)象稱之為統(tǒng)計規(guī)律性,認識這種規(guī)律的方法,只有采用統(tǒng)計學方法。大氣變化是一種非確定性現(xiàn)象,天氣預報就是成功應用統(tǒng)計方法的例證。
二、數(shù)理統(tǒng)計的應用。數(shù)理統(tǒng)計學是伴隨著概率論發(fā)展而形成的一個統(tǒng)計學分支,在工農(nóng)業(yè)生產(chǎn)實踐中有著廣闊的應用。20世紀70年代,中國科學院數(shù)學研究所的張里千教授創(chuàng)造性的把正交試驗法應用于國民經(jīng)濟領域,足跡遍及全國十多個省、市、自治區(qū),在節(jié)約能源、增加產(chǎn)量、降低消耗方面取得顯著的成效。
我校在推廣應用方面也取得了一定的成績,例如數(shù)學系74級同學在兗州泗店鄉(xiāng),開展了棉籽變溫浸種的正交試驗,取得了良好的效果。該成果發(fā)表在中國農(nóng)林科學院出版的《農(nóng)業(yè)科技通訊》上。后來我校開展的防止小麥干熱風的正交試驗,獲得1984年山東省科委優(yōu)秀成果獎。在理論研究方面,章志敏、王長鈺完成的《正交試驗的熵最優(yōu)性》,發(fā)表在法國“統(tǒng)計分析”上,1990年獲國家教委科技進步獎。運籌學研究生徐澤水運用數(shù)理統(tǒng)計中的 “卡方檢驗”思想,給出了一種新的排序算法,發(fā)表在美國《最優(yōu)化理論及應用》上,1999年,獲首屆山東省優(yōu)秀碩士學位論文證書。
三、身邊的統(tǒng)計學。由于統(tǒng)計信息的社會化、網(wǎng)絡化,統(tǒng)計方法在多個學科和生活中得到應用,如統(tǒng)計物理,生物統(tǒng)計學等。經(jīng)濟學 中 更 少 不 了 國 民 總 收 入(GDP)、居民消費價格指數(shù)(CPI)等統(tǒng)計指數(shù)。在文學研究中也有人采用統(tǒng)計方法。胡適作《紅樓夢考證》以來,一般人認為曹雪芹作前80回,后40回由高鶚所續(xù)。但紅學界對《紅樓夢》作者是誰?眾說紛紜。復旦大學李賢平教授對《紅樓夢》每個回目中,所用的47個虛字(云、其、或、亦……)出現(xiàn)的次數(shù)(頻率),作為《紅樓夢》各個回目的數(shù)字標志,然后用統(tǒng)計方法進行分析比較,得出如下結(jié)論:1、前80回與后40回之間有交叉;2、前80回是曹雪芹據(jù)《石頭記》寫成,中間插入 《風月寶鑒》;3、后40回是曹雪芹親友將曹的草稿整理而成,寶黛故事為一人所寫,賈府衰敗情景為另一人所寫。
在現(xiàn)實生活中有教人買彩票的,有替人算命的,這些都是利用大家對不確定性的迷茫而玩的把戲。統(tǒng)計學能告訴我們哪些是不確定的,哪些是確定的,雖然數(shù)字不會說謊,但是說謊者可以利用數(shù)字。統(tǒng)計學不能改變不確定性,但可以幫助我們認清玩不確定性的騙子。大家多掌握一些統(tǒng)計學知識,騙子的活動空間也就減少了。