統(tǒng)計學的思想和各種統(tǒng)計數(shù)據(jù)對政府、社會乃至我們的工作和日常生活都有著不可忽視的影響,甚至超乎你的想象。通過閱讀本書,你將會對我們生活的這個世界有更完整、更清晰的認識。
這不是一本講述干巴巴的統(tǒng)計學理論的書,它主要介紹統(tǒng)計學概念的應用及其對日常生活、公共政策和許多其他領域的影響。書中沒有煩瑣的公式、圖表和計算,你只要看得懂而且會解簡單的方程式就足夠了。本書著重于啟發(fā)思考,這比生搬硬套地使用數(shù)學公式更有助于訓練看問題的視角和解決問題的思維。
本書把統(tǒng)計學概念分成四個部分來呈現(xiàn):數(shù)據(jù)的生產(chǎn)、整合數(shù)據(jù)、機會與概率、統(tǒng)計推斷。
本書一點兒也不乏味,恰恰相反,它是那樣生動有趣,深入淺出地把統(tǒng)計學的概念和分析方法呈現(xiàn)在你面前。通過一個個具體的案例、簡單的練習和知識普及,能讓你在閱讀過程中不知不覺地增長統(tǒng)計學知識,提高分析和解決問題的水平。
這是一本能給你帶來閱讀樂趣的書,也是一本能讓你更睿智的書。
作為通識教育,人人都該懂點兒統(tǒng)計學!通俗、易懂、實用的統(tǒng)計學,助你培養(yǎng)統(tǒng)計思維!
統(tǒng)計學是關(guān)于數(shù)據(jù)的學問。數(shù)據(jù)就是數(shù)字,但又不僅僅是數(shù)字,數(shù)據(jù)是有上下文聯(lián)系的數(shù)字。比如,數(shù)字10.5本身沒任何意義,但是,假如我們聽說一位朋友剛出生的孩子體重為10.5磅a,那么我們會恭喜她生了一個健康的寶寶。結(jié)合數(shù)字的上下文聯(lián)系和個人知識,就可以做出判斷。我們知道,體重10.5磅的新生兒個頭相當大,而新生兒的體重不太會是10.5盎司b或10.5千克。因此,上下文聯(lián)系可以使數(shù)字含義明確。
統(tǒng)計學通過數(shù)據(jù)獲取真知灼見并且得出結(jié)論,所用的工具是圖表和計算。但是,這些工具要在符合常識的思考方式下使用。讓我們先快速地了解一下新聞媒體、熱門政治和社會爭議的數(shù)據(jù)和統(tǒng)計研究方面的豐富成果,邁出學習統(tǒng)計學旅程的第一步。在后文中,我們將對序言里列舉的案例展開更為詳細的研究。
一則逸聞就是一個引人入勝的故事,它之所以能夠深入人心,就在于其內(nèi)容能打動人。逸聞可以讓事情人性化,所以新聞報道通常以逸聞開頭(和結(jié)尾)。但是逸聞無法用作決策的依據(jù),正是因其內(nèi)容生動,所以也常常誤導我們。我們判斷一個說法可信與否的依據(jù),是它是否有數(shù)據(jù)支持,而不是它是否來自一個動人的故事。
住得離高壓電纜太近,是否會導致兒童患上白血病?美國國家癌癥研究所花了5年時間和500萬美元,來收集有關(guān)這個問題的數(shù)據(jù)。結(jié)果發(fā)現(xiàn),在白血病和暴露在高壓電纜產(chǎn)生的電磁場之間沒有任何相關(guān)性。和這篇研究報告同時發(fā)表在《新英格蘭醫(yī)學期刊》上的社評大聲疾呼,是時候不要在這個問題上
再浪費我們的研究資源了。
比較一下兩則報道產(chǎn)生的影響:一則是有關(guān)歷時5年、花費500萬美元的調(diào)查研究的電視新聞報道,另一則是對一位能說會道的母親的電視采訪,她患有白血病的孩子恰好住在高壓電纜附近。在公眾心目中,幾乎每次都是逸聞勝出。但事實上,我們應該心存疑問,因為數(shù)據(jù)要比逸聞更可靠,數(shù)據(jù)可以系統(tǒng)地描繪出整體圖景,而不是聚焦于個別事件。
我還打算補充一句,數(shù)據(jù)勝過自封的專家。新聞行業(yè)通常所秉持的所謂公正的立場,就是各找一名正反方專家發(fā)表簡短的評論。我們永遠無法知道是否其中一方代表的是整個學科的共識,而另一方則是蠅營狗茍于某些特殊利益的騙子。媒體這種處理沖突的做法使現(xiàn)在的公眾認為,對應每一位專家,都有一個持相反觀點的專家。如果你真的關(guān)注某個話題,就應該嘗試從數(shù)據(jù)中找出結(jié)論,還要判斷數(shù)據(jù)的質(zhì)量是否良好。很多問題確實還未得到解決,但也有很多問題,只在那些不重視證據(jù)的人的頭腦中才懸而未決。你至少可以了解一下這些專家的背景,還有他們引用的研究結(jié)果是否曾刊載于那些文章必須先通過外部評審之后才能發(fā)表的嚴謹期刊上。
數(shù)據(jù)是數(shù)字,而數(shù)字總顯得非?尚。其實有的數(shù)字是這樣,有的卻并非如此。任何統(tǒng)計研究中最重要的事,就是數(shù)據(jù)的來源。專欄作者安蘭德斯問她的讀者,如果可以重新來過,是否還會生孩子?回答的人中有70% 堅定地說不要。但是,你對于蘭德斯從淚跡斑斑的信中,引述讀者哭訴他們的孩子如何像野獸一樣的話語,大可一笑置之。因為蘭德斯從事的是娛樂業(yè),她邀請讀者回答這個問題時,回應最熱烈的應該是那些后悔生孩子的父母。大部分的父母并不后悔生小孩。我們知道這個事實,是因為曾經(jīng)有人對許多父母做過調(diào)查,而且為了規(guī)避偏見,受訪的父母是隨機抽取的。民意調(diào)查當然也不是沒有瑕疵這點我們后面會談到但它仍比邀請有一肚子不滿的人來回答問題要好得多。
即使是信譽卓著的期刊,也不一定能對壞數(shù)據(jù)免疫!睹绹t(yī)學會雜志》刊登過一篇文章,聲稱用管子將冷卻的液體輸送進胃里,可以緩解潰瘍癥狀。這種治療對病人的確有效果,但那只是因為病人通常會信服醫(yī)生的權(quán)威性。也就是說,安慰劑(placebo,虛擬治療)發(fā)生了作用。后來終于有人產(chǎn)生了質(zhì)疑, 做了有控制組的比較研究有些病人接受了這項治療,有些只使用了安慰劑結(jié)果表明安慰劑組(控制組)的表現(xiàn)更好。沒有比較,就沒有結(jié)論,
這是判斷醫(yī)學研究好壞的一個很好的依據(jù)。比如,我對于最近突然流行的自然療法就心存懷疑。在這些療法當中,極少會通過比較實驗來證明它們不只是裝在貼著漂亮植物圖片的瓶子里售賣的安慰劑。
有報道說,在美國,設有賭場的縣犯罪率較高。有位大學教師說,在線上課的學生比在教室里上課的學生表現(xiàn)好。政府報告強調(diào),受過良好教育的民眾比受教育少的民眾賺錢多。最好不要太快下結(jié)論,而要先問一句:有沒有什么是他們沒告訴我的,卻可以用來解釋這些事?
有賭場的縣的確犯罪率較高,但是在城市或是較窮的縣,犯罪率也比較高。什么樣的縣會開設賭場呢?這些縣是否在開設賭場之前,犯罪率就已經(jīng)很高了呢?在線上課的學生學得比較好,但是和在教室里上課的學生比起來,前者的年齡比較大,底子也比較好,因此他們表現(xiàn)好很正常。受教育程度高的人的確賺錢多,但受教育多的人和受教育少的人相比,平均來說前者的父母受的教育也較多,也比較有錢。而且,前者在更好的環(huán)境中長大,上更好的學校。這些有利條件讓他們接受到更多的教育,即使他們不接受這么多教育,這些有利條件也可能會幫他們賺到很多錢。
以上這些案例,都涉及兩個變量之間的相關(guān)性,并且引導我們得出結(jié)論,即其中一個變量影響了另一個變量。賭場會增加犯罪率和想變富有就要多讀點兒書,是它們傳達的信息。這些信息有可能是正確的,但我們看到的相關(guān)性,大部分說不定還可以由隱藏在背景中的一些變量來解釋,比如開設賭場的縣的本質(zhì),以及受教育程度高的人生來就具備的有利條件。好的統(tǒng)計研究會考慮許多的背景變量,這當然需要技巧,不過你至少可以找一找,看它們有沒有這樣做。
戴維穆爾(David S. Moore),就職于美國普渡大學,曾擔任美國統(tǒng)計學會主席。他獲得了普林斯頓大學的數(shù)學學士學位和康奈爾大學的數(shù)學博士學位,著有多篇統(tǒng)計理論方面的學術(shù)論文。他還是美國統(tǒng)計學會、數(shù)學統(tǒng)計研究所、國際統(tǒng)計學研究所會員,也曾擔任美國國家自然基金會統(tǒng)計學和概率項目主任、國際統(tǒng)計學教育協(xié)會主席,并獲得美國數(shù)學協(xié)會杰出教育獎。
威廉諾茨(William I. Notz),就職于美國俄亥俄大學,獲得了約翰霍普金斯大學的物理學學士學位和康奈爾大學的數(shù)學博士學位。他一開始就職于普渡大學統(tǒng)計學系。在那里,他和戴維穆爾一起講授統(tǒng)計學課程,對統(tǒng)計學教育產(chǎn)生了興趣。他的研究領域是實驗設計和計算機實驗。他是美國統(tǒng)計學會和國際統(tǒng)計學研究所會員。
鄭磊,博士,本科就讀于蘭州大學數(shù)學系,后獲得荷蘭瑪斯特里赫特管理學院MBA學位和南開大學經(jīng)濟學博士學位。工作經(jīng)歷涵蓋制造業(yè)、咨詢和智庫,現(xiàn)在深圳和香港從事經(jīng)濟研究和投資銀行工作,出版4本專著,翻譯近20本引進版書籍。
致讀者 // III
序 言 了解統(tǒng)計學 // VII
第1部分 數(shù)據(jù)的生產(chǎn)
第1章 數(shù)據(jù)從哪里來 // 003
第2章 好樣本和壞樣本 // 023
第3章 樣本可以告訴我們什么 // 042
第4章 真實世界中的抽樣調(diào)查 // 066
第5章 好實驗與壞實驗 // 098
第6章 現(xiàn)實世界中的實驗 // 120
第7章 數(shù)據(jù)倫理 // 145
第8章 度量 // 167
第9章 統(tǒng)計數(shù)字會說謊 // 194
第1 部分 內(nèi)容回顧 // 153
第2部分 整合數(shù)據(jù)
第10章 好圖表與壞圖表 // 227
第11章 用圖呈現(xiàn)數(shù)值變量的分布 // 254
第12章 用數(shù)字描述分布 // 279
第13章 正態(tài)分布 // 309
第14章 描述相關(guān)關(guān)系:散點圖和相關(guān)系數(shù) // 333
第15 章 描述相關(guān)關(guān)系:回歸、預測與因果關(guān)系 // 001
第16 章 居民消費價格指數(shù)和政府統(tǒng)計數(shù)據(jù) // 032
第2 部分 內(nèi)容回顧 // 056
第3 部分 機會與概率
第17 章 思考隨機事件 // 073
第18 章 概率模型 // 096
第19 章 統(tǒng)計模擬 // 114
第20 章 賭場的生意經(jīng):期望值 // 135
第3 部分 內(nèi)容回顧 // 153
第4 部分 統(tǒng)計推斷
第21 章 什么是置信區(qū)間 // 165
第22 章 什么是顯著性檢驗 // 193
第23 章 統(tǒng)計推斷的濫用 // 220
第24 章 雙向表與卡方檢驗 // 240
第4 部分 內(nèi)容回顧 // 266
附 錄 // 279