34個讓你豁然開朗的統計學小故事
What is a p-value anyway? 34 Stories to Help You Actually Understand Statistics
原文作者╱
Andrew Vickers
作  者╱
安德魯•維克斯
譯  者╱
杜炳倫
出版社別╱
五南
書  系╱
博雅科普
出版日期╱
2020/12/21   (1版 2刷)
  
即日起五南舊官網僅提供書籍查詢,如欲購書,請至五南新官網 https://www.wunan.com.tw/
I  S  B  N ╱
978-957-763-332-3
書  號╱
RM44
頁  數╱
372
開  數╱
25K
定  價╱
420 (特價 332)

若無法觀看影片請連結此網址
※書籍推薦人
政治大學統計學系副教授 鄭天澤 推薦

安德魯.維克斯(Andrew Vickers),牛津大學臨床醫學博士,任職於美國紐約紀念斯隆.凱特琳癌症中心的生物統計與流行病學部門,專職研究方法。他活躍於許多癌症研究領域,包括外科手術結果、分子標記以及臨床試驗。他也進行統計方法的原創研究,特別是預測模型評鑑這方面。在寫這本書時。以他為主要作者或共同作者的科學論文,已經超過二百篇。

維克斯博士在統計教學這方面有著強烈的興趣。他是紀念斯隆.凱特琳癌症中心生物統計課程的課程領導者,並且在康乃爾醫學院教醫學系學生生物統計。維克斯博士目前與其家人定居於紐約市布魯克林區。
※譯者簡介
杜炳倫
杜炳倫(M.Ed., University of Idaho)為資深教師,美國愛達荷大學課程與教學碩士,美國田納西大學諾克斯維爾校區(University of Tennessee, Knoxville)應用教育心理學博士班。赴美留學期間,有幸於田納西大學校長講授獎學者暨美國教育研究協會主席—史凱樂.哈克博士(Dr. Schuyler Huck)門下學習。曾榮獲田納西大學教育•健康•人類科學學院,特拉維斯.霍克(Travis Hawk)學術傑出獎。其英文著作「百分位數與百分等級(Percentile and Percentile Rank)」被收錄於美國聖哲(Sage)出版商所發行的《測量與統計百科全書》(Encyclopedia of Measurement and Statistics)。中文著作有《上學的代價》,其長銷譯作《解讀統計與研究》,拯救了無數研究所學生,並且廣為兩岸四地各大學圖書館所收藏。經營的統計教學網站,資源豐富,無惑不解。平時喜好從事有益於身心健康的各項活動。
譯者網站:http://mypaper.pchome.com.tw/readingstatistic

序言:如何閱讀本書?

1 我告訴朋友,我的工作比他想像中的更有趣:統計學是什麼?

數據的描述
2 當比爾蓋茲走進一間小餐館:平均數與中位數
3 當比爾蓋茲再次回到小餐館:標準差與四分位距
4 偏斜的射門與誤判
5 你不可能擁有2.6個小孩:不同類型的數據
6 為何你的高中數學老師是對的:如何畫一張圖

數據的分配
7 梯盤棋與血清血紅素水平:常態分配的見解
8 如果常態分配如此常見,為何我的數據從來就不是?
9 但我喜歡那件毛衣:什麼程度的合身才算是「足夠」的合身?

研究結果的變動:信賴區間
10 長頭髮:中年大叔的標準誤差
11 怎麼避開雨天婚禮:變動與信賴區間
12 統計領帶,為什麼你不應該戴一條:進一步探討信賴區間

假設檢定
13 選一條騎車回家的路:p-值為我們做了什麼
14 乾牙刷的機率:p-值到底是什麼?
15 麥可喬丹將不會接受這個虛無假設:如何詮釋高p-值?
16 運動與生意之間的差別:t-檢定與威寇森檢定
17 與朋友們聚會:樣本數、精確度以及統計檢定力

迴歸與決策
18 何時拜訪芝加哥:關於線性與邏輯氏迴歸
19 我的助理今天是短髮造型:關於迴歸與混淆
20 我不理會孩子的咳嗽,我太太驚慌失措:關於特異性與敏感性
21 避開大特價:幫助你做決定的統計

一些常見的統計學錯誤,以及它們教我們什麼東西
22 比約翰湯米多一個:四個統計學錯誤,容易被忽略卻都很重要
23 剷除無用的p-值:一個統計檢定應該只回答一個科學問題
24 如何拍攝電視節目:不提供有意義數值的統計分析
25 93歲,體重700磅,美國佛羅里達州的超級老爹山姆:在迴歸分析裡兩個常見的錯誤
26 迴歸單身的麥克:一位條件不錯的朋友仍然單身的統計學解釋
27 OJ•辛普森,莎莉•克拉克,喬治與我:關於條件機率
28 男孩遇見女孩,女孩拒絕男孩,男孩開始多重檢定
29 不曾發生在我身上的一些事情:你為什麼不應該比較p-值
30 如何贏得馬拉松比賽:測量隨時間發生的事物時要避免錯誤
31 劣質統計學與培根三明治之間的差異:統計有所謂的「使用規則」嗎?
32 檢視你的垃圾桶:從錯誤中學習
33 有意義的數值:連結數學與科學
34 統計學與人們息息相關,即使你看不見眼淚

討論區答案
參考資料
索引

東大教授十小時
教會你大學四年
的行銷學
區塊鏈的衝擊:
從比特幣、金融
科技到物聯網顛
覆社會結構的破
壞性創新技術
資本論簡說
非洲鈔票故事館
Google
Analyti
cs 疑難雜症
大解惑:讓你恍
然大悟的37個
必備祕訣
諾貝爾經濟學家
的故事




第19章
我的助理今天是短髮造型:關於回歸與混淆

漫畫英文
胖子:唉!又多了2公斤,是因為垃圾食物的關係嗎?或是因為不運動才使我一直吃垃圾食物和一直增肥呢?
瘦子:看來我們需要進行多變項回歸分析。

妙趣橫生的對話

對一位感冒的人,我說事情發生了變化;對一位突然沒了鬍子的朋友,我說你刮鬍子了;對一位突然變短髮的同事,我說你剪頭髮了。令人傷心的是,大部分的時間裡,我沒有什麼令人有趣的事情可說。
     另一方面,頭髮案例的確告訴我們,關於回歸的一些事情。讓我們想像,幾百人排成一列,然後你去猜測他們上個星期是不是剛剪了頭髮。某些情況很容易判斷(例如:某位老兄本來長髮披肩)。總的來說,你會認為短頭髮是最近才剪的。整體上,你的猜測不會剛好那麼準:你不會知道,中間長度的頭髮,是不是最近才把長髮剪短或是留長。
     我之所以知道我的助理剪了頭髮,是因為我天天看著他留著一頭長髮。所以,星期二的長髮是星期三長髮的一個有力的預測因子。這告訴我們,如果這個世界不符合某種預測,而你認為這是個有力的預測,那麼某事發生的機率就會增加。現在記住,回歸是關於預測:我們試著預測一個依變項y(像是馬拉松時間),依據的是一個或更多的x(像是訓練強度)。所以,回歸對於「某事發生」(像是剪頭髮)的預測是有助益的。

說客為漢堡、薯條以及奶昔辯護

速食通常含有大量的脂肪(像是乳酪漢堡)與糖分(像是奶昔),而據我所知,食用大量的脂肪與糖分會導致肥胖。我有一組2000位美國人回答飲食與運動習慣的數據,將近三分之二的研究參與者,至少偶爾吃速食,而他們的肥胖率比不吃速食的研究參與者要高(21% vs.15%;p<0.01)。然而,在我開始要思考我手上的研究發現時,有位美國垃圾食物協會說客代表拜訪我。這位代表宣稱,漢堡與肥胖無關,只是因為又窮又沒受過什麼教育的人們,傾向於吃垃圾食物,而這些群體一般都不努力鍛鍊身體且有著糟糕的飲食習慣。
     這裡有一句你不常讀到的說法:說客是對的(在一定程度上)。當我在這組數據上進一步分析時,我發現收入、教育、性別以及運動都與肥胖有關。例如:有運動的研究參與者比那些不運動的具有較低的肥胖率(16% vs.21%;p<0.01)。我也發現收入、教育、性別以及運動都與垃圾食物有關,那些吃垃圾食物的研究參與者運動率(55%),比那些避開垃圾食物的研究參與者運動率(65%)要低(p<0.01)。
     說客看見這些結果,高興地安排了一場慶祝午餐(雙層酪梨醬培根漢堡,配上大薯和大杯汽水)。但當他們離開時,我使用邏輯回歸公式去預測每位研究參與者的肥胖率期望值,依據的是收入、教育、運動習慣以及性別。吃垃圾食物的平均肥胖率為20%,而不吃垃圾食物的是18%,但確實比率為21%與15%。因為肥胖率的不同大於我們所期待的,這暗示垃圾食物與肥胖之間的關係不僅僅歸因於諸如運動等等因素的差異。換句話說,這世界不如我們所預期的,所以一定有某事正在發生。

睡眠剝奪使我焦慮

我的孩子有一套理論:早起使我焦慮。斟酌我工作天(我早起)比週末壓力大的事實。我的看法摘要如圖19-1:
     這就是統計學家所說的混淆(confounding)——你認為一件事引起另一件,但事實上,是某事引起這兩件事。早起與焦慮也許並沒有真正的連結,只是因為工作天必須帶孩子上學和上班,導致我必須早起以及我的焦慮水準升高。理想情況是,找到我週末早起或工作天晚起的時候,然後我們可以分開比較工作天與週末,早起天和晚起天的焦慮水準。例如:如果週末早起天比晚起天更焦慮,那麼我們可以更有信心地說早起真的與焦慮有關。

「調校你的結果」:聽起來有點調皮,但統計學家每時每刻都在做這件事

在我們的垃圾食物研究裡,使用以上類似的方法,會有一個問題。那就是,我們必須在大量類目裡(富有的大學學歷女性運動者,富有的大學學歷女性不運動者,不富有的大學學歷男性運動者等等),比較垃圾食物饕客與節制者的肥胖率。然而,多變項回歸替我們一次性地比較所有組別裡的垃圾食物效果。
     肥胖的多變項回歸,得出y=肥胖機率對數值=0.334×垃圾食物-0.246×運動-0.078×大學教育-0.0858×收入+0.375×男性-1.27(參看第18章)。在這條回歸等式裡,我們稱垃圾食物為預測變項(predictor,也就是我們真正感興趣的變項)而運動、教育、收入與性別是共變量變項(covariates,它們幫助決定是否垃圾食物與肥胖有關)。

因為垃圾食物的係數大於0,我們推斷,垃圾食物與增加肥胖的風險有關。為了算出是否此關連具有統計顯著性,我們需要標準誤,它是0.121。係數幾乎是標準誤的三倍。我們知道,在虛無假設的背景之下,此係數會有95%的機率於零的兩個標準誤之內,因此我們能夠推斷垃圾食物與肥胖之間的關連具有統計顯著性(確實的p值為0.006)。
     你可以把多變項回歸等式想成這樣。想像兩組各有100位美國人——一組吃垃圾食物而另一組沒有——這兩組在運動,教育,性別以及收入上都完全一樣。如果垃圾食物組有較高的肥胖率,你會說這很可能肇因於垃圾食物與肥胖之間的真實關連,因為你無法使用說客的推托之詞,把原因怪罪到諸如運動等其他因素上。現在,想像垃圾食物組裡有稍微多一點的人不運動,而其他條件都一樣。我們不想這樣說,「喔!兩組立基有一些不一樣,我們甚至不應該進行比較。」比較合理的回答是,「好吧!組別之間有一點不一樣,所以我們也許可以調校結果以補償這些差異。」
     舉例,垃圾食物組肥胖率為21%,而不吃垃圾食物組肥胖率為15%,運動百分率分別為55%與65%。我們擔心的是,垃圾食物組較低的運動率,造成了肥胖率的差異。在分析我們的數據時,發現那些不運動的,五位裡面有一位是肥胖的。垃圾食物組裡多出10%(即10位)不運動者。所以,你會期待有20%,或2位,是肥胖的。我們現在可以「調校」垃圾食物組的肥胖率。我們想像,如果兩組的運動率都一樣,在垃圾食物組裡會少2位肥胖人員,所以把21%替換成19%,這仍然高於15%。所以我們推斷,垃圾食物與肥胖的關連與運動無關。
     在多變項回歸裡,我們同時調校運動、收入、教育以及性別。據此,我們也許會報告這樣的結果:「在調校了運動、收入、教育以及性別變項之後,垃圾食物是肥胖的預測因子具有統計上的顯著性(勝算比1.40﹔95%的信賴區間為1.10至1.77﹔p=0.006)。」
     多變項回歸如何能幫助指認混淆變項?讓我們思考一下收入與犯罪之間的連結(參看第24章的答案)。收入中位數較高的州,有著較高的暴力犯罪率,這暗示有一堆有錢人開著瑪莎拉蒂跑車去搶銀行或殺人。但收入與犯罪之間的關係,被城市生活所混淆:比較有錢的人們,很有可能住在所費不貲的城市裡,但城市裡也有較多的犯罪。如果你在多變項回歸模型裡,為城市生活進行調校,那麼收入中位數的增加就與暴力犯罪率的減少有關,而這也是你所期待的結果。