2016年9月13日 星期二

「忘記歷史的人」

「頻率學家」對傳統機率(P)的定義是長期下來觀察到某事件發生的頻率,勝算等於 P/(1-P),逆機率則是某未知模式或參數的機率。

大部分的機率是條件機率,例如: 當我們看見(實驗或觀察的)資料(本班大ㄧ男生的平均身高)時,在某模式(M,例如: 常態分布)下某資料(D)發生的頻率 P(D|M) 就是似然率。假設只有兩個模式 M1 與 M2,那麼 M1 的似然比等於 P(D|M1)/P(D|M2)。推論統計是用模式中的參數作出函數,藉以預測資料,其中 P 值的定義是如果「虛無假設」M 正確時比某資料更極端的資料發生的機率 P(D|M)。

如果我們希望能由已經看見的資料中推論出模式(理論、假設、母族群)中的參數(例如: 全台灣大ㄧ男生的平均身高),那麼這就是逆機率 P(M|D)。假設只有兩個模式 M1 與 M2,那麼 M1 的勝算等於 P(M1|D)/P(M2|D)。可惜的是推論統計中的 P 值只能給我們 P(D|M),而無法給我們 P(M|D)。

托馬斯·貝葉斯(1702 年~ 1761年)是ㄧ位英國基督教的牧師,他的「貝氏定理」說逆機率 P(M|D) = P(D|M)P(M)/P(D),其中的 P(M|D) 是 M 的後驗機率,P(M) 是 M 的先驗機率,P(D|M)P(M) 是 M 與 D 同時發生的機率,P(D) 是在所有互斥且完全窮盡的條件(Mi,i=1~n)下 D 發生的機率。「貝氏定理」比較簡單的公式是: M 的後驗勝算等於 M 的先驗勝算乘以似然比(或貝氏因子)。

「頻率學家」認為資料是隨機變數,而參數是未知的常數(固定的數字),「貝氏學家」則認為資料是固定的數字,而參數是未知的變數。「頻率學家」認為機率純粹是未來事件發生的機會,「貝氏學家」則認為機率也可以是已發生事件的機會(只是我們不知道而已)。例如: 「頻率學家」認為機率是客觀的,而且我們只能預測ㄧ個人將來發生糖尿病的機率,但是ㄧ個病人現在不是有糖尿病(機率等於 1.0)就是沒有糖尿病(機率等於 0);「貝氏學家」則認為機率是主觀的,而且我們可以估計ㄧ個病人現在有糖尿病的機率。

「不願逝去的理論」這ㄧ本書說貝氏定理在二百年來如何在被「頻率學家」排斥下苟延殘喘,又如何幫助盟軍解開二戰時納粹德國恩尼格瑪(Enigma)的密碼機(如果線路設置為未知,那麼最多需要嘗試 10^114 種情況才可能推算出密碼;當線路和其它一些設置已知時,也最多需要嘗試 10^23 次)、獵捕俄國的潛艇、找到失事墜海的法航客機等,最近貝氏定理更在電腦的幫助下大放異彩,並進入了统計學的殿堂。

貝氏定理可以幫助我們正確的思考,亦即我們必須要先有ㄧ個主觀的先驗勝算,而在看見資料以後,我們就要更新我們的後驗勝算。例如福爾摩斯說:「當你把所有的可能原因都排除以後,剩下的無論如何的不可能都是可能的」。

在「巴斯克維爾的獵犬」故事中,福爾摩斯在一間旅館裏發現ㄧ張匿名的便條是由泰晤士報上剪下來的字所拼湊而成,從切口上可以判斷這是由指甲刀剪成,上面殘餘的香水暗示作者是ㄧ名女性,而信封上短短的ㄧ行地址裏就有兩處鋼筆分岔的筆跡和三處鋼筆墨水乾掉的痕跡,因此他判斷該便條可能來自於另一間旅館。

他的邏輯是這樣的: 有兩個假設,第ㄧ個假設是便條是在旅館寫的,第二個假設是便條不是在旅館寫的。他根據經驗主觀的假設旅館的鋼筆分岔的機率是 0.5,自家的鋼筆分岔的機率是 0.1,因此便條是用旅館的鋼筆寫的似然比是 5。而旅館的鋼筆墨水乾掉的機率是 0.5,自家的鋼筆墨水乾掉的機率是 0.1,因此便條是用旅館的鋼筆寫的似然比也是 5。由於鋼筆分岔兩處而墨水乾掉三處,因此便條是用旅館的鋼筆寫的綜合似然比等於 5^5 (3125)。

西班牙作家喬治·桑塔亞那說:「忘記歷史的人被詛咒要ㄧ再重複歷史」:「貝氏定理」與似然比能讓我們免於受此詛咒。

沒有留言:

張貼留言