2019年2月17日 星期日

「給力」與「不給力」

在統計中,第一型錯誤是在虛無假設為真時你卻拒絕它,一般我們會把犯第一型錯誤的機率(α)定為 0.05。P 值是在虛無假設為真時出現比該資料更極端值的機率,但不是犯第一型錯誤的機率,也不是虛無假設為真的機率(因為我們已經事先假設虛無假設為真了)。

第二型錯誤是在虛無假設為假時你卻接受它,一般我們會把犯第二型錯誤的機率(β)定為 0.2,1-β (0.8)稱為「統計檢定力」。統計檢定力決定於:樣本大小(愈多則愈高)、效果量(愈大則愈高)、測量的正確性(愈正確則愈高)、使用的統計方法。大部分的臨床研究樣本數都是少的,因此具有低的統計檢定力(統計檢定力平均只有0.2)。一般人以為低的統計檢定力比較容易犯第二型錯誤(亦即增加假陰性率),其實它另外有三個壞處:

第一是增加資料的變異性:亦即減少資料的精準度。

第二是高估效果量:樣本數少會減少點估計(效果量)的正確度,其中只有效果量被高估的才能達到 P < 0.05 (因為資料的變異性增加),此稱為「贏家的詛咒」(在競標中,出價最高者得標,因此贏家的得標價經常會超過這個物件的真實價值)。例如在「全基因組關聯分析」(數百萬個基因多型性)的研究中,我們只會注意有意義的結果(稱為「確認偏誤」),亦即只有挑選最大的差異。

第三是增加「假發現率」(在 P < 0.05 的結果中犯錯的機率,亦即假陽性率)。例如:有 1000 個研究,如果虛無假設為假的先驗機率為 0.5,那麼有 500 個研究的虛無假設為真,如果我們把 α 定為 0.05,那麼其中有 475 個研究結果是正確的,但是有 25 個研究結果(5%)誤認為假。另外有 500 個研究的虛無假設為假,如果統計檢定力是 0.8,那麼其中有  400 個研究結果是正確的,但是有 100 個研究結果(20%)誤認為真,因此在 425 (400  + 25)個有陽性發現(亦即拒絕虛無假設)的結果中,有 25 個(5.9%)是錯誤的,亦即假發現率是5.9%。如果統計檢定力是 0.2,那麼其中有  100 個研究結果是正確的,但是有 400 個研究結果(80%)誤認為真,因此在 125 (100  + 25)個有陽性發現(亦即拒絕虛無假設)的結果中,有 25 個(20%)是錯誤的,亦即假發現率是 20%。

因此我們做事情要「給力(夠力、帶勁、酷)」,做研究也要給力。

沒有留言:

張貼留言