假設有一個人在 10 秒以內跑完 100 公尺,你會覺得很驚訝,假設他背著一個很重的背包,你會覺得更驚訝,因為你認為如果沒有背包,他應該會跑得更快。假設有ㄧ個充滿雜訊的研究發現 P < 0.05,你是否會認為假設沒有雜訊,他的研究應該會更有意義?
所有研究的目標都是要找出隱藏在雜訊中的訊號,測量誤差是一種很重要的雜訊。所有的測量都有測量誤差,包括系統誤差(又稱「偏誤」,亦即測量方法本身的錯誤,每一次的測量都會有可以預測的同樣錯誤)和隨機誤差(無法預測的變異性)。
大部分的臨床研究都是用小樣本,小樣本及測量誤差都會增加變異性(或標準誤差),而差異值至少要大於二個標準誤差才會有 P < 0.05,因此小樣本的研究如果在許多個假設試驗中偶然發現了幾個 P < 0.05 (多重試驗),那麼這一些發現的差異值大部分是被高估的,這一種現象稱為「贏者詛咒」。
因此有高度雜訊或是有測量誤差的 P 值是不可靠的。
沒有留言:
張貼留言