2017年11月18日 星期六

模型:解釋 vs. 預測

研究的性質:假設驅動性 vs. 探索驅動性
有理論  vs. 無理論
研究的目的:「我們能做什麼事? 」 vs. 「會發生什麼事?」
統計 vs. 資料科學、機器學習、人工智慧

回溯性(過去與現在 )vs. 前瞻性(未來)
因果關係  vs. 關係
無偏差 vs. 低誤差(有時候我們必須要犧牲偏差來換取低變異性與低誤差。誤差 = 偏差 + 變異性)
實驗性資料(例如:臨床試驗)  vs. 觀察性資料(例如:病例-對照研究、世代研究、二次分析、資料庫研究)
小樣本  vs. 大樣本

模型的選擇: 理論 vs. 預測力
模型的評估: 信度(與模型假設的適合度《殘差常態分佈、線性、殘差均齊變異性、獨立性》、模型設定正確《無缺失變項、無多餘變項》、無多元共變性、無異常值、自變數無測量誤差、固定的自變數)與效度(與理論的適合度)  vs. 模型對未見過資料的預測力
變數少  vs. 變數多
變數的選擇:理論 vs. 演算法
變數的評估:信賴區間及 p 值 vs. 預測力

「為什麼一隻公兔和一隻母兔放在一起會生下小兔子?」 vs.「如果我們把一隻公兔和一隻母兔放在一起,那麼不久之後就會有一群小兔子」

能解釋的因子不一定能預測,能預測的因子不一定能解釋。

沒有留言:

張貼留言