分類預測只適合於確定或是高訊息-雜訊比的事件,例如:模式識別(文字語言識別、圖像識別等);機率預測則適合於隨機或是低訊息-雜訊比的事件,例如:氣象預報說:「明天降雨的機率是 30%」,至於是否要帶雨傘的決策則決定於你自己的功利(避免淋雨就能避免感冒、不舒服和不方便等)和損失(花錢買雨傘、雨傘佔去了行李箱的空間等)。例如:醫學診斷上預估某病人有肺癌的機率是 30%,那麼是否要做肺切除手術的決策是決定於該病人的功利(預防肺癌擴散或轉移、延長生命等)和損失(非癌症、手術併發症等)。
醫學診斷不適合用分類預測(例如:正確性、敏感性、特異性、接收者操作特徵曲線等),因為它們會隨著情境(例如:病人族群特色、疾病盛行率等)而改變。例如:假設某族群有某病的盛行率是 0.1%,那麼只要把每一個人都分類成「沒有病」,那麼該方法的正確率就會高達 99.9% 了,但是該方法無法適用於該病的盛行率是 10% 的族群;另外分類是硬把機率分為「有病,機率是 1.0」(例如:機率大於 0.5)和「沒病」(例如:機率小於 0.5,機率是 0),亦即硬把一個平滑的機率曲線變成一個二階(有、無)的階梯。可見分類是一個不適當的計分法,亦即操縱系統可以影響它的預測準確度。
「計分法」測量對類別變項機率預測的準確度,目的是最小化「損失函數」(衡量預測與實際的不一致帶來的損失)。分類正確的功利(utility)有兩種:把有病的分類成有病(敏感性)的功利、把沒病的分類成沒病(精確性)的功利。分類錯誤的損失有兩種:把有病的分類成沒病的損失、把沒病的分類成有病的損失。適當的計分法(例如:邏輯迴歸的 Brier 得分)無論在任何情境下都能最大化預期的報酬(功利減損失)。
真陽性(TP,敏感性、召回率):在有病的人中該檢驗陽性的比率
假陽性(FP):在無病的人中該檢驗陽性的比率
真陰性(TN,特異性):在無病的人中該檢驗陰性的比率
假陰性(FN):在有病的人中該檢驗陰性的比率
正確性:(TP + TN)/(TP + TN + FP + FN)
陽性預測率(精確率):在檢驗陽性的人中有病的比率(TP/[TP+FP])
陰性預測率:在檢驗陰性的人中無病的比率(TN/[TN+FN])
精確率-召回率曲線:曲線下面積愈高愈好。橫軸是精確率,縱軸是召回率(TP),精確率愈高,召回率愈低。
接收者操作特徵(ROC)曲線:曲線下面積愈高愈好。橫軸是 FP,縱軸是 TP,FP 愈高,TP 愈高。ROC 曲線不適用於不平衡(例如:疾病的盛行率很低)的資料。
Casino Near Me - Mapyro
回覆刪除Find Casino Near Me, TN driving directions, reviews and information. Casino. Casinos 제천 출장마사지 Near Me, 이천 출장안마 TN. Mapyro, 군포 출장마사지 NC. 1 공주 출장안마 Highway 39, 화성 출장마사지 1.2 km from Casino.