利用申康實際數據,用計算機模擬專家思維方式的標準化分型,實現所有申康病例的病例分型。
模型應用:先判斷病例為手術組還是非手術組,再將病例其他特征值代入所屬組的函數方程,計算出4個P值,哪個P值最大,就屬于哪種分型。
主要缺點:與專家“四型三線”分型的思維方式不完全符合,對病情是單純型,還是復合型未作考慮,仍有較大分型誤差
算法選擇:進行訓練數據分布特征的描述,根據數據分布選擇合適的回歸方法(線性回歸、嶺回歸、主成因回歸、Logistic回歸?)。
模擬檢驗:根據專家確定的病例分型、篩選的關鍵變量X,利用訓練數據和選定的回歸分析方法,進行12個函數方程的模擬,并進行檢驗。
回歸診斷:為提高模型擬合優度,避免參數估計偏差,進行回歸診斷,包括檢測異常點(嚴重偏離既定模型,即殘差較其他各點大得多的點)、高扛桿點(遠離設計中心的點)和強影響點(對既定模型有較大影響的點)。
|
|