綜合性醫院住院者年齡分布特征的探討
宇傳華1 余松林1 徐勇勇2
【提 要】 目的 探討醫院住院者的疾病種類、住院費用、住院天數的年齡分布特征。方法 采用共計55萬余住院者的綜合性醫院病案首頁數據庫數據,以入院日期與出生日期來計算每一住院者的實足年齡,按出院第一診斷的ICD-9編碼進行疾病分類。結果 住院者年齡分布曲線存在一個低谷和四個高峰;除20~49歲年齡組外,其余年齡女性住院者比率均低于男性;腫瘤、循環系統疾病等住院者人數隨年齡變化具有特定的分布特征。結論 病案首頁數據庫數據蘊藏著豐富的信息,是疾病統計的寶貴資源。用它來探討住院者年齡分布特征具有一定的合理性。
【關鍵詞】病案首頁數據 數據挖掘 年齡分布特征 ICD-9
人的一生中難免生病住院,隨著年齡的變化,在生命的長河中哪個年齡段需要住院就醫的可能性較大?對于不同疾病、不同性別等,哪個年齡段的住院者會更多?人均住院費用與人均住院天數如何隨年齡的改變而改變?帶著這些問題,本研究對1995~2002年之間31所綜合性醫院的55萬余住院者病案首頁數據進行了分析。
數據來源與研究方法
1. 數據的來源
本研究采用了四個住院者病案首頁數據庫,廣東省數據來自廣州市2所綜合性醫院,省級與區級醫院各1所,住院者為1996~2000年所收治的患者;中西部地區數據來自中西部兩大軍區所屬的26所醫院,其中3所為軍區總醫院,10所為中心醫院,13所為駐軍醫院,住院者為1996年全年所收治的患者;江蘇省數據來自該省1所綜合性市級醫院,住院者為1995~1998年所收治的患者;陜西省數據來自該省某醫學院校兩所教學醫院,住院者為2001~2002年所收治的患者。具體所收治的患者人數見表1。
表1 四個病案首頁數據庫的住院者人數
性別
廣東
中西部
江蘇
陜西
合計
男
61250
108125
20021
123359
312755
女
62534
69968
14474
92263
239239
合計
123784
178093
34495
215622
551994
2. 年齡的計算
按以下公式計算住院者的實足年齡(歲): int[(365.25]年齡=入院日期-出生日期)
其中,int表示對括號內數據取整數,一年按365.25天計算。0歲表示從出生到不滿1周歲,依此類推。按每1歲清點住院者人數,某歲住院人數與總住院人數之比值與100的乘積稱為住院者比率(%)。
3. 疾病的分類
按病案首頁數據庫中出院第一診斷的ICD-9編碼進行疾病分類,具體分類方法見表2。
4. 統計軟件
采用SAS軟件編程計算與分析有關數據。
結果與分析
1. 四個數據庫住院者的年齡分布
對于四個病案首頁數據庫數據,在同一張圖中各繪制一條住院者的年齡分布曲線,獲
1華中科技大學同濟醫學院公共衛生學院流行病與衛生統計學系(430030)
2第四軍醫大學預防醫學系衛生統計學教研室(710032)
1
中國衛生統計,2005,22(6):373-376
得的圖形見圖1所示。盡管四條曲線的分布各有所不同,但其總的趨勢具有類似的規律,即曲線存在一個低谷和四個高峰。低谷出現在10~19歲年齡組,這一年齡組的住院者相對較少,反映了此年齡段是人生中的最“健康”時期。與廣東和江蘇病案首頁數據庫相比,中西部和陜西的低谷年齡略有所左移,這可能與住院者身份(如軍人)、地域經濟等因素有關。第一個高峰出現在0歲,在廣東、中西部、江蘇和陜西數據中,該年齡的住院者比率分別為4.85%、2.00%、3.90%和3.22%。第二個高峰是20~29歲年齡段,造成這一高峰的主要原因是女性妊娠分娩。這一高峰的位置及變化幅度對于不同的數據庫略有所不同,特別是中西部和陜西數據庫,這是因為這些醫院的服務對象主要是軍人,所以該年齡段有兩個峰值,前一個峰為男性軍人住院者所致,后一個峰為女性妊娠分娩住院者所致,如果按性別進行分層分析,可清晰看到這一結果。第三個高峰在45歲左右,該高峰較小,導致該峰的可能原因是:該年齡段人群負擔較重,且處于生理更年期階段。第四個高峰在60~69歲年齡組,此年齡處于人生的衰老階段,致使該年齡組住院者比 |
|