基于DeepSee的醫院藥庫數據挖掘
虞海燕①,李勁松①,曹淑真①,韓雄②
①浙江大學數字化醫療工程研究中心,310027,杭州市浙大路38 號
②南京軍區衛生部信息中心,,
摘 要 醫院的信息統計工作是醫院經營管理的重要組成部分,而醫療行業數據關系具有其
復雜性和特殊性,這決定了對數據處理的繁雜性。本文利用嵌入式實時挖掘工具DeepSee
對醫院HIS 數據庫中的數據進行處理,以藥庫為主題建立模型,從出庫趨勢、庫存量、庫
存單位盈利和廠商盈利四方面進行挖掘分析,為醫院管理者提供管理和經營決策支持。
關鍵詞 數據挖掘 DeepSee HIS 數據庫 藥庫
1 引言
HIS 數據庫包括了醫院所有的與收費有關的醫療活動,如各種檢查、化驗、
醫治、用藥、護理以及床位、耗材等紀錄。因此數據挖掘在醫院信息系統中的應
用主題是多方面的。HIS 數據庫中存儲了各種臨床和管理信息,這些都可通過數
據挖掘,提供決策支持。
藥庫作為醫院藥品的主要貯備場所和供應基地,對于保證醫院用藥安全、有
效和充足,起著舉足輕重的作用;藥品收支核算的正確與否直接影響著醫院的經
營成果,因而加強藥品的進、銷、存各環節的財務管理,對提高醫院的經濟效益,
促進醫院穩定發展具有重要意義。本文使用數據挖掘方法對醫院HIS 數據庫中的
藥品數據進行統計分析,為藥劑部門乃至醫院管理層提供決策支持。
2 材料和方法
2.1 挖掘理論 醫療行業有大量數據需要處理,但由于不同的信息系統管理中數
據以不同的格式保存,數據在總體上是無組織的。因此,醫療數據挖掘最關鍵的
任務是進行數據清理,然后對預處理過的數據進行轉換,尋找有用的特征表示依
賴于任務目標的數據。整個挖掘過程也不是簡單的線性流程,可能包括了有效的
迭代,在任兩個步驟之間都有可能有循環。這樣可以對所挖掘的知識不斷求精、
深化,并使其易于理解[1]。
傳統的數據挖掘分析過程分為數據選取、預處理、數據轉換、對數據模型進
行挖掘和評價,本文使用InterSystems 公司的BI 工具DeepSee 對醫院HIS 數據
進行挖掘分析(圖1)。DeepSee 相對傳統數據挖掘工具的特點是嵌入式實時挖掘,
能夠隨時對醫院信息系統中的海量醫療數據進行實時處理,生成報表并統計分
析,為醫院經營者提供管理、經濟和臨床等多方面的信息和報表,為領導決策和
臨床醫療決策提供支持 [2-3]。
Embedded Real_Time
Data Minining
doctors
managers
HIS
Data base
application
knowledge
data miner
decision-making support
guideline
圖1 嵌入式實時挖掘過程
2.2 挖掘實例 首先,根據分析主題確定維度、相關指標和數據來源。本文以藥
庫為模型,對浙江省某醫院2001 年至2005 年間的HIS 數據進行挖掘分析。根據
藥庫主題確定維度和數據來源等(見表1)。
表1 以藥庫為主題的維度表
主題 藥庫分析
維度 日期維(時間段,日,周,月,季,年)
相關指標 藥品名稱,庫存單位名稱,期末庫存量,出庫藥品出入盈虧,庫金額,
廠商
數據集及
數據來源
(概要)
藥品字典:DRUG_DICT
藥品供應商目錄:DRUG_SUPPLIER_CATALOG
藥品結轉記錄:DRUG_STOCK_BALANCE
藥品庫存單位字典:DRUG_STORAGE_DEPT
數據詳細 藥品名稱:drugfk.DRUGNAME
藥品代碼:drugfk.DRUGCODE
出庫金額:EXPORTMONEY
期末庫存數量:INVENTORY
出庫藥品出入盈虧:PROFIT
出庫單位名稱:STORAGE.STORAGENAME
廠商:FIRMID.SUPPLIER
時間:YEARMONTH
(其中drugfk 為DRUG_CODE 和DRUG_SPEC 的foreign key)
在數據庫系統中根據數據 |
|