存儲架構
8.1
存儲需求分析
基于健康檔案的區域衛生信息平臺建設中最關鍵的是數據。如何滿足區域衛生信息平臺的存儲需求,是我們必須考慮的問題。以下我們對區域衛生信息平臺中所涉及的存儲需求進行分析。
8.1.1
存儲的數據類型
在存儲架構的設計中,我們需要同時考慮健康檔案的數據存儲和區域衛生信息平臺的數據存儲。
健康檔案的存儲主要分成五種類型:健康檔案數據存儲(EHR Data Storage)、業務文檔數據存儲(Business Document Storage)、ODS數據存儲(Operational Data Store)、業務平臺數據存儲(Business Data Storage)、數據倉庫存儲(Data Warehouse)。
區域衛生信息平臺運行所涉及的支撐數據包括:標準數據、注冊數據、來自各POS的數據等。
1)、健康檔案數據
健康檔案數據(EHR Data Store)是區域衛生信息平臺的基礎。健康檔案數據不限定以關系型數據庫或文檔的存儲方式進行存儲,在存儲架構設計中應重點考慮健康檔案數據中不同數據存儲方式下的存儲、歸檔、檢索的效率,以及所涉及的數據備份恢復。
根據健康檔案信息的分類,健康檔案存儲服務分為七個存儲庫:個人基本信息存儲庫、主要疾病和健康問題摘要存儲庫、兒童保健存儲庫、婦女保健存儲庫、疾病控制存儲庫、疾病管理存儲庫以及醫療服務存儲庫。
2)、業務文檔數據庫
業務文檔數據庫指的是醫療活動產生的與EHR相關的文檔,這些文檔通過區域信息交換層(HIAL)傳送到區域衛生信息平臺。它需要平臺的專門服務解析和
670
映射(Parser/Map/Rebuilder),才能轉換成EHR文檔。平臺必須有一個永久存儲業務文檔庫的數據庫。
業務文檔以XML方式進行組織,與電子簽名相結合,在文檔庫中進行注冊。
3)、ODS數據庫
從業務支持的角度來看,我們需要建立ODS數據庫,來實現對業務的更好支持。為了完成某些特定業務上的流程要求,可能產生很多中間數據,而這些中間數據都有賴ODS數據庫實現其存儲方式。
4)、業務平臺數據庫
除健康檔案數據(EHR Data Store)之外,區域衛生信息平臺需要存儲一些相關的業務數據,并實現對這些數據的插入、更新、查詢和統計功能。業務數據主要包括以文檔形式存儲的結果數據,以及操作型數據。
文檔數據:以文檔形式存在于平臺中的臨床和預防保健業務數據,例如檢驗報告、處方、傳染病報告卡等。這些數據是結果數據。
操作型數據:從多個醫療機構內部信息系統中采集上來,并加以匯總處理后的數據,主要服務于統一的實時查詢和實時的統計。
5)、數據倉庫
主要是業務管理和輔助決策所需的支撐數據。這些數據是通過數據倉庫工具進行抽取、轉化和整理后存儲在數據倉庫中的。數據倉庫數據以主題方式組織,是經過二次加工的歷史數據。
6)、標準數據
標準數據是區域衛生信息平臺運行的數據基礎。標準數據包括區域衛生業務數據的所有數據標準規范,通過這個庫和數據校驗機制對數據中心的數據進行標準化保障,主要的數據標準包括整個定義電子健康檔案的數據集和數據元(具體可參考衛生部發布的中國健康檔案數據標準),還有各種代碼標準。由于數據標準存在著時效性,因此針對有時效性的數據進行版本控制,不同的版本有各自的生命周期,不同生命周期中的業務數據對應不同版本的數據。
在系統實現中,標準數據以XML template的形式或關系型數據的形式進行存儲。
7)、注冊數據
注冊數據是滿足注冊服務所需的數據及存儲。包括個人、醫療衛生人員、醫療
671
衛生機構、醫療衛生術語的注冊管理數據。
8)、區域信息交換層(HIAL)臨時存儲的交換數據
區域信息交換層(HIAL)將來自于POS的數據/文檔接入到平臺中進行處理。區域信息交換層(HIAL)將EHR數據/文檔發送到POS或其他數據消費方。這些數據/文檔在處理前將臨時存放在數據交換(HIAL)應用服務器或其他服務器。這部分數據的存儲要求有較高的I/O速度。
8.1.2
數據存儲的模式需求
對于基于健康檔案的區域衛生信息平臺來說,數據存儲模式是信息架構要考慮的一項重要內容。對于區域衛生信息的使用者而言,沒有必要關心數據的存儲模式。這比如大家從互聯網上查找新聞時,大家并不關心存儲這條新聞的服務器放在那個國家,也即不必關心數據存儲模式。但是區域衛生信息平臺的設計者,需要從經濟可行性、技術可行性和管理可行性方面去考慮選擇不同的數據存儲模式。
區域衛生信息平臺涉及到與居民健康相關的所有業務,因此其業務數據具有類型多、容量大的特點。數據存儲模式種類有以下三種:集中式、分布式和聯邦式。集中式:建設一個統一的數據中心,把一個區域內需要共享的數據集中全部存儲在數據中心。分布式:一個區域內沒有統一的數據存儲中心,數據可以分散在不同的機構和地點。例如,某個患者需要訪問上個月做的X光檢查資料,區域衛生信息平臺會將該患者的訪問需求轉移到他上個月去的醫院的系統,將存儲在該醫院的數據提供給患者使用。所謂聯邦式是集中與分布相結合的數據存儲模式,對于用戶經常訪問的數據集中在數據中心,其余分散在不同地點或機構。
根據業務數據的特點,對數據存儲的要求也不盡相同。我們對這三種數據存儲的優劣勢以及數據分布的分析如下:
表8-1 數據存儲的優劣勢以及數據分布
數據存儲模式
優點
缺點
數據分布
集中式存儲方式
效率高且方法簡單
但擴展性和靈活適應性受到一定局限
在本系統建設中,對于居民基本信息(包括姓名、性別、出生年月、身份證號、社會保險號等),由于其使用頻率高,數據容量相對較小,可采用數據中心集中式存儲的
672
方式;對于公共衛生信息,如疾病預防數據、婦幼保健數據、精神衛生數據,則采用中心集中存儲的模式,這樣可以保證該類數據的安全性。
分布式存儲方式
一般說來效率較低,技術實現復雜
擴展性和靈活性有很大優勢
在本系統建設中,對于醫學影像信息,其數據量大,可采用分布式的存儲模式,這類信息通過注冊到區域衛生信息平臺,當醫療機構需要調閱時,可通過平臺查詢獲取數據所存儲的地址(一般為某醫療機構),再從目的地獲取所需要的信息。這樣既減輕了平臺的負載,也提高了數據的調閱效率,但缺點是對醫療機構之間的網絡要求較高,區域范圍內各醫療機構之間必須是雙向網絡,而且需要保證一定的帶寬。
混合存儲方式(聯邦式)
結合以上兩種模式的優點
對于其他業務數據(如實驗室檢驗數據、就診記錄數據),則可以根據實際的業務需求,采用分布式存儲+集中式存儲的混合模式。
總的來說,區域衛生信息平臺存儲架構設計中應考慮支持這三種架構來實現數據存儲。
8.1.3
數據存儲的安全需求
在存儲設計中,應考慮數據存儲的安全需求。由于數據不限定以關系型數據庫或文檔形式進行存儲,需要建立安全控制機制,對存儲的數據對象訪問進行授權。對于存儲在數據庫中的數據,除了授權機制之外,應考慮視圖級安全和記錄級安
673
全控 |
|