國家衛生數據字典
(初稿)
衛生部統計信息中心
第四軍醫大學衛生信息研究所
目 錄
一、字典結構 1
1.元數據標識符 3
2.數據元表示形式 4
3.數據類型 4
4.數據格式 5
5.基本屬性描述 5
二、字典內容 7
附錄1 數據元條目(278個) 8
附錄2 代碼條目(85個) 28
附錄3 大型代碼表(20個) 35
附錄4 詞匯表條目(6個) 60
附錄5 數據字典應用實例-醫院出院病人數據庫結構 63
國家衛生數據字典(National Health Data Dictionary, NHDD)即元數據資源庫(Meta Data Repository),目的是為使用者提供數據元和描述數據元的元數據,是衛生信息系統和數據庫建設必須遵循的行業標準。
一、字典結構
根據元數據注冊國際標準,國家衛生數據字典具有8個基本結構,見圖1,其中最基本的結構是對象類、特性、表示。
對象類:現實世界中的想法、抽象概念或事物的集合,有清楚的邊界和含義,并且特性和其行為遵循同樣的規則,能夠加以識別和標識;
特性:對象類的所有個體所共有的某種性質;
表示:值域與數據類型的組合,必要時也包括度量單位或字符集。值域是數據元允許(或有效)值的集合。比如,表示醫生年齡的數據元可以用一個非負整數集(實際年齡,以年為單位)作為有效值集。另一種選擇是,把有效值用事先指定的類別清單表示,且每個類別都具有一個代碼值,如代碼值1(< 35歲),2(36~ 50歲),3(51~ 65歲),4(>65歲)。前者的值域是一個非窮舉域,后者的值域是一個窮舉域。窮舉域通常用編碼系統表示,如ICD-10編碼。ICD-10編碼是值域的一種分類模式。
數據集和術語(詞表)是國家衛生數據字典的附屬結構。數據集有兩個主要作用,一是用來表示需要用多個數據元表示的事務,如人的姓名的完全表示包括當前姓名、昵稱、化名、筆名、中文名、外文名、曾用名、曾用名使用時間、曾用名停用時間等;二是用來規范國家最小數據集,如出生登記最小數據集、死亡報告最小數據集等。術語(詞表)是供所有元數據條目參照、引用的規范詞匯。
對象類是我們希望用于收集和存儲數據的事物。對象類的例子有病人、醫生、護士和化驗單等。特性用來區別和描述對象的特征,如膚色、姓名、性別、年齡、職業、收入、住址等。另外,特性有可能需要用多個詞組加以描述,這要視所用的自然語言而定。對象類和特性的組合稱為數據元概念(DEC)。數據元概念是能以數據元形式表示的概念,其描述不包括任何具體的表示。例如 “醫生年齡”就是對象類+特性構成的一個數據元概念,對應了兩種表示:實際年齡或年齡組。因此,數據元的構成可表達為:
|
|