基于雙樹復數小波和最大似然規則的MR圖像檢索
王文輝① 鄭小云①
①中山大學附屬第六醫院,510655,廣州市天河區員村二橫路19 號
摘 要 基于內容的醫學圖像檢索具有重要的臨床意義,本文基于最大似然規則,推導出基
于概率密度和K-L 測度的圖像檢索方法,以此為指導,采用雙樹復小波對圖像進行二階分解,
對所得的12 個子帶圖的小波系數的直方圖進行廣義高斯密度模型的參數估計,以得到的12
組參數作為圖像的紋理特征,用K-L 距離作為相似性測度進行圖像檢索。實驗證明本文算法
能較好的檢索出相似疾病的MR 圖像。
關鍵詞 圖像檢索 雙樹復小波 最大似然規則 紋理特征 K-L距離
1 引言
醫學圖像如CT、MRI、SPECT、PET 等包含了豐富的信息,為臨床診斷提供
了重要的依據,是重要的診斷信息資源。在對未確診臨床圖像進行診斷和在教學
瀏覽研究中,若能通過檢索技術找出和該圖像內容基本相同的各種模態已診斷圖
像,將大大提高臨床診斷的可靠性。因為醫生的診治知識源于臨床和教學,對于
一個新病例,如能及時提供過往其他同類病人的不同影像信息以佐診斷與治療,
顯然意義深遠。
目前廣泛研究并部分應用的醫學圖像歸檔與通信系統(PACS)已成為放射信
息系統(RIS)和醫學信息系統(HIS)的核心部分。目前PACS 系統的功能主要集中
在醫學影像數據的存檔、傳輸、共享及壓縮方面,而PACS 的信息搜尋方式較為
落后,基本上采用圖像加注關鍵字串的模式。這種搜尋方式在醫生的回溯診斷中,
即醫生在患者治療一段時間后,需要找出患者治療前的同類影像資料以供分析
時,應是簡易可行的。雖然這部分關鍵字信息通常已經包含在DICOM 文件頭中,
并且現在很多設備已經是遵從DICOM 標準,但是仍然存在許多問題。DICOM 文件
頭已經證明會包含相當高的錯誤率,以其解剖區域字段為例,據報道存在16%的
錯誤率。
因而,隨著醫學成像技術的迅猛發展和PACS 系統的普及,基于內容的圖像
檢索(CBIR)將作為PACS 系統的重要功能發展,勢必將成為從海量醫學圖像數據
庫中檢索圖像的一種重要手段。
2 基于最大似然規則的圖像檢索
在CBIR中,從具有M 個圖像的數據庫中選擇N ( N << M )個與查詢圖像最相
近的圖像可表達為為一個多重假設問題。查詢圖像q I 在前處理(特征提取)階段
被表示為數據集1 2 ( , , ) L x = x x Lx , 在數據庫中的每一個候選圖像i I ,i =1,2LM ,
被賦于一個可能相似的假設i H 。CBIR 的目標就是從M 個可能的假設
1 2 { , , , } M H H L H 中選擇N 個與x最相近的圖像。選擇N 個最相近的圖像,可采用
遞歸法。即先從M 個假設中選擇最好的一個,再從剩下的(M -1)個假設中選擇
最好的一個,如此遞歸N 次。最初每個圖像被賦于相同的先驗概率,在每次遞
歸中,以最小可能錯誤準則,選擇具有最大似然估計的假設圖像。
即最大似然選擇規則。表示為公式為:
1 2
( | ) ( | ) ( | ) ( | ) ( 1,2 )
k k kN i j p x H ³ p x H ³Lp x H ³ p x H i ¹ k j = LN (1)
然而,在M 個圖像中遞歸N 次如此大的計算代價使得該方法不切實際。則
采用一種近似方法,用概率密度函數(PDF) ( | ) i p x q 來近似模型條件概率密度函數
( | ) i p x H , i
q 表示模型參數。有了這樣的設置,被估計的模型參數ˆ
i q
即為圖像i I
抽取的特征。考慮查詢數據1 2 ( , , ) L x = x x Lx 為獨立同分布(i.i.d)的。對于具有
較大數量的圖像的數據庫,則最大似然查詢規則等價 |
|