數據挖掘技術在醫院科研信息服務
中的應用探討
◆梁 瑜 洪嘉銘 鄺國庭z 廣東省肇慶市第一人民醫院 中山大學腫瘤防治中心圖書館
摘要文章概述了數據挖掘技術的概念,闡述了數據挖掘技術在醫院醫學科研信息服
務中的重要性。數據挖掘技術在了解醫學科研的屬性;確定研究課題;充分利用數據倉庫的
數據;挖掘醫學科研所需的信息等方面有重要作用。
關鍵詞數據挖掘技術 醫院 科學研究 信息服務應用
Di SCUSSion on application of data mi ni ng technology i n i nformation services of
hospitaI SCience research
LIANG Yu.HONG Jia-ming(Information department of the First People。S Hospital of
Zhaoqing, Zhaoqing 526021, Chinah
KUANG Guo—ring(Library of the TuII10Ur Preven tion and Cure Cen ter of zhongshan
Eniversity,Guangzhou 51o06o)
Abstract: ThiS paper introduced the concept and connotation of data mining
technology. DiSCUSsed the Significanoe of data mining technology in information
services of hospital SCience research. Data mining technology had very important
effect in comprehending the attribute of medical SCience research, confirming
research task, util iZing data of data warehouse suffiCiently, and mining infor—
mation that was needed by medical SCience research.
Key Words:Data mining technology; Hospital;Science research; Information:
Service:Appl ication
當今信息技術發展很快,在整個國際互聯網里 (Knowledge Di Scover Database,簡稱KDD)
面其實就是一個大型數據庫,在這個數據庫里面就 等。數據挖掘需要挖掘出大量數據背后隱藏的規則
有當今最新和最快的信息。但是, 網絡的信息是 和模式,從而預測未來的趨勢。是一種決策支持
海量化、無序化和開放化的,要在這個信息的海 過程,它主要基于人工智能、機器學習、統計學
洋里找到有用的信息,尤其是有關醫學科研方面的 等技術,高度自動化地分析原有的數據,做出歸
信息,是很困難的。因此,數據挖掘技術應運而 納性的推理,從中挖掘出潛在的模式,預測科研
生,成為了在網絡環境下利用信息的主要技術手 動向,為醫學科研提供服務。
段,而利用這些信息的方法就是數據的重新發現, 2 數據挖掘技術在醫院科研信息服務中的重要
是數據的挖掘。
1 數據挖掘技術的概念
數據挖掘技術的研究始于從數據庫發現有用的
性
醫學科研在一個醫院里是一項很重要的工作,
它關系到醫院的發展和醫學技術的提高,也關系到
模式這一概念,并先后有不同的術語,如數據挖 醫院的工作人員在醫學領域的地位和聲譽。醫學科
掘(D a t a m i n i n g)、數據庫知識發現 學研究與論文寫作是醫學工作者的必經之路。醫學
維普資訊 http://www.cqvip.com
INE & ltEALTt{GUIDANCE NEWS
人類疾病的發生、發展規律,最
臨床醫療,而這一目標的實現就
必須以文獻的形式將自己的研究成果公之于眾,使
之成為人類共同的財富,從而服務于人類。醫學
科學研究與論文寫作作為一門方法學,涉及的內容
廣泛,知識面很寬。要組建一個科研課題,并將
其開展實行是一個具有專業性和科學性的過程,在
這個過程中要搜集和整理了大量有關資料。這些資
料的來源必須要從各方面去搜集。主要的渠道是:
臨床應用、資料文獻、網絡等,而最快、全面
的渠道可以說是網絡了。在網絡上搜集資料的方法
有很多種,主要的方法是:1、基于wED技術的
網絡搜索;2、基于搜索引擎的技術方法;3、基
于數據庫的技術方法。
3 數據挖掘技術在醫院科研信息服務中的應用
醫學科研對于綜合醫院和專科醫院都非常重要,
如何利用現代的信息技術去進行科學研究是一個很
重要的課題,特別是醫學方面的研究,本院圖書館在
這方面進行了一些嘗試。以下是把數據挖掘技術應
用在醫學科研方面的幾點心得
3.1 了解醫學科學研究的屬性,確定課題。
醫學科學研究與其它自然科學研究一樣,是認
識客觀事物,探索未知的認識過程。它是研究人體正
常生理、病理、健康與疾病的科學。其任務是要揭示
人體生命本質與疾病發生、發展的現象和機理,認識
人與環境的相互關系、健康與疾病相互轉化的客觀
規律,用理性的方法去整理感性的材料,從而為防治
疾病,提高健康水平提供技術、方法和手段。由于醫
學研究的對象是人而不是物,不僅有生理活動,還有
心理活動和明顯的社會性,所以研究方法的要求就
更高更嚴了。要確定醫學研究的課題,是非常關鍵的
環節。因此,搜集可靠資料,進行分析、綜合、演繹、
歸納、判斷、推理,獲得理性認識。如基礎醫
強詛玨
學和部分臨床醫學方面的研究均屬此類。運用網絡
的搜索引擎技術是基于www的數據挖掘技術,是目
前最常用的網絡查詢系統。www搜索引擎按組織和
結構體系可分為三種:分類搜索引擎(YahOO,
Bai du,搜狐等)、全文搜索引擎(A1taVi Sta,
Loycas,Infoseek,Weberaw1 er等)、多元搜
索引擎(A1 1一In—One)等。例如要進行基礎
醫學方面的科學研究,可以進入百度網站,進行
有關基礎醫學的資料搜索,就可以找到有關醫學基
礎研究方面的資料,如:“抗DNA酶B與小兒急
性腎小球腎炎的關系”、“ACE基因多態性與原發
性高血壓關系的研究99 9“高血壓相關基因hrg一1
對血管平滑肌細胞周期蛋白E和P27蛋白表達及細
胞增殖的影響”等。通過資料的搜索,再結合實
際就可以有目的地確定有關基礎醫學研究的課題。
3.2 應用數據挖掘技術,充分利用數據倉庫
的數據
醫學研究有各種類型,如基礎研究、應用研究
與發展研究,其研究方法與程序有各自的特點,但就
整體而言,又都有共同的基本程序。可歸納為五個環
節, 研究問題的提出一假設的建立與設計一科學
實驗與驗證一實驗結果的分析、綜合與處理一建立
新的理論或實際應用與推廣。其具體步驟可為研究
課題的選定一在搜集閱讀文獻與調查研究的基礎上
提出科研設計與假說-*N訂科研計劃一進行實驗與
觀察一搜集科學數據與感性材料,整理加工及統計
處理一科學抽象與概括,形成科學概念和結論一總
結經驗,撰寫論文并發表,鑒定成果與推廣應用。根
據醫學科學研究的基本程序和具體的步驟,進行醫
學科學的研究都要經過數據的搜集和分析的過程,
因此,應用數據挖掘的技術可以在醫學研究的領域
上發揮作用。例如在基礎研究方面,可以利用基于
數據庫的技術,把醫學方面的基礎數據制作成數據
維普資 |
|