摘要随着信息化的迅猛发展,各医院都在建立自己的信息系统,数据库规模不断扩大,复杂程度日益增加,从大量的数据中提取有用的信息供医院的决策服务就显得尤为重要。目前医院信息系统(HIS)的实现,绝大部分采用的是传统数据库技术,数据处理以操作型处理为主,即联机事务处理(OLTP)。尽管产生了大量的业务数据,但真正对决策有用的信息却很少,而且也造成了历史数据和当前数据、操作数据和分析数据的利用与管理的冲突。为了解决这一问题,数据仓库技术应运而生。北京肿瘤医院有其自身的特殊性,治疗上不同于其它医院,因此对于信息统计、分析和管理决策上有其特殊要求。本论文以『F在建设的肿瘤医院数据仓库为例,首先介绍了数据仓库(Dw)和数据挖掘(DM)在肿瘤医院应用课题的来源;其次,阐述了数据仓库和数据挖掘的基本概念,数据挖掘的方法、算法,还有数据挖掘、在线分析(OLAP)和决策支持(DSS)的差异。最后,介绍了肿瘤医院数据仓库建立和应用的全过程。包括阐述了医院信息系统(HIS)的基本概念、医院分析数据的历史方法及医院信息管理中存在的问题。肿瘤医院HIS数据库的结构设计,数据仓库建立过程中的数据准备,数据仓库的架构、存储,维度和粒度设计,主题抽取和确定,建立多维数据模型及多维数据分析,数据仓库和数据挖掘的主要功能及医院实际应用。关键词:医院信息系统;数据仓库;数据挖掘AbstractWiththefastdevelopmentofinformationtechnology,hospitalshaveestablishedtheirowninformationsystems.Andthescaleofdatabasehasbeencontinuouslyextendingandthecomplexitybeendramaticallyincreasingsincethedaythesystemwasbuilt.Underthiscircumstance,toselecttherightinformationfromamassofdataforthehospital’Sdecision—makingisofutterimportance.Thesedaysthetraditionaltechnique,namelyOn—lineTransactionProcessing(OUTP),istheprimarywaytorealizetheHospitalInformationSystem(HIS).Althou曲alotofdatacanbeacquiredbythisway,fewofthemareusefulformakingdecisions.What’Smore,intermsofutilizationandmanagement,itcausestheconfusionbetweenhistoricaldataandcurrentdataandtheconflictbetweenoperationdataandanalysisdata.Tosolvethisproblem,thetechnologyofDataWarehouse(DW)emergesasthetimesrequire.Comparedwithotherhospitals,BeijingCancerHospitalhasitsownparticularity,adoptingdifferentmethodsintreatments.Forthisreason,ithassomespecificrequirementsonthestatistic,analysisandmanagementofinformation.ThispapertakesthedatawarehouseofBeijingCancerHospital,whichisbeingestablished,asanexampletointroduce:firstly,theoriginofDataWarehouse(DW)andDataMining(DM)intheapplicationsubjectsofthecancerhospital;Secondly,thefundamentalconceptofDWandDM,themethodandarithmeticofDM,andthedifferenceamongDM,OLAPandDSS;lastly,theentirecourseabouthowthewarehousewasestablishedandused,includingthebasicconceptofHIS,thehistoricalmethodofanalyzingdata,theproblemsinvolvedinthemanagementofinformation,thestructuredesignofthewarehouse,datapreparationdudngtheestablishingperiod,theframeworkandstorageoftheDW,designofdimensionalityandgranularity,abstractingandconfirmingsubjects,buildingmultidimensionaldatamodelandanalyzingmultidimensionaldata,themainfunctionofDWandDMandsomepracticalusesinhospitals.KeyWords:HospitalInformationSystem;DataWarehouse;DataMining图2.1多维立方体………………………………………………………………9图2.2企业中数据仓库结构……………………………………………………10图2‘3大肠癌的决策树示意图…………………………………………………13图3.1医院信息化的层次………………………………………………………20图3.2医院HIS中四个表的关系图……………………………………………25图3‘3数据仓库所需要的4个表的关...