千里马招标网www.qianlima.com中国招标行业门户网站一、技术(服务)要求(一)技术要求、建设目标在以服务科研工作为主导的原则下,基于高性能大数据软硬件设施,构建标准化、专业化、柔性化的科研数据服务应用平台。利用大数据技术,满足不同层级用户的需求。通过对临床诊疗数据,科研数据的挖掘整理,建立具有多层次的知识库体系,为开展队列研究、大数据分析、精准治疗方案研究提供技术支持。建成大规模临床结构化数据、不同层次组学数据的整合技术体系,建立管理、注释、比较、检索和展示数据与临床信息的应用技术系统,具有长期稳定的云计算存储与计算资源支持。为医疗科研数据提供存储、共享、应用和推广。为了建设适用科研数据中心,因而按照医疗需求建立合理的完整的正确的数据库是项目的核心,只有拥有了高质量的数据基础,才可能开展有深度有高度的数据分析、挖掘以及人工智能,深度学习等方面的相关工作。整理好数据与应用整理好的数据产生某种结果是两件不同的事情,两者相辅相成,互为促进。本项目科研数据中心的建立本质上是整理好数据,而基于整理好的数据可以做大量甚至海量的课题研究,因而科研数据中心的建设及其应用是一个持续开展,持续建设的项目,未来需要与一个个医疗科研项目和课题结合去共同产生科研价值。、建设原则为确保本项目建设能够充分满足实战的需要,实现效益的最大化,系统的建设将需遵循以下设计原则进行项目的建设:安全性、可靠性、操作友好性、可扩展性、可维护性、高效性。、系统架构.系统采用JAVA或Python等语言开发。.系统采用B/S或者C/S多层架构,即交互层-业务层-中间层-数据库分离的N层架构模式。.支持MySQL、MongoDB等主流关系型数据库和非关系型数据库存储。.支持数据缓存,实现常用数据实现“秒”加载。.支持服务程序热更新,可实现服务不停机的前提下增加新的功能模块。.采用基于消息队列的机制,实现系统内的消息正确传递。、硬件设备本项目为软件开发项目,项目硬件部分由深圳市第二人民医院自行提供统一的部署、运维和保障服务,即硬件设备不在本项目采购范围内。千里马招标网www.qianlima.com中国招标行业门户网站、数据标准本项目需依据如下领域最新的标准和规范进行设计和开发:.中国卫生信息数据标准..《国家卫生信息化标准基础框架》;..《中国卫生信息标准基础数据集》;..《卫生信息数据规范指南》..《电子病历基本架构与数据标准》.国际医疗卫生数据标准..国际疾病分类ICD-和ICD-..临床术语标准——SNOMEDCT..医疗卫生领域信息交换标准——HLV(二)主要功能、自然语义识别结构化病历解析系统对所有医疗文本数据:入院记录、病程记录、术前小结、手术记录、出院记录、死亡记录、临时医嘱单、长期医嘱单等进行自动采集、清洗、后结构化处理,将原始数据转换为适合挖掘的数据形式,结构化、标准化以及量化的数据,可直接进行分析、运算、建模等。主要包括以下几方面:.数据采集:..对接医院现有业务系统,采集原始数据进行标化处理:..支持指定时间间隔或指定时间点进行自动采集;..提供可视化数据采集管理后台,可对数据抽取、清洗过程进行监控;..如采集任务异常中断,支持自动恢复并报错;.数据清洗、标化功能..支持对冗余数据和无效数据的判断及清除;..支持纠正不一致数据,填充空值、丢失值等..▲支持对复杂文本数据进行切分,进行标准化分类处理;.数据聚合功能..▲支持为患者创建医院大数据中心唯一主索引;..▲支持患者全部检查诊疗事件的汇集管理;..支持依据事件的时间信息和医学逻辑建立时间轴。..支持分析来自外部资源的信息,并数据存储到数据中心;..支持反向地响应外部的检索、汇聚和返回数据;.既有医疗文本数据的自动后结构化处理:千里马招标网www.qianlima.com中国招标行业门户网站..标准医学术语的解析,如“腹痛、腹胀”等无需转化语义的信息进行直接提取,;..▲同义词判断,如“见个病灶”、“见一病灶,另见一病灶”“见一病灶,并见一病灶”等,对同义的描述可进行判并提取为标准信息;..能识别否定修饰词,及其修饰对象;..数值解析,能将中文数字解析为数值,将不同单位数值解析为统一单位...