依托医疗大数据,构建可持续发展的临床科研云平台

浏览 271

      医疗卫生信息化建设30多年来,始终坚持随时随地方便地提供医疗服务作为发展战略。从上世纪七八十年代起步探索到如今,已经进入数字化建设快速发展时期,信息安全管理、远程医疗服务等多项政策制度不断完善。这期间,医疗机构汇集了海量临床诊疗数据,为医院和医生开展针对患者就诊的大数据科学研究提供了基础。“对这些数据的进一步挖掘,有助于为医院构建一套从表单制作到统计分析报告的科研分析平台,也有助于促进转化医学的发展。” 2018年6月8日,中山大学中山医学院副教授/研究员、计算机中心主任周毅在“2018医疗健康云生态大会”上如是说。

      周毅介绍,受限于软硬件等条件,医院科研平台发展参差不齐,科研资源无法共享、科研效率较低,再加上技术力量分散、医疗数据分散、缺乏数据标准等原因,临床科研无法形成规模,远远不能满足日益增长的科研需求。因此,最大限度整合资源,构建临床科研云平台显得尤为重要。

如何构建临床科研云平台?

      临床科研云平台的构建,需要进行医院信息的整合,把信息不通变成通。因此,首先要建立医院集成平台,即通过企业总线等消息机制,将医院核心业务系统围绕“医嘱-费用-报告-病历”等业务流程串联起来,解决应用集成中的解耦与接口维护等挑战。然后,在集成平台基础之上构建临床数据中心,实现临床、运营信息从核心业务系统,通过信息整合成为信息资源,再成为决策支持和二次利用层的数据支撑的双向流动。最后,在临床数据基础上进行医院的云平台构建。

周毅介绍,科研云平台基于临床数据中心进行信息整合,为临床研究人员提供了数据,乃至数据分析的一些工具支持。

数据的采集与整合

      医疗机构信息系统一般有上百个子系统,其中包括常规主系统30-40个,还有一些不常用的系统。因此,数据的采集与整合非常重要。

      临床科研一体化即把医院的各个子系统的信息进行整合,包括一些本体技术、自然语言处理技术、信息安全、生物信息学等,建成科研临床数据库,然后根据各种应用场景进行数据分析,包括可视化描述性分析、队列分析高级分析和写作支持。

      据周毅介绍,数据整合包括结构化业务数据、主数据和非结构化数据三类。在医院实际对数据整合的过程中不可能将所有的数据全部进行整合,要根据医院信息化的实际情况和数据应用的要求分阶段、分步骤地进行整合。主数据往往会被很多业务系统重复使用,而且整合的过程不单是对其进行数据整合,还得将医院内部对这些数据的管理流程和管理功能进行整合。对于非结构化数据,特别是影像数据,建议只做关联处理。

      周毅表示,在数据整合过程中,数据的清洗与整合工作量非常大,包括对原始数据要建立中间表,在中间表视图里面判断数据是否是结构化的,剔除无效数据,然后进行编码、规范化;如果是非结构化的数据,则要对合并的数据进行影射,最后收入数据库。

数据的分析与研究

      周毅介绍了数据分析与研究的四种主要技术:一是自然语言处理,将非结构化数据转化为标准的结构化数据,为精准分析临床数据打下坚实基础;二是数据挖掘与分析,对临床数据进行清洗整理并转化到通用的科研数据模型,提供机器学习和深度学习的分类、预测、决策模型;三是一体化的医学本体,一体化的医学本体知识库综合了目前国内多种中文主流的本题库以及术语库,并接轨国际通用标准;四是可视化分析结果,多元化的可视化分析结果将分析结果更加直观、形象地展示出来。

      医疗数据多层次、多角度的分析和利用,涉及到数据的生命周期,包括数据的采集、管理、报告和分析,希望通过这些分析,支持个体化诊疗决策、比较有效性研究、队列有效性研究等,从而实现以科室或者学科为中心的数据分析和利用、以疾病为中心的数据分析和利用,以及以病人为中心的数据分析和应用等功能。

总结与展望  

      周毅强调,依托医疗大数据基础,建立临床科研一体化的云协作平台是一个必然发展趋势,要建立专科单病种标准化名词库及结构化病历处理平台及临床数据中心;建立跨科室、跨医院的临床科研数据中心,实现临床诊疗数据到科研数据的后结构化处理和一体化管理;建立专科诊疗规范并在协作体系内进行应用和推广,降低区域内差异,提高区域专科的诊疗水平。同时,支持相关的大队列课题,覆盖数万到百万的患者;优化患者管理,增强医患互动动、健全随访机制,实现病例查询、统计分析等功能,做好精准的健康管理。“医学的发展已经从基于能力的艺术转变为数据驱动的科学,希望通过医院科研云平台的建立,助推医学及整个医疗到科研的进一步发展。”周毅说。