前 言
全球范围内大数据发展迅猛。人类文明发展到今天,累计产生的数据量已逾越 ZB 级,并以每两年翻一番的速度增长(程学旗等,2016;Jee &Kim,2013)。据国际数据公司预测,到2020年全球将总共拥有35ZB数据量(李国本、程学旗,2012),而下一波巨大的数据洪流很可能来自人类生物和生理数据。尤其是近十年来,全球范围数字化加速发展影响了社会的方方面面(Luna et al.,2014),人、机、物的三维度高度融合引发了数据规模爆炸式增长和数据模式的复杂化,人类迈进了社会化及网络化的大数据时代。人们不再局限于数据单一用途和价值,数据分析和利用的思维及方式发生了显著变化,甚至国家竞争力也已部分体现为一国拥有数据的规模、活性以及解释、利用数据的IT能力(程学旗等,2016),掌握和利用大数据的能力正在成为国家数字主权的体现。大数据作为“新财富”,价值堪比石油、黄金,它对各行各业正在产生革命性影响,大数据技术的兴起正完成对各传统领域的颠覆(程学旗等,2016)。
近十年来,国际学术期刊也相继对大数据进行了专刊讨论,从信息技术、经济、管理、行业应用等各维度剖析海量数据所带来的挑战及应对(Buxton et al. , 2008; Overpeck et al.,2011),研究认为大数据是无法在一定时间内用传统信息化手段对其内容进行抓取、管理和处理的数据集合,有效处理这些数据能够释放出巨大的潜在价值(Manyika et al.,2011),无论是学术界还是产业领域,大数据都已成为热门(梁吉业等,2016)。大数据分析技术被应用于各行各业,摩根士丹利的一份报告显示,在全球大数据增长快的领域中医疗健康行业占据首位(李国杰、程学旗,2012),被用于处理医疗健康的复杂分析和决策支持(韩晶,2013;刘为勇,2017),这有望产生巨大的社会价值和经济价值。
我国医疗改革带来了区域医疗健康信息化高速发展。自中华人民共和国成立以来,我国医疗体系的变化迅速且复杂,先后经历了不少于四次的医疗改革(Yip & Hsia,2014)。近一次也是有力度的改革始于2009年,其中“大力推进医药卫生信息化建设……加强信息标准化和公共服务信息平台建设”作为“新医改”中八项重要举措之一,被我国政府寄予厚望。作为对“新医改”的积极响应,原国家卫生部统计信息中心首次提出以“35212”工程为核心的卫生信息化五年发展规划,其重点是建设国家、省、市三层分级部署模式的区域卫生信息平台。
医疗卫生属于数据高度密集型的服务行业,医院信息管理系统(Hospital Information System,HIS)、电子病历系统(Electronie Medical Record EMR)、电子健康档案系统(Electronic Health Records,EHR)、医嘱录人系统(Computerized Physician Order Entry,CPOE)、图像存档通信系统(Picture Archiving Communication System,PACS)、实验室信息系统(Laboratory Information Management System,LIS)等已经得到普及。此类核心运营式系统产生了海量医疗数据,数据存储量以几何数量级逐年增长(李岳峰,2015),一张普通CT影像数据约占150MB空间,而一张标准病理图片约占5GB空间(Barrett et al.,2013),单个医院数据体量可以达到TB级(颜延等,2014;李国栋,2013),甚至部分单体规模较大的三甲综合型医院数据量已超过100TB(汪鹏等,2015)。以区域内所有医疗机构数据汇聚和互联互通为目标的区域卫生信息平台建设中所存储数据体量至少都是PB级,中国一个中等城市50年所积累的医疗卫生数据量至少能达到10PB级。大数据在提高医疗卫生服务质量、优化诊疗服务流程及降低医疗服务成本方面被认为潜力巨大(黄小龙,2017)。面向医疗卫生部门,大数据有潜力创造每年大约3000亿美元的价值,其中2/3是通过降低医疗支出来实现的。作为世界上繁忙和创新性的医疗中心之一的美国克利夫兰诊所,认为大数据是近几年的医疗创新之一。
伴随大数据的蓬勃发展及区域医疗健康信息化推进,医疗卫生领域大数据应用诉求越来越强烈。在以往的信息化进程中,医学虽然是一个相对保守的领域,但在信息化浪潮不断冲击下,医院内局域网、临床数据中心各类服务器及存储等硬件设备,包括影像处理和应用、检验检查管理等在内的各类卫生医疗专业信息系统,甚至新近的移动医疗、物联网、云计算等都在该领域持续发酵和应用。在传统医学中产生了
大量的医学数据,都散落在各级各类医疗卫生机构内。随着国内区域医疗健康信息化推进,原有以单个医疗单位为主体的独立建设已经开始向区域化、集成化的高级阶段进发(宋波等,2016),即从个体医疗卫生机构独立发展的机构信息化过渡到区域内跨机构整合发展的行业信息化,以卫健委主导的区域医疗健康信息化遍地开花,传统的医疗卫生数据实现了真正意义上的大集中。
社会的发展使医生在医疗活动中权威和“家长式”的地位有所动摇,病人通过充分利用信息、网络及移动设备等进行自主健康信息消费一定程度上改善了医患信息不对称的状况,并且积极地参与和介入医疗活动及自我健康管理过程中。伴随着个人健康监护设备的发展和商业模式的成熟,个人首次具备拥有远程持续监控每次心跳、每时每刻的血压读数、呼吸频率与深度、体温、血氧浓度、血糖、脑电波等所有生命指征的能力(闫军玲等,2013;孟小峰、慈祥,2013)。与此同时,社交网络如火如茶地发展,互联网上产生了大量的个人生活、活动、饮食、心理及心情等与个人健康有关联的海量原始数据。此时,我国的区域医疗健康信息化开始从区域内跨机构整合发展的行业信息化过渡到跨行业创新发展的社会信息化。传统医疗数据、个人监测实时生理数据及个人生活心理等社会行为数据,构成了无序、异构、海量的数据集合(Yan et al.,2013;迈尔-舍恩伯格、库克耶,2013;刘晓娟等,2013),它们作为医疗领域社会信息化进程中健康大数据的新成员(蔡佳慧等,2013),在实现首次直接、孤立的利用之后往往被存储在机房的某个角落,数据的二次利用、整合挖掘等极富意义的知识发现过程戛然而止。大量的数据涌人但又无法将数据有效地转化为信息和知识,是一个现实的、严重的但又被忽视的问题。
与其他领域相比,医疗健康领域虽然产生海量的数据,但是早期成熟的数据挖掘及近年来崛起的大数据方面的应用显得严重滞后,而为提高医疗健康水平,医疗健康界需要找到一个能够有效处理大数据的框架、方法并积极开拓应用,否则我国区域医疗健康信息化进程可能面临较大发展困境。
由于编者水平有限,书中可能存在不妥之处,恳请广大读者批评指正,以便再版时修正。