医疗大数据时代,“技术善”与“伦理善”之争

亿欧网 中字

图片来自“123rf.com.cn”

随着云计算、基因测序、现代临床试验、靶向治疗等技术的发展,大数据和医学将进行高度融合,实现颠覆性的医疗,医疗卫生行业进入大数据时代。医疗大数据将在临床辅助决策、医疗质量监管、疾病预测模型、临床试验分析、个性化治疗等医疗服务领域发挥巨大作用。但不容忽视的是,当前大数据在医疗卫生行业的应用中带来一些伦理挑战,如个人隐私信息的泄露、知情同意的难以贯彻、人文关怀的缺失,甚至人的存在方式、医患交往方式等都发生变化,如何应对这些挑战,使其合理应用,成为当前伦理学亟需解决的问题。

1、医疗大数据的概念及特征

医疗大数据是指利用常规软件工具捕获、管理和处理数据所耗时间超过可容忍时间的医疗领域的数据集。医疗大数据的典型特征主要表现为四个方面。

1.1数据集成的广泛性

医疗大数据规模大、海量,通常是以GB、TB、PB为基本处理单位。例如,医院CT、核磁等影像资料的数据量每天超过100G,并需要长期保存,而且,种类繁多,来源广泛。医疗大数据涵盖人的全生命周期,既包括个人健康,又涉及医药服务、疾病防控、健康保障和食品安全、养生保健等。其数据主要来源于制药企业、医院诊疗、医疗费用和健康管理四个方面。

此外,医疗大数据具有广泛的异构性,很多数据是半结构化、非结构化的,其所占比例越来越多,如电子病历、影像资料等,其中,病理资料是以图片形式呈现的,因而是一种半结构化数据。

1.2数据潜在的价值性

医疗大数据不仅作为处理对象单个存在,而且还是一种基础资源,其存在是判断其他数据存在的依据,能够协同解决其他领域的问题。单个医疗数据信息价值不是很明显,一旦通过智能分析和计算机技术整合,对数据进行二次开发,就会产生很大的潜在价值。正如经济学家Hal Varian所说:“数据收集的根本目的是通过整合、分析、提取有用的知识,并将其应用到具体的领域当中。”

美国罗切斯特大学(University of Rochester)一个数据挖掘团队就曾利用Twitter的数据进行了尝试。他们利用自己开发的文本分析工具,一个月内收集60余万人的440万条Twitter信息,挖掘其中的身体状态信息。结果表明,研究人员可以提前8天预报流感对个体的侵袭状况,而且准确率高达90%。

1.3数据分析的相关性

相关性是指两个或两个以上变量的取值之间存在某种规律性。变量之间有相关性,只反映取值的影响度和相关的密切度,并不代表有因果性。数据分析是整个医疗大数据的核心,价值产生于分析过程。

首先,医疗大数据是一个复杂开放的系统,其中各个部分相互影响,相互关联。此时的“因”可能是彼时的“果”,此处的“果”也可能是彼处的“因”。因此,传统的线性因果分析模式无法对医疗大数据进行分析。例如,有统计结果显示,吸烟人群的肺癌发病率比不吸烟人群高几倍,但统计学无法得出“吸烟致癌”的因果结论。只能提示,吸烟与肺癌有相关性。

其次,医疗大数据的潜在价值性,使得“数据思维从以计算为中心转为以分析为中心,即在一定的理论指导下,按照一定的社会需求,收集、整理和分析数据,从而进行社会解释、监控、预测与规划的过程和活动”。

谷歌搜索每天产生海量的数据。就以搜索流感信息为例,尽管并不是每个搜索这类关键词的人都有流感症状或患有流感,但把这些数据汇总到一起时,或许可以从中建立起一个准确、可靠的模型,实时监控当下的流感疫情,并对未来疫情状况进行估测。2008年11月谷歌公司上线了“谷歌流感预测”(Google Flu Trends,GFT),即通过监测某一地区与流感相关检索词的数量,用来估计该地区流感疫情。谷歌公司将GFT推广到美国在内的其他28个国家,并对新西兰的流感预测,其结果与当地监测结果高度相关。不仅如此,在2008年季度GFT模型预测的结果与美国国家疾病预防控制中心流感样病例监测结果也保持了高度相关性,其相关系数为0.97。

在每一份基因电子病历中,记载着个人的所有潜在疾病及对药物的敏感信息。医生根据基因电子病历中的数据,结合患者的生理指标和医疗智能决策支持系统,进行相关性分析,模拟临床治疗的有效性,最终形成一个个性化的医疗模式。如Melanie Nix的家族有乳腺癌病史,在2008年,进行与乳腺癌有关的乳腺癌1号基因(breast cancer 1,BRCA1)基因突变检测时,结果呈阳性。医生根据这一数据结果,结合Melanie Nix的各项生理指标,进行相关性分析,制定了一个精准治疗方案,最终经过16轮的化疗和乳房重建手术,Melanie Nix现在已经完全治愈了癌症。显然,相关性分析是医疗大数据分析的一个重要思维模式。

1.4数据解释的不确定性

斯坦福大学Trevor Hastie认为:“海量数据带来显著性检验的问题,将使我们很难找到真正的关联。”维克托·迈尔·舍恩伯格等也指出这一点:“数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库。”

海量的半结构化、非结构化数据聚集在一起时,就会产生很多干扰数据,也意味着更多的虚假关系信息,导致分析结果的不精确。2012年~2013年,GFT高估了流感疫情的起始时间以及流行程度,流行性感冒提前袭击了美国,造成严重危害。当时科学家们检索并分析流感相关的互联网数据,对流感的影响程度进行估计。

然而与传统的公共卫生监测方法相比,这种方法大大高估了流感的高峰期影响水平。Declan Butler也指出,GFT对2012年底美国流感类疾病患者数目的估计比美国疾病控制与预防中心检测结果高出约1倍。不仅如此,GFT在2008年~2009年对瑞士、德国、比利时等国的流感类疾病患者数目的估计也都失准。

医疗数据解释的不确定性,一定程度上会给受检者带来误导,甚至产生不必要的恐慌。正如美国医学遗传学会通过基因测试,反馈许多有关遗传变异信息时对受检者说:“我们发现你的基因中的这些变异是重要的,但不知道它们是否会让你生病或者产生其他病变。”目前通过耳聋基因诊断只能诊断出60%~80%遗传性耳聋的准确致病基因,依然有20%~40%的基因无法确定,也就无法给受检者一个准确的数据结果说明。显然,如此不确定的医疗数据解释,势必给受检者带来潜在心理负担。

2、医疗大数据应用的伦理思考

医疗大数据是颠覆个人健康的一次重大革命,基因测序、无线传感器、靶向治疗等与其他学科结合将使医疗更具个性化。但是,医疗大数据在具体应用中仍然带来一定的伦理问题。迈克尔·桑德尔(Michael J. Sandel)指出:“当伦理道德跟不上科技的脚步时,人们的心理就会不安。”正是这种不安促进反思。

2.1个人隐私与信息安全

在医疗大数据时代,随着社交媒介Twitter、移动APP、远程医疗等在医患之间的广泛应用,患者的诊断信息、具体病症、生活习惯等隐秘信息都在互联网上留下痕迹。现有的隐私保护技术主要基于静态数据集,医疗大数据的海量、动态、共享、交叉检索等典型特征,增加了个人信息泄露的危险。

据美国卫生部民权办公室统计,仅2015年第一季度全美就发生87起数据泄露事件,受影响医疗机构达500多家,共计9230万个人信息泄露。国内媒体也曾曝出医药信息外泄事件,如温州多家医院的信息系统遭黑客入侵,罗维邓白氏公司非法买卖公民个人信息事件等。

此外,由于医疗大数据进行二次利用后,能产生无法估量的价值,所以一旦暴露,其危害往往是个人无法预知和控制的。因此有人认为,“医疗大数据时代,随着信息的累积和整合,真正的危险是被预知和蚕食人类的自由”。难怪有人担心,将一生的病历记录存储在云端,简直令人恐惧。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存