近日,动脉网在杭州举办了以“新构造”为主基调的第二届2018年基层医疗论坛。体素科技创始人丁晓伟以《AI-医生的左膀右臂》做了精彩演讲并接受了动脉网的专访。以下是专访内容:
丁晓伟:UCLA计算机系研究助理教授,博士(师从奥斯卡奖得主Terzopoulos院士):交大本科毕业到UCLA博士(计算机、辅修应用数学)历时不到三年,打破UCLA计算机系博士毕业用时记录。 前Cedars-Sinai医学中心人工智能医疗部研究员,师从美国最佳医生得主,心脏核医学奠基人Daniel S. Berman,磁共振成像著名专家Debiao Li。
从医学专业的角度讲,为了能够更好地赋能现有的临床工作流程,体素科技不是以病种而是以影像协议来定位产品类型。行业里很多产品是针对单病种或单一病灶类型研发的,比如糖网病辅助诊断系统、肺结节辅助诊断系统等等。体素科技的产品依据影像协议来定位产品的。比如说胸部CT解决方案,眼底图像解决方案,胸部X光解决方案。
以胸部CT解决方案为例,放射医生在检查一份肺部影像时,他还要关注筛查者是否患有肺气肿、支气管扩张、肺炎、纵隔病变、胸壁病变,扫描范围的上腹部病变等胸部疾病。一线放射医生希望未来的AI系统可以像医生一样,对胸部疾病进行全面的检查,而不仅仅是肺结节的筛查,最后出一份初步的检查报告。
全病种辅助诊断系统适合用于初诊
丁晓伟告诉动脉网,肺癌的发病率非常高,但是这个高发病率是与其他的癌症相比较的,但和其他普通的疾病相比发病率还是要低很多。
病人如果是初次诊断,一般只知道症状和高危因素,到了临床科室后,医生会根据情况建议患者拍何种片子。放射医生在拿到片子前,也不会提前知道拿到的放射肺部影像哪里有问题,也不会假设筛查者患有哪种疾病。
所以按照自然地逻辑,这段是从影像协议开始。影像协议是指患者做的胸部CT、眼底照相、冠状动脉CT等。
对于治疗过程中的复诊病人,医生知道患者的具体病情,医生的诉求是监测患者的治疗效果。这不属于诊断的范畴,而是管理观察的范畴。因此,体素科技在产品中加入了相应病灶的前后对比。
对于那些初次诊断没有结果,复诊来确认疾病的患者,此类情况可以以假设某种疾病为前提,因为医生之前已经怀疑是某种疾病,此次只是来确认。针对这种情况,体素科技的单病种产品和全病种产品都可以覆盖。
丁晓伟认为,单病种辅助诊断系统用在复诊,全病种辅助诊断系统用在初诊是比较符合医生的工作需求的。
全病种辅助诊断系统对数据要求高,但方便后续打磨
丁晓伟认为,医疗人工智能行业不会突然崛起一支特别厉害的队伍,这需要时间的积累。在创办体素科技之前,丁晓伟从事医学图像人工智能方面的研究期间几乎每天都和医生一起从事研究工作,对疾病的诊断、治疗有一定的了解,虽然不能从业看病,治疗疑难杂症,但是基础的医学图像还是可以看懂。很多长时间从事医疗行业的研究人员慢慢的都会懂一些医疗。
基于自己对医学影像的理解,丁晓伟团队在创办体素科技之处就将公司的主要产品定位在全病种辅助诊断系统。相较于单病种辅助诊断系统,这种定位因为标签的数量更多,对数据的标注、质量要求非常高。但是这种发展思路为后续的产品打磨节省不少精力。
因为机器学习特别是深度学习的参数标签多,就需要在强监督的情况下,模型才打磨的好,所以将标签过于简化,反而不利于学习,所以系统可筛查的疾病要足够全。
以肺结节检出为例,假如系统只能筛查肺结节,阳性(有异常)的部分是肺结节本身,除了肺结节本身其他的都为阴性(正常)。这对于模型来说反而是非常困难的事情,因为阴性的种类太多了,比如空白部位、血管、其他局部病灶等等。
这就给系统造成了困惑,为何都是阴性,长相为何如此不同。体素科技的思路是将阴性的区域按照病灶类型或者组织类型分类好,这样系统就会非常清楚,这样做虽然在设计模型的时候很麻烦,但是后续调参数,监督这些标签的区别反而会简单很多。
眼底图像的思路也是一样的,如果在糖尿病患者人群上只是检测糖网病,其他的异常很容易被当成假阳性被分类出来。与其这样不如直接告诉系统各种异常类型分别是什么。
丁晓伟表示,产品定位在全病种辅助诊断系统,不仅符合医生的工作流程,在产品研发方面也相对节省精力,可以让系统的表现达到极致。
丁晓伟也强调这种训练方式也有困难。病种数量多了以后,病种之间的平衡就很难做好,有些疾病常见、有些疾病罕见,训练的时候如果用不平衡的数据来训练,效果就不好,会忽略罕见疾病。
另外,疾病之间的关系很难在一个模型中编辑,比如有些是排他的,有些疾病是共存的,有些是交集关系、有些是层级关系,有些又没有关系,所以做好平衡、处理好各种疾病之间的关系是比较困难的。合并症的分类还需要研发过程中医生的详细提示才能对标记进行质控。
体素科技部分成熟的解决方案
基于上文的产品定位思路,体素科技已经研发出胸部平扫CT解决方案、肺癌二次确诊、心脏冠脉造影CT解决方案、视网膜全病种解决方案等。
胸部CT解决方案
体素科技正在研发的胸部非增强CT解决方案同时对各个病种进行分析,生成自然语言报告,并且伴有异常部位的量化分析的。为了行成标准的描述,体素科技产品背后有很多模型要运行,把病灶解剖位置、征象描述、病灶性质、量化信息和临床上有意义的正常发现都一起汇报成一段自然语言,其实不是简单的工程的系统可以完成。
为了更好地诊断肺癌,体素科技同时从微观和宏观两个角度来解决这个问题。癌症可以从分子尺度分析,也需要从宏观角度的蛋白质合成之后的病灶问题。
从宏观角度,体素科技从毫米的量级去描述这个病灶的形态。在分子角度,体素科技与合作液体活检研究团队通过无创抽血进行ctDNA检测,,把影像征象和基因测序这两个信息放在同一个语境之下,给出一个肺癌的界定。
在CT上面,恶性肿瘤的敏感度比较高,特异性不高,而ctDNA具有较高的特异性,所以这两个检查的特点有机结合,就可以给患者一个早期的二次诊断的确诊服务。
心脏冠脉造影CT解决方案
再就是冠心病,人类第一大杀手。在国内,如果家里老人感到胸痛、胸闷,到了医院常见的检查——心脏冠脉CT造影,通过这个 CT 可以看到心脏三个冠脉的狭窄程度,以及造成狭窄的原因。
体素科技Autoplaque提供除普通冠脉CTA后处理工作站的功能外,还提供临床流程要求之外的量化分析,比如心脏管腔内的一些斑块的形态和组成成分。针对心血管疾病,体素科技通过无创检查,可以提前告诉患者心血管有创检查的预测结果,提醒他接下来做什么样的检查,随访的时间区间是多少。
为了准确预测心脏病的突发,体素科技针对一个病人心脏的影像上对心脏的脂肪,血管里面几个狭窄的斑块等等进行量化,获得量化指标,再结合病人的临床信息,譬如生化指标、血液指标,病史、家族史等,预测这个人在未来五年的哪个时间段发心梗的概率最大。
为了使模型更准确,体素科技在20 家医院,随访5 万位病人,通过这些实在的数据推理出来。
胸片筛查解决方案
胸部X光不能诊断所有胸肺疾病,但是能发现一些异常。所以它对一个健康体检的病人,是不是要入院进行进一步的诊断有比较大的作用。
如果能用它病人的分诊和转诊,这样的定位是非常合理的。所以体素科技在这个领域做了所有的早期病灶类型的初筛。
视网膜全病种解决方案
在眼科领域,体素科技不仅仅筛查糖网病,而是要做视网膜全病种解决方案,还要给出诊断分析报告。目前体素科技的这个产品覆盖了大多数的眼病,落地也非常好,受到了美国NIH 大项目的认可,选定选定体素科技的产品在整个洛杉矶郡里面进行实验。在国内体素科技也在北京三家比较有权威的医院眼科里进行临床实验。