人工智能(AI)正迅速成为推动肿瘤学研究的关键力量,深度学习(DL)是一种人工智能范式,对癌症肿瘤学的研究和临床实践产生了重大影响。DL模型已被训练来分析不同类型的数据,包括显微镜图像和放射学图像、基因组数据、蛋白质结构和电子健康记录,这些都是癌症研究和肿瘤学实践中常见的大规模数据。DL方法已被证明在解决特定的预定义问题方面非常有效,并显示出超越人类图像识别能力的卓越性能。目前,已有数百种经监管机构批准的基于DL的医疗器械可以在美国和欧盟应用于临床。
深度学习模型正在推进肿瘤学研究,但还需要人类参与来执行复杂的多步骤工作流程。未来由大型语言模型授权的自主人工智能代理通过在生物医学研究中实现多步推理的规划、执行和优化,将进一步推动和改变人类肿瘤学的研究进程。
DL模型向多模态模型的转变
目前的DL模型已经可以同时合并多种数据类型,例如,一个整合病理图像和遗传数据的模型来预测个人患癌的风险。这种模型可以通过利用跨数据模态的互补或协同信息来提高预测性能。然而,即使是这样的DL模型,本质上仍然是单一目的的。这意味着它们被设计来解决一个特定的任务,例如预测癌症患者的生存时间。在复杂的肿瘤学领域,这是一个关键的局限。
研究和临床护理中的工作流程通常包含数千项任务——有些常见,有些罕见,但同样重要。研究人员经常需要分析不同的数据类型,包括各种显微图像、基因组数据集和文本信息。同样,临床医生和肿瘤学家必须解释一系列疾病的许多数据模式,如健康记录、组织病理学图像、基因组测序和临床图像。为了利用人工智能模型来解决涉及多个任务的问题,研究人员必须建立适当的流程,将多个步骤连接在一起,以预先指定和预先编程的方式解决不同的任务。而为每项任务探索、选择和优化单个软件工具既费时又低效。因此,肿瘤学研究中的单任务DL具有内在的局限性。
目前,随着多模态基础模型的出现,DL领域正在发生范式转变。这些基础模型是使用自监督学习技术在异构数据类型上训练的,这与特定任务的训练模型不同。在这种方法中,模型可以暴露于各种数据形态,如图像和文本,而不受预定义任务的约束。这意味着我们不需要特定任务的人类数据注释,但可以利用大量在研究和临床实践中无处不在的未标记知识。这使得该模型能够学习不同类型信息的通用表示和模式,并通过适用于大量现成的任务而变得具有多用途属性。
然而,肿瘤学研究中现有的多用途模型仍然受到迭代人类互动需求的限制——人类仍然需要探索、选择并参与几个模型,将它们组合到复杂的工作流程中。例如,为了找到潜在的肿瘤药物靶点,研究人员可以使用AlphaFold4等程序分析基因组突变对蛋白质结构的影响;借助“检索增强生成”在PubMed等出版物数据库中搜索现有文献;以及与癌症基因组图谱、人类细胞图谱或SwissProt等综合数据库的交叉参考结果。通过使用AutoDock等开源工具,研究人员可以进行分子对接研究,以设计潜在的候选药物。然而,对于开放式生物医学问题,没有标准的或预先指定的过程,每个问题都可能有不同的数据模式和不同的多步迭代分析路径。为了解决给定的任务,人类科学家必须尝试不同的工具和序列组合。因此,发现和推理的过程通常很难系统化和自动化。研究人员经常需要将不同的AI模型组装到流程中,最终,我们仍然需要能够管理几乎每一步工作流程的人,并决定哪些工具适合给定的输入数据,以及何时部署它们以实现最终目标。
多模态模型向AI自主代理模型的转变
上述挑战可以形式化为一个问题,由一个称为自主代理的人工智能模型来解决和优化。代理了解其任务的总体目标,识别所提供工具的特征和功能,如生物信息学工具、数据库搜索或其他人工智能模型,并能够选择应该使用哪些工具、在什么时间使用哪些数据。因此,它能够规划一个工作流程,通过该流程执行总体计划。人工智能代理可以经历“试错”,记住它,从而在一个称为自我反思的过程中接受训练,迭代优化计划:当代理一步一步地执行每项任务时,它通过工具获得新知识,并可以改进其行为。初步证据表明,人工智能代理可以解决肿瘤学中的一些科学问题或医学问题。
在十年前,人们不可能训练出有用的多用途人工智能代理,但大型语言模型(LLM)出现正在改变这一领域。LLM通过利用大量文本进行操作,使其能够对文本提示生成适当的响应。更改提示会更改LLM响应,并允许使用单个预训练模型执行多个任务。LLM可以扩展到多模态,并对其他模态进行文本描述。例如,将病理图像数据与病理报告相结合会产生一个视觉语言模型,该模型既可以口头描述也可以定量分析病理图像。LLM通过允许人工智能代理将高级任务分解为几个子目标,以类似于人类可能认为的思维链的方式逐步推理,这些功能提高了这种可能性,即配备LLM的自主代理,在人类研究人员的不同程度的监督和迭代下,有朝一日可以参与整个药物发现和开发过程。
多个AI代理也可以协同工作。这种多智能体系统为计算机协同解决问题提供了可能性。不同的代理,每个代理都有自己的特定重点或专业领域,可以参与计算对话,类似于人类研究团队中的不同观点。例如,一个代理可能被设计为批判性地评估提出的假设,而另一个代理则可能被训练来探索不同数据点之间的潜在联系。为了实现这些可能性,我们需要开发算法来有效地训练代理。此外,我们需要精心策划的基准数据集来评估代理在解决复杂问题时的性能。
AI在肿瘤学和临床研究中的应用前景
总体而言,人工智能可能有助于肿瘤学研究和临床实践的各个领域。他们可能有助于解释复杂的多模式患者数据,为治疗计划的讨论提供信息,帮助综合最近的研究结果以支持临床决策,并通过分析潜在结果和患者队列特征,为临床试验的设计和改进做出贡献。随着癌症研究和肿瘤学中人工智能代理工作的进展,发布适用于这些工具的指导和规则将非常重要。对于研究人员来说,仔细严格地评估人工智能代理的实际性能和局限性至关重要。从技术角度来看,人工智能系统中更强的多模式基础模型和代理能力可以协同帮助解决癌症研究和肿瘤学中的真实应用案例。未来,可以期待人工智能将深度参与肿瘤学研究,加速新药的研发,促进个性化医疗的实施,不断推动肿瘤学研究领域的知识发现和创新。
参考文献:
1.How AI agents will change cancerresearch and oncology. Nat Cancer.2024 Dec;5(12):1765-1767.
原文标题 : 人工智能将如何改变现有肿瘤学研究