2020年1月,北京智源人工智能研究院联合专注于AI驱动药物研发的科技企业晶泰科技,以及数据评测平台biendata,共同发布了AI与制药的数据比赛“智源小分子化合物性质预测挑战赛”,总奖金10万元。
药物研发是一项成本极高的工作。著名的医学期刊《美国医学会杂志》(JAMA)的一篇调查论文显示,研发一款癌症药物的成本在6.48亿美元左右。其中,大量成本都会用于待选药物分子的生物、化学测试实验上。虚拟筛选等计算技术可以缩小筛选对象集,降低制药成本,但是需要消耗较多的计算资源。如何利用已有数据建立优质的机器学习模型,逼近真实结果,将为虚拟药物设计找到准确度和成本的平衡点。化学信息学和机器学习在药物研发中的应用已经有一定的历史,在最近以深度学习为前沿的AI潮流下,行业正在探索更广泛的人工智能技术在药物发现中的应用。
本次比赛的目的正是让最新的人工智能算法推动新药研发。本次比赛的数据包括13万个小分子的3177个特征,比赛要求选手根据这些特征预测六个与药物开发息息相关的化学性质,例如室温下的原子化能、偶极矩和最高占据分子轨道能等。
竞赛希望提出一种机器学习模型,根据小分子结构特征预测小分子的物理化学性质。这种预测方法可以协助研究机构和制药企业对大量待选分子进行快速筛选,集中人力和物力研究被机器学习模型选中的分子集合。
与同类竞赛和同类研究相比,本次比赛的数据集有以下几个特点:
1) 这个数据集的特点是相比于通常的生物化学数据集,数据量大;
2) 同时该数据集来源于量化计算结果,数据一致性好;
3)该数据集上的属性预测和药物研发中需要考虑的属性存在紧密关联,在该数据集上获得的算法经验将有可能直接用于真实研发场景。
在此次比赛同期,北京智源人工智能研究院还同步发布了多个科研与应用数据集。北京智源人工智能研究院副院长、清华大学计算机系教授唐杰表示:“本次智源的数据算法大赛,一方面促进了数据共享,提升数据使用效率,另一方面以赛代训,提升了广大学生和工程人员的技术水平,很有意义。”
本次比赛的主办方是北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)。智源研究院是落实“北京智源行动计划”的重要举措,在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立,是依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研发机构。在 2018 年 11 月 14 日举行的 2018 中国(北京)跨国技术转移大会开幕式上,智源研究院正式揭牌。
晶泰科技(XtalPi)是一家以计算驱动创新的药物研发科技公司,基于前沿计算物理、量子化学、人工智能与云计算技术,为全球创新药企提供智能化药物研发服务。我们希望通过提高药物研发关键环节的效率与成功率、降低研发成本,为患者带来更多优质的药物。晶泰科技创立于麻省理工学院(MIT)校园,核心团队由来自学术界、IT互联网界及医药产业界的优秀人才组成。晶泰科技已经成功为来自美国、欧洲、中国、日本的40余家先锋药企提供了药物研发服务。