上周,2018年度的斯坦福AI报告发布,从学界、企业、政府和公众等不同主体出发,对人工智能当前的进展进行了数据呈现。经过长期的跟踪、整理和分析人工智能相关数据,报告发现,美国目前在人工智能的学术影响力专利产出、和商业活跃质量具有明显优势,中国则在学术论文发表方面相当高产,但就发展质量而言仍有待提升。在人工智能内部,机器学习和概率推理、神经网络、计算机视觉三个子领域备受学界关注,这也影响到了企业创业和人才需求。
以下,亿欧智库以论文发布、论文引用、学术会议、初创公司等几个模块,对报告的主要内容进行呈现整理:
论文发布情况
从发布论文主题来看,AI相关的论文增速(8x)在2010年后已经大幅超过计算机科学领域(6x),从一定程度表明人工智能领域的论文增长不仅仅是由人们对计算机科学兴趣的提高所驱动的。
从区域来看,欧洲一直是AI论文主要的发布来源地,占到整体的28%。中国(25%)自2006年后开始超越美国(17%),并在2008年实现出版数的高涨,报告推测是《国家中长期科学和技术发展规划纲要(2006-2020)》和其他政府项目为人工智能研究提供资金和一系列激励政策的结果。
在AI领域的子类目中(类别间不互相排斥),机器学习和概率推理(Machine Learning and Probabilistic Reasoning)占到最高比例,为56%,而神经网络(Neural Networks)是2014年以来增速最快的研究领域,年复合增长率达到37%。计算机视觉也保持了较高的增速。搜索及优化、自然语言处理及知识表示、模糊系统、规划和决策类论文目前还未呈现大的增长。
ArXiv是收录科学文献预印本的在线数据库(其中预印本是指学者的还未在正式出版物上发表,而出于和同行交流目的自愿发布的科研论文或报告),投稿量每月高达上万篇。鉴于知识的更迭速度和研究主题的竞争性,学者往往会在漫长的期刊/学术会议审核期之前就投稿在ArXiv上。数据显示投稿的AI相关论文整体呈现增长,其中计算机视觉和模式识别占最大比例,体现了学者较高的传播意愿。
从关注领域来看,中国对AI的研究侧重于工程技术和农业科技,欧美则集中在人文和医药科学。
从论文发布的主体来看,学术论文仍占绝大部分,其次则来自政府、企业。以中国为例,92%的AI论文来自学术领域。此外,2017年中国政府主体发布的论文是企业的4倍。而美国的企业主体发布的论文不论从数量还是所占比例来讲都高于中国。由此可见,美国在人工智能科研方面的商业化驱动力相对更强。
论文被引用量
FWCI(Field-Weighted Citation Impact,领域权重引用影响系数)是指该区域AI学者收到的平均引用次数除以所有AI作者的平均引用次数,能在一定程度反映论文质量。从数据来看美国的FWCI指数达到1.83,尽管欧洲的AI论文发布量最高,但其FWCI指数略高于平均水平。中国的论文质量则在持续稳步的提高中。
考虑到AI学者的国际流动性,报告也针对做出研究。数据显示,中美欧三个区域的久居型学者(指从未迁移至外国发表论文)的产出率最低,而那些动态迁出迁入的“候鸟型”作者的论文产出和被引用水平更高。其中中国的久居型学者所占比例最高(75%),相比欧美同类型学者更加高产,但论文质量仍有待提升。