百度NLP技术“称王”后,正在担起领头羊的行业责任

曾响铃
关注

三、让AI强者恒强的“自增强循环”,这次AI巨头又有了新的玩法

在AI发展领域有典型的来自实践的“自增强循环”现象,即在深度积累下不断在自身业务、产业领域进行实践,将成果反馈,推动算法、数据等不断进步,自我强化,对行业的领先像滚雪球一样越滚越大。

例如,百度NLP领先行业的UNIT,自发布以来,2.7万多开发者在平台累积知识条目总量2.4亿,支撑了超过10万个智能对话应用,与最终用户总计进行了超过4200亿次交互。

这些实践的强化,反过来让UNIT能力更上一层楼,推出更多更低成本、更高效率、更好开发体验的服务,这种正向循环让UNIT超越竞品越来越多。

所谓的“强者恒强”,其实根本上就是来自于这种“自增强循环”。

现在,百度在NLP领域推进这种“自增强循环”又多了一种玩法。如果说过去的“自增强”过程是在自己的地盘中实践推进,那么百度此次推出的行业计划,则带有联合整个行业共同完成“自增强循环”的意味。

此次百度NLP推出的千言开源数据计划十分典型。

在百度的构想中,它试图“团结”来自国内多家高校和企业的数据资源研发者,共同建设这样一个数据项目,在更多的“同行”加入下,获得更丰富的任务类型、更多的开源数据集合。

这样做的好处,是让计划中的每一个参与者都能享受到整个行业的数据和模型积累,从复杂知识构建、语义理解、知识融合、多模态融合等角度推动技术的进步,毕竟,百度NLP积累再多,也少于整个行业,而NLP又是一个极度依赖积累的AI垂直领域。

千言第一期总共涵盖了7大任务,20多个中文开源数据集合,这会是百度另一种“自增强循环”的开启,只不过,它依靠的是整个行业横向而不是自身实践纵向的推进力量,也将惠及整个行业。

通过行业共建的方式汲取精华获得群策群力的成长,这是百度AI、NLP更大的手笔。

以这样的视角再来看百度在此次峰会上推出以王海峰为代表的百度NLP“十年十人”,可以认为,百度NLP在十年发展后,已经不单被定义为一种属于企业个体的优势技术,更成为百度推动机器更好地理解世界、服务于人这种技术信仰的典型代表,实现着更高维度的技术情怀。

总而言之,已经完成“技术扛鼎”的百度NLP,重心已经转移到了产业落地上。作为走在NLP应用于产业智能化最前线的巨头,百度走出了有自身调性的路子,也通过满足产业更复杂深度的方式来获得更广泛的认可,以及相对竞争对手的优势。与此同时,从竞争到竞合的行业态势,也通过百度的引导开始发生在NLP领域。


声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存