2、既要成本低,又要效率高,还要“体验”好
NLP产业落地还有牵扯要素更多的“我全都要”现象——在应用开发过程中,因为降本增效的主旋律,希望成本能够更低、效率可以更高,而开发者在庞杂的开发工作面前又往往还希望体验能够更好。
如果在过去,这种需求大概会被技术服务方怼回来,但随着平台化能力的提升,NLP已经完全具备了满足这种矛盾需求的能力。
仍然以文心为例,它全面降低了NLP的定制开发成本,在强大语义理解能力下对数据标注广度和深度要求降低——90%准确度的模型,过去需要5100条数据,现在可能只要220条数据;在算力上也类似,由于集成了ERNIE预训练模型,企业只需要单机微调即可取得世界领先效果的NLP模型,极大降低算力成本。
可以看出,这种成本的降低伴随着效率的提升,二者是一体两面的关系。而更进一步看,对实际参与开发工作的开发者而言,仅需要配置或编写少量代码便可完成从模型训练到模型评估,1周的工作1天完成,这本身也是一种体验上的优化。
类似的还有UNIT智能对话与定制服务平台,在本次升级后数据标注成本的进一步降低30%以上。重点场景预置的场景化解决方案,能够帮助开发者以更低的成本、更高的效率完成智能对话系统的构建,而这种构建也不需要长篇大论、逻辑复杂的编程,只需要调用对应的模块即可。
3、既要单环节强化,也要全链条深入
“既全且深”在过去是NLP开发者对平台服务的美好理想,既能够提供全面的服务,每个细分服务还能够做到足够得深。
现在,这种理想已经变成现实,它同样得益于技术和服务的长期积累。
以百度NLP智能创作平台为例,该平台一年多以来的自动创作文章累计200万+,相当一个10人团队至少工作45年;“图文转视频能力”上线4个月,被7000多家客户使用,自动创作短视频15万,相当于一个人至少要工作100年。
在此基础上,智能创作平台进行了再升级,一次性推出囊括智能策划、智能采编和智能审校全链条的3大场景方案,而每个环节,都十分深度而不只是简单的布局。
例如,在智能采编环节,借助融合文本、视觉、语音的跨模态AI技术,一方面提供文章创作多样、易用的工具,另一方面,还整合了视频编辑、图文与视频互相转换等视频生产实用能力,实际应用可以帮助视频生产速度达到原有的6倍。
可以认为,在百度等巨头的积极探索下,过去NLP领域那些不可能、充满矛盾的产业应用需求,最终将变得稀松平常。