今日获悉,有道专为教育场景自研的类ChatGPT模型将推出,模型名字为“子曰”。
基于“子曰”研发的 AI 口语老师和中文作文批改 DEMO 已完成,近期开放内测。这也将是国内企业推出的首个教育场景下类ChatGPT模型。
2月便有消息流出,网易有道 AI 技术团队已投入到 ChatGPT 同源技术 AIGC 在教育场景的落地研发中。
有道的“子曰”是“大模型+小样板”在教育领域的一次尝试,相比通用模型,“子曰”在教育领域内的数据是否更全面,交互会更精准?具体效果尚待验证。
AIGC(AI生成内容)有望带来教育资源、教育体系和教学方式的革命性变革。
有道“子曰”——量身定制的个性化陪练
在教育领域,很早就有AI形式的口语练习,但是预设好的场景,基本是剧本式的对话,比较一板一眼,不太符合真实的口语环境,不能很好地解决用户练口语的需求。
大语言模型或许可以带来开放式的对话,帮用户练习实际的场景口语。据悉,“子曰”将首先用于英语口语陪练环节,承担一种个性化定制的一对一陪练角色。比如在练习口语当中,“子曰”可以在相应的语言环境中扮演不同的角色,一步步引导用户“开口说话”。用户可以直接输入语音或者文字,进行多轮对话。
如果“子曰”足够强大,那么它的确有重构教育方式的能力。但是对教育领域来说,容错率很低,准确至关重要,尤其不能误导。这就需要在数据训练中数据足够多,以便更精细。
“子曰”培植土壤——在教育内容、硬件和技术层面
“子曰”作为个性化陪练老师,回复是否准确,是否真正理解“人”的特征十分关键,对“子曰”的要求是非常严苛的,它需要背后的团队在教育内容、硬件和技术方向上长期坚持。
教育内容的数据方面,网易有道在语言学习方面早有涉猎,2007年网易推出了有道词典,这让网易积累了较多的语言学习语料数据集,提供了培植“子曰”的土壤。从 ChatGPT 的开发机构 OpenAI 的布局动作来看,ChatGPT 同样缺乏垂类的数据,否则不会投资垂类公司来获取语料了,因此,网易在教育方向积累的数据尤为珍贵。
算力方面,只针对教育垂类,成本会有所下降。芯片在成本中占比颇高,有道词典笔 P5 产品已升级至NPU方案,相对CPU版本的模型推理速度提高了4-10倍,实现了实时的一目十行识别;在模型大小增大15倍的基础上,AI 引擎精确度大幅提升。算法方面,国内企业的算法已经比较成熟,有道“子曰”能达到什么程度尚不得知。
在技术层面,有道自2016年开始协同构建AI基础能力,同步组建语言、视觉、声音团队,为多模态打下基础。
可以看到,在新技术来临时,有道是有准备的。
AIGC赋能教育——打开AI+教育深度融合时代
国内 ChatGPT 目前已经形成了三个不同的发展派别,包括以百度、华为、360等为代表的通用大模型派;以网易有道、京东云、同花顺等为代表的垂类大模型派;以及以王慧文、李开复、王小川等为代表的 ChatGPT 创业派。三方都在争取实现 AIGC 从技术到产品到场景的商业化落地。
GPT系列在垂直领域教育方向强势登场,越来越多的教育科技团队着手布局“类 ChatGPT”技术,引发新一轮 AI+ 教育革命。
在教育行业,有企业是“拿来主义”模式,诸如 Duolingo(多邻国)、Khan Academy(可汗学院)等企业已经使用了 GPT-4;也有自主研发模式,诸如网易有道、科大讯飞、好未来等多家教育公司均透露了相关的产品及技术布局。
GPT系列本质上是一个通过语料数据学习词语概率分布的语言模型,真正有力量的是人们发现语言模型在足够大的规模下通过自监督的训练方式就可以获得很多能力,同时找到了“调教之法”,让ChatGPT的输出内容符合社会价值导向和逻辑思维结构,将其模型潜能充分释放出来。
AIGC它正在重塑教育的底层逻辑,将之推向一个更加未知的方向。