电影《怪医杜立德》里的杜立德博士有一项神奇的本领——无需借助任何科学仪器的辅助便可与动物交流,起因是他听懂了鸟语,给一只受伤的猫头鹰拔掉了刺,后来被各种动物知道了,随即他的诊所便给动物们看起了病。
随着剧情的发展,一只猴子告诉他马戏团的狮子要跳楼自杀,于是杜立德博士赶紧跑去马戏团。
救下了马戏团想要跳楼的老虎。
抛开电影本身的喜剧色彩,这个设定也是很正确的,因为猫头鹰和猴子是电影传话的关键人物,而现阶段人类对一些鸟类和一些灵长类的行为与语言理解是最透彻的。
电影照进现实,可能没那么容易
随着科技发展,像杜立德博士一样的与动物沟通交流变得越来越趋近现实。最近,来自华盛顿大学和艾伦人工智能研究所的团队就合力开发了新的神经网络模型,可以来理解和预测狗的行为。研究人员在狗身上安装了 GoPro 相机用于记录狗的行为,并且通过在四条腿和尾巴上安装的传感器来传递运动数据。
通过对狗的肢体动作内容和在 GoPro 上记录的内容进行比对分析,由此可以知晓狗在什么样的动作下看到了什么,并对其行为进行预测。
而在预测狗的行为之前,人们在狗的语言识别上已经进行了不少研究,甚至可以听懂它们讲话。
生物学家 Slobodchikoff 创办了一家名为 Zoolingua 的公司, 该公司开发了一种算法,可以将土拨鼠的声音转为英语。他认为对土拨鼠叫声的研究同样可以用到猫狗身上,原理很简单,即收集大量的狗狗视频,然后用这些素材来训练人工智能算法,用人工来标记每一种叫声和摇尾巴的动作表达什么意思,最终将其翻译出来。
这是典型的有监督学习方式,需要的大数据首先要通过人工标注,但是由于采样的范围和机器内存等的局限性,这种方式在翻译的准确度和丰富性方面尚有待提高。相较之下,为实现人狗沟通而设计的No More Woof耳机要更胜一筹。
No More Woof是由北欧发明与发现协会( NCID )开发的,应用的是三个不同技术领域的最新技术的组合,即脑电图传感、微运算和特殊脑机接口软件。这些传感器是脑电图录音机,先录下狗大脑内流动的离子电流造成的电压波动,再将其传到一部微型电脑上,把它们进行解释。
但这里依然有几个问题尚未解决。首先是脑机接口至今尚未取得突破性进展,而使用在狗身上显然是外置的,在识别精度上可能依然达不到预期。其次,以上两种翻译机均只能识别一些简单的表达(后者强一些),比如“我饿了”、“我很累”、“我想出去散步”等。最重要的是,就现阶段的技术,还不能像电影里的交互,你能听懂狗,但狗却不能听懂你。
从技术上说,识别动物的表情、动作、叫声并不难,现在的 AI 算法可以快速对这些信息进行识别并分类,但更难的是正确解读这些信息表达的含义。人类对于动物行为和语言的认知程度并不相同,短时间内难以全部理解,甚至一度遭遇瓶颈,那么对动物的语音乃至行为的研究又该向何处发展呢?