在台湾,有一位歌手叫萧煌奇,他因先天性白内障一出生就全盲,在4岁动了眼部手术后成为弱视。15岁那年,萧煌奇在重见光明多年后再度失明,但是他一直保持乐观态度,热爱音乐与创作,一首以自己为原型的《你是我的眼》横空出世,给所有黑暗中的视障人士带来了鼓励与温暖。
“你是我的眼,带我领略四季的变化”,当AI要承担起“眼睛”这个角色时,是否能将这个世界带到视障人士的面前呢?又是否切合了视障人士的真正需求呢?
从感知到“看见“:层出不穷的“助视”产品
不得不说,巨头们在推进前沿技术的同时,一直没有忘记对视障这一弱势群体的关怀。一大批助力视障患者的产品和技术如雨后春笋般涌现。微软继前年在主题演讲会中讲述了人工智能和智能眼镜帮助盲人“看到”世界后,今年又一次提及了人工智能帮助盲人学生跨越交流障碍,这些科技里流露的温情不仅体现了企业对视障群体的关怀,也是对科技巨头最好的品牌广告。
智能相对论分析师颜璇梳理了各类与视障有关的智能产品,大致将其分为三种类型:
1.曲线救国型:一般来说,目不能视的视障患者认知外界世界的渠道是除了视觉之外的其它感官感觉,比如听觉、嗅觉和触觉。比如海伦·凯勒的老师在教她认“water”时,让她伸出一只手去感知水的流动,并在海伦的另一只手上拼写了这个单词。
基于此,慕尼黑公司和韩国公司联合完成了一款专供盲人使用的盲文智能手表(Dot Watch),搭载了盲文显示系统,以盲文的形式将各种信息呈现在手表的触摸表盘里。
相机也给出了触摸形式。美国一位设计师专门为视障人士设计了一款to see 3D相机,这款相机能通过镜头实时地将拍摄的物体转化成三维触感数据,使视障人士通过触摸屏幕表面生成的立体形状来识别面部细节,比如读取表情等。
当然了,除了触觉,听觉的也不会少。IBM 推出了无障碍环境的一项发明——专为盲人设计的新型导航 APP NavCog。NavCog 可通过耳机与智障人士“耳语”,帮助人实时识别位置、朝向,还能辨认迎面走来的熟人。
2.外力加持型:视障人士通常分为两种,一种是全失明,指完全失去视力,另一种为弱视,即视力不到常人的60%,在视障人士当中,弱视群体占到近 70% 的比例。面对这类群体,为他们做一个智能眼镜就很有必要了。
比如一款名为eSight的产品,结合算法和部分盲人自身的需要,通过控制器中的液体镜头技术进行“聚焦”,弱视者可以利用眼镜中的 Bioptic 倾斜功能,不仅可以调整瞳孔距离(对焦),还可以调整图像的清晰度(颜色、对比度、亮度),从而“重获光明”。
3.直截了当型:视觉的产生依赖于三大组织器官:眼球(主要为视网膜)、视神经、视皮层。对于视障患者而言,如果想要“一了百了”,恢复视觉,就必须研发出能替代这三种组织的假体,即视网膜假体、视神经假体和视皮层假体。
国内就有研究团队制作出了人造视网膜,其由体内电子微系统和体外电子系统两部分组成。使用方法是在患者眼球内部植入IC芯片,用来接收信息和传导电信号。然后再为盲人配备一个体外接收系统,比如眼镜。
“眼前的黑不是黑,你说的白是什么白”
即使现在的智能“助视”产品比比皆是,但要真的掀开视障患者眼前的帘子,恐怕还不容易。
首先,当我们不断加大视障患者在其它感官上接受的信息量时,也会带来不小的后患。比如,从听觉入手的产品往往会让使用者戴上耳机,这就会让盲人与周遭的声音隔绝,出行在外容易造成危险,而不带上耳机进行电子播报,容易造成患者的信息外泄。
我们不断地将智能产品应用在视障患者身上时,除了要为他们带来生活上的方便,更是想让他们看到这个美丽的世界,无障碍地探索这个世界。当我们用一种以其它感官来辅助视觉的技术思路来实现客观上的无障碍的时候,肯定会与视障患者主观上的无障碍有区别。
其次,可穿戴设备戴久了,尤其是戴在眼睛上,人们或多或少都会产生不适感。想想我们在电影院看3D电影的时候,3D眼镜也曾让我们头晕目眩,沉浸式技术也极容易带来头晕、恶心等反应。除此之外,戴智能眼镜限制了侧面周边的视觉范围,视障患者要做到和正常人一样的移动和工作还是不易。
然后,人造视网膜技术具有很强的综合性和复杂性,需要机器视觉、IC设计、半导体工艺、纳米技术、神经科学、生物材料等十多个学科的科学家和工程师全力投入,密切配合,缺一不可。但即便拥有如此高精度团队,外界信息通过电信号传递到大脑中,盲人感受到的也不过是一个灰度的、马赛克的世界。
即使是黑白的“渣像素”,也能勉强算“看见”了。而不能算“看见”的那些智能产品,比如智能眼镜、认知助手等,仅仅只能提供语音让患者接收到相应信息。患者能做的就是,在“助手”说前面有障碍物请绕过去时无奈绕开,而不能亲眼看看阻拦自己的障碍物究竟是一个石头还是一辆单车。
最后,这些智能“助视”产品最大的问题就在于它的成本太高,价格太贵,一般人很难负担得起。由于致盲因素不同,很多盲人需要高度个性化定制的智能产品,这导致成本居高不下。即使是仿生眼球,也不能适用于所有视障患者,比如加拿大一家医疗科技公司Ocumentics在去年开发的仿生镜片也只适合25岁以上的成年人,此外,患有角膜浑浊、接受过白内障手术、重度视网膜黄斑变性、重度遗传性视网膜病变、视神经损伤等疾病的患者,亦不适合这一疗法。
看得见,以看懂表情为标准
归根究底,不管智能产品有多炫目,对盲人而言,他们更在乎智能产品的实用性,而真正实用的产品于他们而言就是三个字——看得见。
仿生眼球当然具有很大的市场,但上文中也提到,这种疗法并不适用于所有眼科疾病。智能眼镜+芯片的组合则是可以通用的,因为其视觉计算能力,人脸识别等功能可以接收外界信息,芯片通过柔性电极阵列来传输电信号,刺激视网膜的神经细胞,进而传递到大脑中,让盲人看见黑白的影像。
但对于市场来说,通用的就不具有特殊性了,所以,谁能快速抓住“通用”中的亮点以及最不易解决的问题,谁就能在“助视”这方面成为佼佼者。
神经科学家认为“人脸识别”有两个方面,其一是特征识别,也是目前的智能眼镜配备的识别类型。其二是表情识别。事实上,经过了亿万年的进化,人类形成了六七种与情绪密切相关的基本表情,它们是:快乐、惊奇、悲伤、愤怒、厌恶、轻视和恐惧。这些基本表情是人的本能,不需要学习就与生俱来。
目前,我们对脸部特征与表情之间的区别还不太清楚。在我们看到一个人时,我们大脑里的人脸识别机制就会开始运作,我们会在一瞬间就判断处这一张脸是不是熟面孔以及这个人的表情如何。但这一瞬间,对于视障患者却难如登天。
所以,让AI来帮助盲人看到人的表情或许是智能“助视”在人脸识别上的真正战场。这一举动的意义不止在于需要AI去识别更细微的脸部特征,还在于要为盲人获得更加清晰的图案,而不是模糊的一个影像。
英国《柳叶刀·全球卫生》有一份研究报告预计,当下,全球盲人数量为3600万,如果不加强对眼疾的治疗,到2050年将增至1.15亿。这是一个足够惊人的数据,而借助技术的力量,我们希望,每一个在生活中艰难独行的盲人,不论他们的年龄大小、环境状况如何、贫穷或富有,他们都有和明眼人一样看美丽世界的权利。