据theverge消息,由创意机构Redpepper建造的Waldo 0,只需要通过一组图片,就可以在茫茫人海中找到指定的目标,而且在寻找目标的时候像狙击手一样精准。
Waldo 0配备的金属机械臂是Raspberry Pi控制的uArm Swift Pro,同时它配备了一个可以进行面部识别的视觉相机套件。相机拍摄一张照片,然后使用OpenCV在当前的画面中找到可能与之匹配的面孔。将这些面孔发送给Google的AutoML Vision进行分析,如果Waldo 0确定匹配率为95%或更高的时候,它将在极短的时间内在页面上找到的所有用户指定的面孔。
谷歌的Cloud AutoML自1月份开始向用户提供服务,用户可以在没有任何编码知识的情况下培训自己的AI工具。它的拖放工具允许任何人创建图像识别工具,并运用在各种不同领域,例如不同的拉面照片对他们来自的餐厅进行分类。
在实验的展示中,Waldo 0录入了一组Waldo相关的照片,在使用OpenCV匹配完成,AutoML Vision的分析后,Waldo 0在平均4.5秒的时间内,在不同画面中找到了Waldo。
Redpepper的创意技术专家Matt Reed负责该项目,他通过电子邮件解释说:“我从Google图片搜索获得了所有用于培训Waldo 0的图片; 62个不同的Waldo头和45个Waldo头加上身体。我认为这不足以构建一个强大的模型,但它给Waldo 0带来了令人惊讶的结果。”Reed的灵感来自亚马逊Rekognition识别名人的能力,他希望这个项目能够在其它系统上进行实验。