人类有无数种办法打发无聊的时间,“找茬”就是其中一种。
别误会,这里说的不是打架那种找茬,而是那种在图片中找到特定要素的小游戏。我身边就有一些朋友很喜欢玩这种类型的游戏,不论是在手机上还是杂志上,这样的休闲方式的确很消磨时间,近些年移动平台还诞生了诸如《隐藏的人》这样优秀的另类找茬游戏作品。
不过,一旦把这样的游戏,比如流行至今的“Where is Waldo”(中文名沃利藏在哪儿)交给机器来玩,它也许会瞬间毁掉杀时间的乐趣,你不相信?那先来看一段视频吧。
这是来自创意广告代理商 Redpepper 的设想,他们假设能通过机器学习的方式识别图片信息,然后用摄像头来拍摄图片并查找到特定要素,从而迅速完成原本需要人眼观察的找茬游戏,虽然听上去可行,但效果怎样就要进行验证了。
于是就有了这套一树莓派计算机+机械臂+摄像头+硅胶手组合起来的机器人。它重点部分自然是利用相机部分实现机器的面部识别。为此,开发者采用了 Google AutoML Vision 服务来进行数据分析。这套系统会通过照片训练来达到面部识别的高准确度匹配,准确率虽然没有 99%,但 95% 的匹配率对于玩这样一个杂志上的小游戏来说还是没多少问题的。
机械臂部分采用的是 uArm Swift Pro,这个结构简单的机械臂实际上能完成很多类似人手才能完成的高级任务,实际上早在去年年初我们就曾对它进行过介绍,这一次团队尝试拿它当作眼睛的一部分,手臂在图像上来回扫动可以让摄像头记录完整图像信息,从而保证信息收录的完整。
为了看清数据信息,团队还需要能识别出画面中的特定要素。这时候采用 Google 服务就体现出了优势,团队创意技术专家 Matt Reed 谈到,Google 搜索引擎中关于要寻找的特定元素,也就是主人公 Waldo 有不少样本数据,这让他们不用再花功夫上传那么多样本。
通过对 62 个不同的 Waldo 头像和 45 个上半身图像的识别训练,机器已经得到了一个新的模型,尽管团队最开始对于这样的数据样本并没有太多信心,但结果它的匹配程度出乎意料,在光线、图片等外部环境都正常的情况下,你可以看到让它找出目标 Waldo 有多简单。
所以问题来了,为什么有人要花心思做这样一套机械系统来玩这种本来供人娱乐的小游戏?
Matt 谈道,其实他是从 Amazon Rekognition 系统识别名人的事情中受到启发,既然能够识别出现实中的名人图片,那么漫画中的人物是不是也能做到呢?于是就有了今天我们看到的这个特别的“找茬”机器人,别说,它还真是比人的眼睛要快很多,几乎是片刻之间就能找到目标。
这件事让我想起极客之选(微信号 GeekChoice)曾报道过的另一件类似的事情,就是一位住在荷兰的软件工程师,因为不愿意让流浪猫在外受冻,设计了一个“猫脸识别”系统,只要猫来到家门,系统识别后就能给它开门。
实际上这套系统用到的就是 Amazon Rekognition 服务,这说明不论 Google 或是 Amazon,这些互联网公司提供的服务都可以用来完成“特殊的面部识别”这样的事情,这就为面部识别的应用创造出更多可能。
不过,要是哪一天满心期待地翻开这些书,却看到已经有谁把 Waldo 用记号笔圈出来,还写着“我是机器人”时,那真的会让人头大呢。