Facebook的审查人员无法审核人们在平台上发布的每一张图片,因此Facebook希望通过人工智能来帮助他们。在一篇博客文章中,Facebook介绍了一个名为Rosetta的系统,它可以利用机器学习来识别图像和视频中的文本,然后将其转录为机器可读的内容。特别地,Facebook发现这个工具有助于在表情包上转录文本。
文本转录工具并不是什么新鲜事,但Facebook却面临着不同的挑战,因为其平台量级巨大,以及其上的图像种类繁多。根据官方说法,Rosetta现在已经上线,每天会从Facebook和Instagram上抓取10亿个图像和视频帧文本进行转录。
目前还不清楚Facebook正在对这些数据进行怎样的处理。文章指出,这对于照片搜索和屏幕阅读器等基本功能非常有用。但看起来Facebook也开始把它放在更大的目标上,比如弄清楚什么样的内容更吸引人,更重要的是,可以找出哪些表情包、图片或视频中存在仇恨、侮辱等不当言论。
Facebook表示,文本提取和机器学习正在被用于“自动识别违反我们的仇恨言论政策的内容”,而且该系统还支持多语言。鉴于Facebook众所周知的内容审核问题,一个能够自动标记可能有问题的图像的功能,对于Facebook来说应该会很有用。