二、检察官
无论是歧视还是错误的机器直觉,在本质上都可归因于深度学习的黑箱性。那么是不是有方法可以去透视黑箱,让人类研发者找到问题AI的出错点,从而去修正而不是鲁莽地中断它呢?
事实上,解决黑箱才是AI安全领域与应用场景的主要努力方向。我们今天已经可以看到越来越多的黑箱解释工具出现在科研甚至产业领域。
今天解释黑箱的主要方式有两种,一种是用AI来检索AI,比如利用注意力机制,训练一个神经网络模型专门去复制追踪其他AI模型的运行轨迹,从而找出错误训练结果的训练来源,帮助研发者进行修正。
另一个思路是通过一些工具,达成深度学习模型的结构可视化,也就是说让黑箱变成玻璃箱。从而当AI出错,研发人员可以相对简单的自行查询每一层的训练过程,找到问题所在。
然而无论是AI检察官,还是人类检察官,今天这些黑箱可解释性技术普遍都只能应对不那么复杂的深度学习模型。而且普遍需要大量人工来参与其中,又把人工智能变成了“人工+智能”,而且所耗费的人力必须具备相当的技术水准。
三、道德家
无论从何种方向上看,阻止AI作恶在今天都不仅仅是一个技术问题。比如训练数据的三观够不够正,很多程度取决于开发者的三观;再比如能否克制对开发AI武器、AI监视工具的渴望,应该是一个社会与国际责任的问题;而很多AI歧视问题,出自于背后开发者希望提高商业效率的目的,这也是个道德问题。
为了预防这些问题泛滥,AI的安全锁显然不仅应该是一把技术之锁,而应该引入广泛的社会机制。今年2月,OpenAI、牛津大学、剑桥大学等14家机构和高校发布了一份名为《人工智能恶意使用》的研究报告。报告指出,应该承认今天人工智能的研究成果是一把双刃剑。而为了控制人工智能带来的风险,政策制定者应该与技术人员密切合作,调查、预防和缓解人工智能可能的恶意使用方式。并且应该在人工智能领域优先形成规范和道德框架;讨论这些人工智能挑战时所涵盖的利益相关者和专家范围应该扩大。
防止AI的恶意问题,应该从技术、法律、道德、研究习惯等领域进行综合防治,这已经成为了一个国际社会共识。但是显然这把锁看上去最简单,实际铸造起来的难度高到无法想象。
无论是“断电”、大检查还是社会共同监督,这些AI安全锁的背后,都隐藏着在AI伦理问题面前,今天人类共有的彷徨:人性的本质是矛盾的,但我们却想要模仿人类的AI具备统一规则。
可是,谁来担保安全锁的清白?
无论任何AI安全保护措施,归根结底就是一句话:希望AI能明辨善恶,善则从之,恶则止矣。
而这谈何容易?在AI需要越来越多人类社会产出的训练数据时,人类的种种价值判断也映射其中。一些人类社会中的伦理障碍也不免裹挟进了AI的世界。
比如说,我们已经开始探索,能不能让AI系统在其他AI犯错时终止它的行为。但这就涉及什么才是错误AI行为的定义边界问题。谁来标注错误行为呢?
我们都知道,谷歌AI曾经把黑人识别成猩猩,这显然是一种歧视行为。但如果AI判断应该在某个治安不好的街区加强警力部署,那这是不是也是一种歧视,应该被终端呢?这个问题确实已经在洛杉矶警察局所使用的系统中展现了出来,在加州当地引发了激烈争论。
更进一步,国家间的AI规则是否应该一致?今天越来越多的AI公司与国际产业组织,甚至政府组织开始呼吁重视AI的伦理道德问题,制定国际统一的AI道德规范。但统一的AI规范会不会侵犯某些国家的风俗与习惯?是不是会对一些国家地区的AI研究造成阻碍?比如说欧盟的AI研究隐私保护政策真的适合全世界吗?
这些AI伦理层面近乎悖论的问题,是一切AI安全锁技术与产业行为面对的最深处敌人。甚至向更长远的未来看去,人类的行为判断真的就比AI好吗?某些时候,用技术来中断不可预测的机器学习行为,是否其实展露着人类的无知?或者终止了用技术创造技术的全新可能?
好吧,这些问题在今天都没有什么真正的答案。这也意味着,今天想要给AI戴上一把严格意义上的安全锁,还是一个不可能的任务。然而破解AI黑箱性和AI自我监督的技术进展,确实正在让AI应用的安全指数快速提升。很多今天浮现在媒体中的AI安全问题,应该都可以被快速解决掉。
问题和解决方案,永远是交替往复的状态向前奔跑。
最后让我们“科幻”一下来结束这个话题。
文 / 脑极体