Engadget最新报道称,研究人员开发出的一种新的算法,这种算法可以识别出一个程序的作者是谁。
程序员在写程序时往往有着自己独特的风格,但是在寻找关于一个程序的作者时,查看所有的代码并不现实。现在,也许没有那个必要了。
研究人员已经开发出一种机器学习系统,可以通过原始源代码或编译的二进制文件对程序员进行“去匿名化”。研究人员称,该方法是训练一个算法来识别程序员的编码结构,并基于它们的工作实例,使用这些算法来确定代码样本中的共同特征。
在使用Google's Code Jam结果的测试中,用这种AI识别的结果相对准确,但并不是万无一失的,每个系统有600名程序员和8个样本,该系统的正确率达到了83%。
这项技术对调查人员来说可能是一个福音。这对识别恶意代码或软件的创建者时很有用,特别是当肇事者试图嫁祸其他人时。它也可能对抄袭代码或者程序的案件有所帮助。
当然,这个系统也可能是一种麻烦。虽然掩盖代码的真实来源是可行的,但这就可能难以实现真正的匿名代码,利用这种AI技术就可以找到真正写代码的人。