能不能火,AI知道
一部好剧本,不光是好口碑和大流量的基础,也能带来更高的商业回报。因此,在评价剧本时,需要认真对待。
与一般艺术作品的评价形式类似,影视行业也有一套完善的标准,用来给剧本打分。
一个典型的剧本打分表格
参与剧本评价的成员,一份评分表,在每一条细则上打分。绝大多数情况下,总分反映剧本的好坏,并决定其接下来的命运。
无论中国还是外国,剧本的审读者用自己的标准,影响着剧本创作。然而,这样的标准对于剧本创作来说,多少显得主观,并有意无意地迎合分析师或剧本审阅人的口味,甚至展开了有趣的攻防游戏。
典型的如影视数据专家史蒂芬·弗洛斯(Stephen Follows),他研究了12309部失败剧本,并指出,一份剧本成功与否的三个关键是人物塑造、情节和风格,而最不重要的三个因素则是格式、原创性和剧本的悬念。
他甚至总结出数条技巧,帮助编剧打动分析师和制片人。[9]
不过,如果越来越多的剧本都用了这些技巧,反而会增加筛选难度。实际上,视频平台每年要播出的网剧就有上百部,这还不算每年上线的网络电影数量,对平台来说,为了降低海量影视剧的筛选成本,就需要一个靠谱的工具,辅助专家决策、作者创作和文本审核。
人工智能可以解救编剧们于水火吗?这得看AI审剧本的原理是否靠谱。
国内外的剧本智能评价系统,都建立在NLP(自然语言处理)技术上。利用这一技术,计算机就可以“读懂”剧本,这是AI评价剧本的基础。
NLP技术是人工智能领域的一个分支,是一种能够转换人类文字语言与二进制语言的技术,能够实现人与计算机之间的有效通信。简单来说,就是人和计算机之间的一个“翻译机”。
NLP技术的作用 | 来源:easyai
能看懂剧本还不够,更重要的是让AI形成标准,知道该怎么读懂、评价剧本。
国内外目前比较普遍让AI理解长文本的做法,是利用BERT等深度学习语言模型,对长文本内容进行分析与评估。模型的训练,需要搜集大量样本数据训练AI,让模型“学习知识”,再让它把学到的经验投入应用。
爱奇艺知文系统技术负责人温旭告诉放大灯团队(ID:guokr233),作为爱奇艺内部使用的内容理解平台,知文主要综合使用经典机器算法(贝叶斯平均、DBSCAN、XGBoost等)和深度语言模型(Attention、BERT、GRU等)[18],通过去中心化调度模式和统一管理平台,对长文本进行分析和评估。
爱奇艺知文系统
那……如何训练AI呢?还得靠人类。
温旭表示,知文系统在开发初期,对标注数据十分依赖,需要大量的人工标注员做标注工作。
这些标注员的工作,就是在剧本里“打标签”。简单的如标记一个人名、地名,复杂的则有人物关系、人物性格、情节点等,AI看到剧本里的标注,就知道剧本写得好不好了。
在训练AI时,“题海战术”非常关键——AI看的剧本越多,积累的知识和经验也越丰富,最后的评价结果也就越准。
爱奇艺的知文系统有海量训练集,每一个样本都有几十乃至上百万字。知文团队还在通过内外部渠道,获取更多剧本训练AI。
学成归来,AI才有资格进行“实战”。
无论真人还是AI,对剧本的评估维度无非字数、场次、结构、人物、情节等。
两者的差别在于,AI评价剧本的粒度足够细致,而且因为标准统一,剧本能够得到相对公正的对待。但不同的AI剧本评估系统,所关注的侧重点也有所不同。
比利时的AI评估系统Scriptbook,就更关注影视的票房表现。
该公司创始人纳迪拉·艾泽玛伊(Nadira Azermai)是美国根特大学的应用经济学硕士[10]。在搭建Scriptbook的算法模型时,纳迪拉便利用这方面的经验,“在融资、制作和发行之前,对电影的商业价值进行客观评估”。[11]
Scriptbook曾回顾性确定了2015~2017年间,索尼32部作品中有22部是“票房毒药”。在2018年一场公开演讲中,纳迪拉表示“索尼本可以避免这22次失败的投资,前提是使用Scriptbook的系统。”[12]
相比Scriptbook“事后诸葛亮”式的回顾性研究,市场显然更需要预测性研究的产品。
一个案例是南加州大学维特比工程学院研发的AI工具。它依然基于NLP技术,能够在影片制作前对作品进行评级,帮助制片人调整暴力程度,降低后期重新拍摄或编辑的压力。[13]
爱奇艺的知文系统,与南加大的产品又有不同。在爱奇艺,知文能够接触到一批最新、最好的剧本,有机会直接应用于大量优质剧本,锻炼出深度的理解分析能力。这是创业公司和学校研究所无法提供的优势。
此外,知文还更关注剧本本身。
“主要是从长文本分析入手,侧重点在于对剧本或者小说内容本身的分析。”温旭表示,用户只需要上传前几集剧本,知文就能从剧本的字数、场次、人物、情节等维度,进行初步分析。
这些维度也是有排序的,人物和情节对剧本的重要性更高,两者的优先级也更高。其中,人物包括角色有谁、角色性格、角色间的关系、角色的出场、互动、戏份、情感变化,而情节则包括冲突和精彩度等。知文会评估每一个细节,并给出一个总的结论和评分。
知文系统对电影《我不是药神》的剧本情感分析结果
总之,知文的工作就是尽可能地把剧本评价数据化、标准化。温旭表示:“因为评价逻辑是一致的,它给出的评估结果,在大体方向上与编导的意见也不会相左。”
赚钱不是影视行业的评价的唯一标准,剧本本身是否优秀更加关键。
知文系统识别劣质剧本的人机一致率高达88%。正如爱范儿对这类产品的评价:“在这个烂片层出不穷的时代,如果能用AI把一些辣眼睛的电影扼杀在摇篮里,那也是极好的。”[14]