OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时透露,Sora文生视频工具计划在今年内正式推向公众。此外,OpenAI还计划为Sora加入音频生成功能,进一步丰富视频的场景和情感表达。
目前,Sora模型已经具备输出60秒视频的能力,其中包含了高度细致的背景、复杂的多角度镜头以及富有感情的人物、动物角色,自推出以来引起了业界和消费者的广泛关注,但Sora目前只向测试团队和一部分视觉艺术家、设计师和电影制作人开放, 普通人难以体验Sora文生视频的魅力。
穆拉蒂透露,目前利用Sora生成视频的成本过高,这是Sora难以普及的一个重要原因,团队正在优化相关技术,促进Sora造福更多人。她还表示,OpenAI计划加入音频功能,并允许用户编辑Sora生成的视频内容,以此来使其生成的视频更符合要求。
Sora的研究表明,通过扩展视频生成模型是构建物理世界通用模拟器的一条极具前景的途径,对此360创始人周鸿祎曾如此评价:“一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离AGI(通用人工智能)真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。”
随着Sora技术的不断进步和成本的降低,我们有理由相信,不久的将来,这项创新的视频生成工具将不再是少数人的专属,而是成为大众创作的新宠。至于Sora的公开是否会促进通用人工智能的发展,相信我们很快就可以看到答案。
原文标题 : OpenAI首席技术官:Sora或将在今年向大众推出,增加生成音频