电影是一种集合了声音、图像、剧情、表演等多种元素的艺术形式,它的制作过程通常需要大量的人力、物力和财力。但是,随着人工智能(AI)技术的发展,尤其是OpenAI最新的“文生视频”技术Sora,这一切可能都将改变。
Sora可以根据简单的文字提示生成内容丰富、画面逼真的视频,甚至可以自行分镜、切换景别,让普通人以极低的门槛制作自己的电影。该技术一经发布,就在全球引发轰动和讨论,有人称“现实将不存在了”。
在X(原推特)上,甚至有分析认为,“将来,只需要输入分镜脚本,电影就可以制作出来,不再需要几十人几百人声势浩大地去‘拍’了,也不需要什么摄影组、演员组、服装组、化妆组、灯光组、司机组了,也不需要去管理剧组,只需要掌握相应的知识,然后使用AI……不用求人的将来很快就来了。”
在接受《》记者的导演看来,类Sora的工具会让电影制作的效率大大提升,解决电影制作中前后期不匹配的问题。这类技术的出现一定程度上确实可能会取代电影的服装、化妆、道具(下称“服化道”),但也存在难度。
对于Sora等AI工具在电影画面实际生成过程中的质量,他们仍持较为保守的态度。一位导演就对记者直言,一些需要真人演员表达巨大情感张力的场景,如果替换成AI生成的画面,观众就很难产生共情,甚至可能会有抵触的情绪。
Sora代表着“文生视频”技术的巨大飞跃
记者注意到,大多数主要的AI公司多年来一直在研究“文生视频”工具,一些公司已经发布了用户可以使用的软件。在Sora发布之前,最新版本的Runway就是最先进的“文生视频”技术,可以根据文本提示制作短视频。
New York Magazine报道称,虽然Sora目前尚未向普通用户开放使用,但根据OpenAI官方发布的Sora根据提示文字生成的视频,从现实主义、及时的反应、视频长度和功能性方面,似乎是一个相当大的技术飞跃。
从细节上看,Sora的演示视频有丝滑的移动运镜、场景转换,还可以自行分镜、切换景别,这意味着Sora可能让普通人以极低的门槛制作自己的电影。更值得一提的是,此前的文生视频模型,由于是生成单镜头,一旦输入新提示词,就会生成新镜头,主角就会变换,而Sora生成的视频,在视角转换、镜头景别切换后,仍保持主体的一致性。
OpenAI官网介绍,“Sora能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅能理解用户在提示词中提出的要求,还能理解这些东西在现实世界中的存在方式。”这意味着,如果说GPT能通过人类的语言来理解世界,那么Sora则能通过视频、图片等多模态数据来理解世界。
The Hollywood报道中称,虽然类似的“文生视频”工具此前已经出现,但Sora确实代表了这项技术的快速发展,它有可能导致大量的裁员。
今年1月份发布的一项调查显示,好莱坞3/4的受访者预计AI将导致他们的公司裁员或合并。据估计,未来三年将有近20.4万个类似的职位受到AI的冲击。根据这项调查,音效工程师、配音演员和概念艺术家将首当其冲,视觉效果和其他后期制作也将受到冲击。如果技术继续进步,这类职位将越来越多地被AI工具所取代。
类Sora工具可能取代“服化道”,但仍存难度