国内春节假期尚未结束,大洋彼岸的OpenAI就投放了一枚“深水炸弹”,让许多人感叹AI技术迭代太快,一批从业者面临“开工即失业”的危险。

北京时间2月16日,OpenAI重磅发布了首个文生视频模型Sora。根据OpenAI的官方简介,Sora可以制作长达60秒的视频,视频包括了高度清晰的场景、复杂的镜头动作,并可支持多个角色的创作。OpenAI在社交平台上发布了48个从9秒到60秒长度不等的视频样片,效果大幅超越了此前备受追捧的Runway和Pika等AI视频创业公司,引发广泛关注。

业内人士分析,Sora模型的发布将彻底变革传统影视制作过程,赋能内容创业行业降本增效,但也将对动画师、特效制作、视频拍摄剪辑等从业人员带来巨大冲击。Sora模型发布后,港股AIGC概念走高。Wind数据显示,截至2月16日收盘,港股AIGC(生成式人工智能)指数的54家成份股中,44家上涨。其中,阅文集团涨幅达10.14%,金山软件涨7.84%,阿里影业涨6.98%,商汤涨6.25%,知乎涨5.87%,哔哩哔哩涨4.73%。

可生成60秒连贯逼真视频

根据OpenAI官方介绍,用户可以通过使用自然语言提示词(Prompt),生成长达1分钟的视频。Sora模型对语言有深刻的理解,因而能够准确地理解提示词,并生成令人信服的人物,而且可以在一个生成的视频中创建多个镜头,在这些镜头中准确地保持角色和视觉风格的一致性。

Sora与其他的AI视频相比,主要有以下几方面的优势:

一是视频长度可达60秒。OpenAI在官网上放出了48个视频样片,其中最为广泛流传的是其中一个长度为1分钟的视频。在该视频中,一名穿着红色裙子和黑色夹克的女子正行走在日本东京街头,背景中的街道霓虹闪烁,人群熙攘。

在这则60秒的视频中,主人物一直在行走,背景街道中的景色及人物不断变化,但是主人物保持高度连贯性。在Sora模型发布之前,Runway、Pika等AI视频创业公司仅能做到几秒左右的视频连贯性。半年前,Runway将视频长度从4秒提升至18秒,且将效果提升至4K超高清水平,已被业界视为“天花板”。然而,Sora模型将长度从18秒拉长至60秒的水平,且效果逼真、细节生动,将行业的水位提高到了难以企及的高度。

二是可实现单视频多角度镜头自然切换。在上述的“女子行走在东京街头”视频样片中,后半段镜头由大全景切换至近景及人物脸部特写,转换十分丝滑。在另外一个视频样片中,一只狼对着月亮嚎叫,镜头也是从大全景自如地切换至中近景。同一个视频中采用多个不同景别和角度的分镜,且衔接自然毫无违和感,这是Sora模型令许多人感到惊艳的重要原因。

三是超高清和超逼真。在时长大幅提升的同时,Sora模型生成的视频保持高清的画质和逼真的效果。人物脸部的皮肤特点、动物毛发的特征都栩栩如生,细节处理上十分出色。

不过,Sora模型并非尽善尽美。在OpenAI放出的视频样片中,就有不少Sora模型“摆乌龙”和“翻车”的例子。例如,在其中一个样片中,提示词为“一个人跑步的场景,35毫米电影胶片”,Sora生成的视频搞反了人物在跑步机上跑步的方向;在另外一个样片中,提示词为“考古学家在沙漠中发现了一把普通的塑料椅子,正小心翼翼地挖掘和除尘”,Sora生成的视频出现了椅子变形及自动行走等诡异的场景。

OpenAI表示,目前Sora模型还有一些显著的弱点,比如难以准确模拟复杂场景的物理特性、无法理解因果关系,还可能混淆提示词的空间细节。一些业内人士也对Sora模型的实际效果提出了质疑,美国伊利诺伊大学厄巴纳-香槟分校的教授Ted Underwood在接受媒体采访时表示,OpenAI可能有选择性地挑选了表现最好的视频向公众展示。

目前,Sora模型尚未面向公众开放。OpenAI的CEO山姆·奥特曼在社交平台表示,目前Sora正在开展红队测试(一种安全评估方法),仅面向少数人开放。据介绍,OpenAI正与相关领域专家合作,对Sora模型可能存在的错误信息、仇恨与偏见内容进行研究与测试,确保产品安全及符合人类伦理。

影视行业将迎彻底变革

“Sora模型具备高级影视特效的制作能力,拥有改变影视制作游戏规则的力量。”清华大学新闻学院教授、博士生导师沈阳向证券时报记者表示。

沈阳认为,从发布的视频样片来看,Sora模型已经实现了对流体、毛发、火焰、光影追踪等元素的生成,且能够生成长达一分钟的视频。通过文本预测多帧组合排序,Sora模型解决了视频中主体一致性的挑战,可以实现复杂的影视级别的运镜,降低一镜到底拍摄的复杂性。这意味着未来影视拍摄将大幅度减少现场调度的压力和资金成本的耗费,减少后期特效的压力,缩短作品制作时长。

“解决了人物一致性问题之后,AI生成视频将大踏步前进,AI视频进入大爆发期。今年,我们大概率可以看到不需要演员的较长的电影。”沈阳说。

由于解决了视频生成的时长、连贯性、逼真度等难题,Sora模型让人们看到了AI赋能视频制作的广阔前景,让目前十分火热的短视频、短剧等影视行业从业者哀鸿遍野,“瑟瑟发抖”,害怕自己的工作被AI取代。

今年1月,一份面向好莱坞300名领导者的调查报告显示,四分之三的受访者认为AI工具将取代相关的工作岗位。该报告还显示,声音工程师、配音演员、后期特效制作、影视剪辑等工作岗位将最先受到冲击,且影响将随着AI工具的不断进化而扩大。与此同时,业内人士分析,Sora模型将利好编剧行业,因为剧本、文本创作能力将成为影视制作中的核心竞争力。

一名业内人士向记者表示,Sora模型是一把“双刃剑”。既可能导致部分视频从业者失业,也将帮助企业和个人提升视频制作效率,促进视频行业朝着更加高端和创新的方向发展。

360创始人周鸿祎认为,AI对影视行业的颠覆不一定那么快能到来。“机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。一个视频或者电影是由无数个60秒组成的,今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但不一定那么快能击败TikTok,更可能成为TikTok的创作工具。”周鸿祎表示。

申万宏源研究所互联网传媒行业首席分析师、总监林起贤此前在接受证券时报记者采访时表示,生成式AI对于内容行业专业从业者来说,能够提高生产效率和降低制作成本,例如在短剧生产制作中,已经可以用AI工具实现一键换脸、对口型等功能。“未来随着AI工具的不断进化,我们甚至可以看到普通用户制作AI微电影、AI动画电影等。”林起贤说。

责编:万健祎

校对:高源

相关文章