2月16日,OpenAI发布首款文生视频大模型Sora,这几天市场上已经有很多解读。其之所以让人感到惊艳,在业内人士看来,主要有三点: 第一,Sora可生成60秒超长视频。相较于Runway MLGen-2、Pika等文生视频大模型,Sora可以生成60秒一镜到底的视频,视频逻辑顺畅、主人物及背景的行人均非常稳定,文生视频大模型能力进一步提升。 第二,Sora多角度视频一致性。Sora可以在单个生成视频中创建多个镜头,以准确保留角色和视觉风格。OpenAI官网发布的Demo视频中,有多角度镜头,且主人物保持了完美的一致性。 第三,Sora在尝试理解物理世界。根据OpenAI官网披露,Sora不仅可以理解用户Prompt(提示)的要求,同时亦尝试理解Prompt中的事物在物理世界中的存在方式(即物理规律)。根据OpenAI官网Demo视频,汽车在山路行驶中的颠簸等动作符合物理世界规律,视频逼真度进一步提升。 方正证券表示,从Runway MLGen-2、Pika到Sora,文生视频大模型频出,视频长度从表情包长度的3秒-4秒到主流短视频长度的60秒,模型对物理世界的理解愈加接近现实,已具备商业化落地价值,创作内容产业革命来临,AIGC新时代已至。 华鑫证券表示,Sora的发布有望提升AI多模态的热度,可关注AI多模态应用塑造数字内容生产与交互新范式,赋能视觉行业,从文字、3D生成、动画、电影、图片、视频、剧集等方面,有望带来内容消费市场的繁荣发展。 在Sora发布同时,谷歌也推出其新一代多模态模型Gemini Pro1.5,该模型具有突破性的能力,能够处理达到100万Tokens的复杂上下文。 中信证券表示,本次谷歌与OpenAI两家公司的模型更新仍然是围绕底层算法层面,尤其是模型的视频多模态方面进行展开,维持多模态与成本降低将是今年AI算法发展最核心的两个主线的判断。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,仍然持续看好AI算力层面,尤其是得益于商业端成熟而带来的更多的AI推理测算力的机会。 此外,假期期间,美股AI概念大涨,其中,超微电脑的走势最引人关注。 |
|
||
|