复制成功

分享至

网站首页 > 资讯 >

OpenAI加入文本到视频领域,推出Sora,挑战Meta、MidJourney和Pika Labs

2024.02.17

OpenAI今天发布了Sora,这是一个新的人工智能模型,可以接受基于文本的指令并创建长篇吸引人的视频。嗯,一分钟长的视频。

这对于全球AI领导者来说有些晚了,因为文本到视频并不是未知领域。像RunwayML和Pika Labs这样的公司已经在这个领域有一段时间了,并且目前以能够在几秒钟内创建令人惊叹的视觉效果的模型而称霸了这个领域。

但总会有一个问题:这些视频往往很短,故事随着时间的推移失去了焦点和连贯性。

通过Sora,OpenAI的目标是实现一致性,生成高度详细的、一分钟长的视频,可以流畅地流动和发展。这并不是一个简单的目标,因为AI模型实际上是从头开始即兴创作每一帧。单帧中的微小缺陷可能会演变成一连串的幻觉和不真实的图像。

不过,OpenAI似乎已经取得了一些进展,Sora展示了流畅、引人入胜的视觉效果,迄今为止还没有任何其他竞争对手能够匹敌。这是今天在YouTube上发布的一个非官方演示:

OpenAI正在与其他正在测试生成视频的AI公司展开竞争。受欢迎的文本到图像生成器Midjourney最近宣布正在研发文本到视频生成器,但没有提供发布日期。此外,Stability AI最近也以其开源产品Stable Video Diffusion引起了轰动,该产品能够以576x1024的分辨率生成25帧的视频。

甚至Meta也在展示其EMU视频生成器,这是其将AI融入社交媒体和元宇宙的努力的一部分。

Sora目前只在有限范围内发布,OpenAI向“视觉艺术家、设计师和电影制作人”提供了反馈,通过理解语言的方式使自己脱颖而出。它在解释书面提示的细微差别的同时生成充满活力、高度详细的图像。需要特定的摄像机运动?多个具有逼真情感的角色?没问题。

Sora甚至可以在同一视频中不同镜头之间生成无缝过渡,模仿了一些视频编辑工具今天已经做到的。这是今天在YouTube上发布的另一个爱好者视频:

即便如此,由AI驱动的创造力也有其特点。Sora还不是一个完全的电影大师。换句话说,可能会出现物理或复杂因果关系的问题,虽然它已经是最一致的视频生成器之一,但它并没有达到绝对忠实的水平,因此可能会出现幻觉。

此外,作为来自OpenAI的产品,Sora无疑将是一个受到严格审查的模型。该公司强调其专注于安全测试和检测工具,以标记潜在有害和误导性内容。OpenAI正在与其红队合作,以完善其模型,并希望其早期发布策略将在未来几年内促进构建越来越安全的人工智能的合作。

Sora的更广泛实施尚未宣布具体的发布日期。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKx资讯仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

相关推荐

industry-frontier