黑石集团在以太坊上的代币化基金支付了210万美元
稳定视频扩散是人工智能未来的稳定策略
在成功发射 文本到图像模型 ,一个有争议的 文本到音乐 以及在很大程度上未引起注意的 文本生成模型 稳定AI刚刚宣布发布稳定视频扩散,这是一个文本视频工具,旨在从新生的生成视频空间中开辟一大块。
"稳定的视频扩散[是]高分辨率最先进的文本到视频和图像到视频生成的潜在视频扩散模型,"稳定AI在该模型的 研究文件 ,并在 正式通告 他说:"我们的投资组合跨越了各种模式,包括图像、语言、音频、3D和代码,这证明了AI致力于增强人类智能的稳定性。"
这种适应性加上开源技术,为广告、教育和娱乐领域的众多应用铺平了道路。根据研究人员的说法,稳定的视频传播(现在可以在研究预览中使用)能够"以其计算预算的一小部分超越基于图像的方法"。
稳定的视频传播技术能力令人印象深刻.研究报告揭示:"人类偏好研究表明,结果模型优于最先进的图像到视频模型。"稳定性很明显对模型在将静态图像转换为动态视频内容方面的优势充满信心,它的模型在用户偏好研究中优于封闭模型。
稳定AI在稳定视频扩散保护伞下开发了两种模型:svd和svd-xt。svd模型在14帧中将静态图像转换为576×1024视频,而svd-xt使用相同的架构,但扩展到24帧。这两个模型都提供视频生成,帧速率从每秒3帧到30帧不等,处于开源文本到视频技术的前沿。
在迅速发展的人工智能视频生成领域,稳定的视频传播与创新的模型竞争,如皮卡实验室,跑道和元模型。后者最近宣布 视频 与文本到视频的能力相似,其独特的图像编辑和视频制作方法显示出巨大的潜力,尽管目前限制为512x512像素分辨率的视频。
尽管它在技术上取得了成就,但它正在应对各种挑战,包括 道德考虑 在人工智能训练中使用版权数据。该公司强调,该模型"不打算在现阶段用于现实世界或商业应用",重点是根据社区反馈和安全考虑对其进行改进。
从 成功 对于SD1.5和SDX--最强大的开源图像生成模型--这个视频生成场景中的新尝试预示着一个未来,想象和现实之间的界线不仅是模糊的,而且是优美的重新绘制。