黑石集团在以太坊上的代币化基金支付了210万美元
认识Flux:新的开源人工智能图像生成器击败了Midjourney、SD3和Auraflow
Black Forest Labs——这个曾经帮助开发原始 Stable Diffusion 的团队——推出了迄今为止最大的开源文本到图像模型 Flux。Flux 拥有惊人的 120 亿参数,可以生成与 Midjourney 不相上下的视觉效果,甚至可能超越当前任何其他模型——无论是开源还是闭源。
Flux 有三种变体:Flux Dev 是开源的,采用非商业许可证供社区开发使用;Flux Schnell 是更快速的精简版本,运行速度最多快十倍,采用 Apache 2 许可证,是顶级模型;Flux Pro 是闭源版本,通过 API 提供。
Flux Dev 和 Flux Schnell 可在 Hugging Face 上下载。ComfyUI 也已更新,以支持 本地工作流中的新模型。
Black Forest Labs 在周四宣布了这一消息,强调了该团队在推动生成式 AI 媒体方面的卓越记录。
“我们的创新包括创建 VQGAN 和 Latent Diffusion,以及 Stability AI 的 Stable Diffusion 图像和视频生成模型(Stable Diffusion XL、Stable Video Diffusion、Rectified Flow Transformers),以及用于超快速实时图像合成的 Adversarial Diffusion Distillation,” 该团队表示。
此次发布是在成功完成了由 Andreessen Horowitz 领投、并得到包括 Brendan Iribe、Michael Ovitz 和 Garry Tan 在内的知名投资者支持的 3100 万美元种子轮融资之后。
在基准测试中,Flux 表示其模型在图像合成方面树立了新的标准,超越了 Midjourney v6.0、Dall-E 3(HD)和 SD3 Ultra 等模型在视觉质量、快速跟随、大小/比例变化、排版和输出多样性方面。Black Forest 的图表声称,其 Pro 和 Dev 模型是迄今为止最佳的图像生成器,而其性能较弱的 Schnell 位于 Midjourney v5 和 Ideogram 之间。
Flux 评分与其他 AI 图像生成器对比。图片:Black Forest Labs
然而,拥有较小 GPU 的用户可能就没那么幸运了。这些开源模型的大小约为 23GB,这意味着可能需要近 24GB 的 VRAM 才能运行,直到发布量化版本——如果有的话。但即便如此,似乎拥有 6GB 和 8GB VRAM 的 GPU 用户很快就要告别测试新 AI 模型的乐趣了。
然而,Black Forest 已经与 Fal AI——Auraflow 的开发者——合作,支持云端生成。这些模型也可以在 Replicate.com 上免费测试。一旦用户达到每日配额,使用 Flux Pro 可以生成 33 张图片,或者使用 Flux Schell 可以生成 333 张图片,每次费用为 1 美元。
这比 Midjourney 或 Ideogram 更有价值。Midjourney 的基本计划每年收费 96 美元,让用户每月生成约 200 张图片,相当于每美元约 25 张图片。Ideogram 的基本计划每年收费 $84,每月最多提供 400 张图片,或者每美元约 50 张图片。
测试 Flux
在基准测试中,Flux 的表现非常出色,但它的创作有多好呢?我们已经将其与迄今为止最显著的开源图像生成器进行了比较,并确认我们印象深刻。让我们比较一下 Flux、SD3 Medium 和 Auraflow,然后将其与 Midjourney 进行对比。
插图
提示 1:“手绘插图,描绘一只巨大的蜘蛛在丛林中追逐一名女性,场景极其恐怖、令人痛苦、黑暗而诡异,带有恐怖片的影响,有模拟摄影的痕迹,素描。”
Flux 展现出了出色的氛围光线和阴影运用。蜘蛛的设计确实令人恐惧,其锋利的腿和可怕的面孔。女性脆弱的姿势很好地传达了痛苦。这是对解剖学最准确的表现。
Auraflow 的青蓝色调给人一种怪异、超现实的感觉,但并没有完全捕捉到“黑暗和诡异”的要求。蜘蛛的设计不够恐怖,更多地是风格化的。
SD3 Medium 的黑白风格具有浓厚的素描质感。蜘蛛的设计详细而可怕,但在肢体上有一些形态上的缺陷。
我们的排名:
Flux:最能捕捉到恐怖、痛苦和诡异氛围。它是最准确的创作,没有形态上的缺陷。
SD3 Medium:视觉上引人注目,但与提示中的“模拟摄影”方面最不符合。恐怖风格是显而易见的。
Auraflow:最接近素描和整体模拟摄影。然而,它最不恐怖、最不可怕,也最不传达整个场景的氛围。