外网玩疯了，毫无底线，成为图片生成新王者

余鱼阅读：496 2024-08-17 12:46:40 评论：0

来源：FounderPark

昨天马斯克的Grok-2发布，加入了FLUX模型提供的文生图能力。一夜之间，FLUX毫无底线的图片血洗X（推特）。

自从Google把美国开国总统和印第安人都画成黑人之后，马斯克带头掀起另一个极端的文生图刷屏现象。

FLUX模型，来自于德国创业公司BlackForestLabs，拳打MJ脚踩SD，图片质量做到了行业天花板，道德底线也压到了地板砖。

生成质量高，

内容‘毫无限制’

首先在X上引起热议的，是前几天网友制作的TEDxAI讲师。

仔细看，嘉宾卡上的Google字样与真实的logo毫无区别。

比如这张华人讲师：

而在图片准确性上，FLUX可以说直接把Gemini摁在地上打。BlackForestLabs的董事AnjneyMidha在X上发布了一系列比较的图片，关于一些历史人物的准确性的对比。

一幅古希腊哲学家的画像，左侧为Gemini，右侧为Grok2。

一幅1943年德国士兵的图像。

一位超级碗夺冠的四分卫。

几乎‘没有任何限制’的文生图

Grok2发布后，很多网友发现，FLUX几乎在生成图像上没有做任何限制。特朗普、迪士尼米老鼠、泰勒·斯威夫特等等诸多在别的AI工具里无法生成的内容，在FLUX上都可以生成。

比如老少咸宜的米老鼠。

民主党两任总统热情相拥。

比尔·盖茨从一张贴有Microsoft标志的桌子上嗅着一行可卡因。

麦当劳、唐老鸭和皮卡丘，还都是暴力版本的。

恶搞特朗普和马斯克的图片更是推特的一大热门。

特朗普在监狱。

特朗普和二次元。

忍者神龟版的马斯克。

发胖版的马斯克。

甚至还有这种：

根据ArtificialAnalysis的数据，BlackForestLab的FLUX.1模型在质量方面超越了Midjourney和OpenAI的AI图像生成质量，至少从用户在图像领域的排名来看是这样。

从质量和生成成本上来看，FLUX.1[schnell]遥遥领先。

与其他文生图产品不同，Grok不会拒绝涉及真人的提示词，也不会在其输出中添加识别水印。

这种无限制，可能也是马斯克会选择FLUX的原因之一，马斯克此前曾多次表示，给大模型设置安全措施会降低AI的安全性。

种子轮a16z投资，

上来就跟大公司合作

8月1日成立，BlackForestLabs目前已完成3100万美元的种子轮融资，由a16z领投，还有YCombinator首席执行官GarryTan和Oculus前首席执行官BrendanIribe，以及一些知名AI研究专家。

本次发布的FLUX.1模型，也按照能力的不同，在商业使用上有所不同。

FLUX.1[pro]，全新的SOTA文生图模型，具有极其丰富的图像细节、极强的prompt遵循能力和多样化风格。目前可以通过API使用，只开放商用权限。

FLUX.1[dev]，FLUX.1[pro]的开放权重、非商用变体，基于后者蒸馏而成。该模型的表现优于Midjourney和StableDiffusion3等其他图像模型。推理代码和权重已经放在了GitHub上。

开源的FLUX.1[schnell]，它是超高效的4-step模型，遵循了Apache2.0协议。该模型在性能上与[dev]、[pro]非常接近，可以在HuggingFace上使用。

考虑到初始团队大都来自StableDiffusion，这次的模型发布也覆盖了商用、开源权重到完全开源，能力最强的提供商用和企业合作的机会，基础版权完全开源。

跟StableDiffusion不同的是，这次BlackForestLabs和xAI进行了合作，为Grok2提供了图像生成功能，怎么说，算是一个双赢的合作，不管是吸引更多用户，还是积累更多数据进行数据飞轮。

而对BlackForestLabs来说，这次合作带来的算力和资金的支持，应该也可以帮助他们的模型得到更快的提升。

成员来自StableDiffusion核心团队

这家总部位于德国的公司由RobinRombach、AndreasBlattmann和DominikLorenz领导，他们都曾是StabilityAI公司的工程师，以及其他开发基于扩散的人工智能模型的领军人物。

RobinRombach是开发出文生图模型StableDiffusion的两位主要作者之一，而AndreasBlattmann和DominikLorenz也都是知名论文《High-ResolutionImageSynthesisWithLatentDiffusionModels》的主要作者。

他们之前的代表性工作包括VQGAN和LatentDiffusion、图像和视频生成领域的StableDiffusion模型（包括StableDiffusionXL、StableVideoDiffusion和RectifiedFlowTransformers）以及用于超快实时图像合成的AdversarialDiffusionDistillation。

可以说，BlackForestLabs就是一个增强版的StableDiffusion。

他们将有可能引领开源文生图的再一次新风潮，甚至改写文生图领域的进程。

在他们的官方介绍中，下一步计划推出SOTA文生视频模型，为视频生成技术打下基础，外网玩疯了，毫无底线，成为图片生成新王者目标是为所有人提供最先进文生视频技术。

参考资料：

https：//www.theverge.com/2024/8/14/24220173/xai-grok-image-generator-misinformation-offensive-imges

https：//techcrunch.com/2024/08/14/meet-black-forest-labs-the-startup-powering-elon-musks-unhinged-ai-image-generator/

https：//www.tomsguide.com/ai/ai-image-video/forget-midjourney-flux-is-the-new-king-of-ai-image-generation-and-heres-how-to-get-access

标签:雨后小故事图

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。