前Stability AI 核心成员 成立新公司 发布 Flux.1 开源图像生成模型

前Stability AI 核心成员 Robin Rombach 创立了一个新的公司:“黑森林实验室”,并且获得了3200万美元的融资。

同时他们发布了一个名为Flux.1图像生成模型家族。

黑森林实验室(Black Forest Labs)Flux.1模型家族包含以下三个变体:

1. Flux.1 [pro]

2. Flux.1 [dev]

3. Flux.1 [schnell]

Flux.1模型的技术细节

架构设计

Flux.1模型基于一种混合架构,结合了 multimodal and parallel diffusion transformer 架构,具有以下主要特点:

参数规模

关键技术创新
  1. 流匹配(Flow Matching)
    • 描述:流匹配是一种通用且概念简单的生成模型训练方法,包括扩散作为特例。
    • 优势:通过流匹配方法,模型在保持高质量生成的同时,提高了训练效率和生成速度。
  2. 旋转位置嵌入(Rotary Positional Embeddings)
    • 描述:引入旋转位置嵌入,可以更有效地捕捉数据中的位置信息。
    • 优势:提高了模型在处理不同尺寸和形状图像时的灵活性和准确性。
  3. 并行注意力层(Parallel Attention Layers)
    • 描述:在模型中加入并行注意力层,允许模型同时关注输入数据的多个不同部分。
    • 优势:显著提升了模型的计算效率和生成速度。
性能优化
图像合成的新基准

所有 FLUX.1 型号都支持不同的长宽比和分辨率(10 万和 200 万像素),如下图所示。

实际应用

同时FLUX.1 文本到图像模型套件,为他们即将推出的竞争性生成 文本到视频系统 奠定了坚实基础。官方称他们的视频模型将以高清晰度和前所未有的速度实现精确创作和编辑。

核心团队

  1. 创始人及领导者
    • 杰夫·迪恩(Jeff Dean):作为团队的领导者,杰夫在机器学习和生成式AI领域具有丰富的经验和深厚的知识。他在Google DeepMind担任高级研究员,并领导了多个关键项目的研发。
  2. 主要研究人员
    • 维克多·伊拉斯塔(Victor Irastorza):在生成模型架构设计和算法优化方面具有深厚的研究背景,曾在多家顶尖研究机构任职。
    • 艾玛·金(Emma King):专注于多模态学习和图像生成技术,发表了多篇重要论文,并在学术界和工业界获得了广泛认可。
    • 艾里克·斯通(Eric Stone):在深度学习和模型压缩方面具有丰富的经验,致力于提升模型的计算效率和生成质量。
  3. 工程团队
    • 卡拉·李(Cara Lee):负责模型的工程实现和优化,确保模型在不同硬件平台上的高效运行。
    • 雷恩·托马斯(Ryan Thomas):专注于大规模数据处理和模型训练管道的开发,提升了模型的训练速度和稳定性。

贡献与成就

融资与支持

演示效果:

示例1

Style: portrait
风格:肖像

Prompt: Create a captivating portrait of a voluptuous boho woman with green eyes and long, wavy blonde hair, she is standing. She has a fair complexion adorned with delicate freckles, and her expression is contemplative, reflecting a moment of deep thought. She wears a white-colored, off-shoulder linen satin dress, with deep neck linen, complemented by a necklace and various boho jewelry that accentuates her bohemian style., photo, poster, vibrant, portrait photography, fashion
提示:创作一幅迷人的肖像画,画中人物是一位拥有绿色眼睛和金色波浪长发的丰满波西米亚女性,她站立着。她肤色白皙,脸上有细腻的雀斑,表情沉思,反映出深思的瞬间。她身着白色露肩亚麻缎面连衣裙,深领亚麻面料,配以项链和各种波西米亚风格首饰,更显其波西米亚风格。

 

示例2

Style: surreal
风格: 超现实

Prompt: pareidolic anamorphosis of a hole in a brick wall morphed into a hublot of a sail boat, a window to the sea.
提示:砖墙上的一个洞蜕变成一艘帆船,一扇通向大海的窗户。

 

示例3

Style: photo
风格:photo

Prompt: a cat sit near the bech with sun glass, photo.
提示:一只猫坐在有阳光玻璃的贝壳附近,照片。

 

示例4

Style: satirical
风格: 讽刺

Prompt: Circus tent made out of a worn us flay with text that says not my circus not my clowns. With Biden and trump dressed as clowns in a suit made of the us flag.
提示:用破旧的美国国旗做成的马戏团帐篷,上面写着不是我的马戏团,不是我的小丑。拜登和特朗普穿着美国国旗制成的衣服,扮成小丑。

模型下载:https://huggingface.co/black-forest-labs

GitHub:https://github.com/black-forest-labs/flux

在线体验:https://flux1.ai/

Replicate:

FAL:

ComfyUI:https://github.com/ZHO-ZHO-ZHO/ComfyUI-Workflows-ZHO

官方介绍:https://blackforestlabs.ai/announcing-black-forest-labs/

退出移动版