XiaoHu.AI学院

No Result

View All Result

Login

XiaoHu.AI学院

No Result

View All Result

Home XiaoHu.AI日报

Stability AI 开源其 Stable Diffusion 3 Medium 模型可在消费级笔记本电脑上运行

by 小互

2024年6月12日

in XiaoHu.AI日报

Stability AI 开源其 Stable Diffusion 3 Medium 模型可在消费级笔记本电脑上运行

0

SHARES

483

VIEWS

Share on Facebook Share on Twitter

Stability AI 开源其Stable Diffusion 3 Medium 模型，该模型是其迄今为止最先进的文本到图像开放模型，包含 20 亿个参数。

Stable Diffusion 3 Medium 模型的尺寸较小，这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。同时，它的这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。

主要特性与功能：

图像质量改进：该模型在图像质量上有显著提升，能够生成更高质量、更细腻的图像。
复杂提示理解：改进了对复杂文本提示的理解能力，能够更准确地将文本描述转换为图像。
资源效率：在资源使用方面进行了优化，能够在更少的计算资源下实现较高的性能。

SD3 Medium 的独特之处：

Photorealism：克服常见的手部和面部瑕疵，无需复杂工作流程即可提供高质量图像。
Prompt Adherence：理解涉及空间关系、构图元素、动作和风格的复杂提示。
Typography：在生成文本方面取得前所未有的成果，无人工痕迹和拼写错误。
Resource-efficient：适用于标准消费级 GPU，低 VRAM 占用。
Fine-Tuning：能够从小数据集吸收细微细节，适合定制。

模型介绍：

模型名称：Stable Diffusion 3 Medium
模型类型：多模态扩散变压器 (MMDiT) 文本到图像生成模型
技术详情：使用三个固定的预训练文本编码器（OpenCLIP-ViT/G、CLIP-ViT/L 和 T5-xxl）

训练数据和方法：

预训练数据：模型在 10 亿张图像上进行了预训练，这些图像包括合成数据和过滤的公开数据。
精调数据：精调数据包括 3000 万高质量美学图像和 300 万偏好数据图像，重点关注特定视觉内容和风格。

要尝试 Stable Diffusion 3 模型，可以使用 Stability Platform 上的 API ，在 Stable Artisan 上注册免费的三天试用，并通过 Discord 尝试 Stable Artisan。

官方介绍：https://stability.ai/news/stable-diffusion-3-medium

模型下载：https://huggingface.co/stabilityai/stable-diffusion-3-medium

技术报告：技术报告链接
GitHub 资源：
- ComfyUI
- StableSwarmUI

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日

Fireworks AI新功能能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

AI 工具

Fireworks AI新功能能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日

Anthropic 公布了一种全新的 AI 越狱技术可以轻松破解所有前沿模型

AI 论文

Anthropic 公布了一种全新的 AI 越狱技术可以轻松破解所有前沿模型

2024年12月23日

INFP：基于音频驱动的双人对话中的互动头像生成能自动区分谁在说话，谁在听

AI 项目

INFP：基于音频驱动的双人对话中的互动头像生成能自动区分谁在说话，谁在听

2024年12月22日

No Result

View All Result

Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?

Unlock left : 0

Are you sure want to cancel subscription?