PIXART-Σ:利用Diffusion Transformer(DiT)直接生成4K分辨率图像

PIXART-Σ是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员共同开发的一个基于Diffusion Transformer(DiT)的图像生成模型。

模型采用了一种独特的训练方法——从弱到强的训练方式——能够根据文本描述生成高质量的4K分辨率图像。这意味着,给定一段文字描述,PixArt-Σ能够创造出与描述相匹配的、非常高清晰度的图像。这对于需要高分辨率图像的领域,比如电影制作和游戏开发,是一个巨大的进步。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
退出移动版