PIXART-Σ:利用Diffusion Transformer(DiT)直接生成4K分辨率图像

PIXART-Σ是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员共同开发的一个基于Diffusion Transformer(DiT)的图像生成模型。

模型采用了一种独特的训练方法——从弱到强的训练方式——能够根据文本描述生成高质量的4K分辨率图像。这意味着,给定一段文字描述,PixArt-Σ能够创造出与描述相匹配的、非常高清晰度的图像。这对于需要高分辨率图像的领域,比如电影制作和游戏开发,是一个巨大的进步。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Subscribe

Gain access to all our Premium contents.
More than 100+ articles.
退出移动版