ELLA:使用LLM来增强扩散模型的语义对齐

ELLA(Efficient Large Language Model Adapter)是由腾讯开发的一个先进的方法,它通过整合大语言模型(LLM)到文本到图像的扩散模型中,来提高这些模型对复杂文本提示的理解和遵循能力。简而言之,ELLA 能让生成图像的模型更好地理解和执行包含多个对象、详细属性、复杂关系以及长文本对齐等要素的复杂文本提示。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Subscribe

Gain access to all our Premium contents.
More than 100+ articles.
退出移动版