Pandora:能够根据自然语言指令生成视频 并能实时进行视频控制的通用世界模型

Pandora 是一个混合自回归-扩散模型,通过生成视频来模拟世界状态,并允许通过自然语言实时控制。

它能够根据自然语言指令生成并实时控制不同领域的视频。用户可以在视频生成过程中输入自由文本操作,以实现即时视频控制。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Subscribe

Gain access to all our Premium contents.
More than 100+ articles.
退出移动版