MIMO:给定一个参考图像 、视频 几分钟即可生成一个可以控制动作和场景的动画人物

MIMO是一个生成虚拟角色动画的工具。它能够让用户通过一张图片和简单的动作信息(如图片、动作序列或视频),生成一个可以控制动作和场景的动画人物,而且这个人物可以与场景中的物体进行互动。

即给定一个参考图像,MIMO能够通过几分钟的推理生成可动画的虚拟形象。

该项目由阿里巴巴集团智能计算研究院开发。MIMO项目的核心目的是通过用户提供的简单输入(如图片、动作序列或视频)来生成具有控制性的角色视频。这意味着,用户可以通过一个参考图像(比如某个人物的照片),结合动作序列或场景描述,生成一个能够进行动画的虚拟角色,并且这个角色可以表现出用户定义的动作和场景互动。

该模型突破了传统3D角色视频生成方法的局限,不需要多视角拍摄或针对每个角色单独训练。通过结合2D视频信息和3D空间建模,MIMO 可以高效地生成角色动画,并支持在真实世界的复杂场景中与物体进行交互。

MIMO 的核心优势在于它可以根据用户的需求自由控制动画中的角色、动作和场景,适应不同的应用场景,如虚拟人动画、电影特效、游戏角色等。

MIMO 的主要功能

技术方法:

核心思想:用户可以输入多个不同的内容(例如:用于角色的单张图像、用于动作的姿态序列,以及用于场景的单个视频/图像),以分别提供所需的属性,或者直接输入驱动视频作为输入。该模型可以将目标属性嵌入到潜在空间中,以构建目标编码,并通过空间感知分解来对驱动视频进行编码为空间编码,从而实现对合成的直观属性控制,用户可以自由地按特定顺序组合这些潜在编码。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
退出移动版