XiaoHu.AI学院

No Result

View All Result

Login

XiaoHu.AI学院

No Result

View All Result

Home 开源项目案例库 AI 项目

ReSyncer：一个多功能统一模型可以实现音视频口型同步、说话风格迁移和换脸

by 小互

2024年8月10日

in AI 项目

0

SHARES

704

VIEWS

Share on Facebook Share on Twitter

ReSyncer是由清华大学、百度和南洋理工大学 S-Lab 实验室共同开发的一种新型框架，它能够生成非常逼真、与音频同步的口型视频，并且具备多种功能，如个性化调整、根据视频驱动的口型同步、改变说话风格以及进行人脸交换。

高保真度的音频同步口型视频：ReSyncer可以制作出非常逼真、准确地跟随音频同步的嘴部动作视频。
个性化微调：允许用户对生成的内容进行个性化调整，以满足不同的需求。
视频驱动的口型同步：除了音频，它还可以根据其他视频的嘴部动作来驱动同步，让新视频中的角色模仿已有视频中的说话动作。
说话风格迁移：ReSyncer可以将一个人的说话风格（如语气、节奏）迁移到另一个人身上。
人脸交换：它还可以在视频中替换说话者的面部，同时保持口型与音频的同步。

Related Posts

GetPickle AI是一款革新虚拟会议的AI工具让你的替身帮你开会你去干别的

XiaoHu.AI日报

GetPickle AI是一款革新虚拟会议的AI工具让你的替身帮你开会你去干别的

2024年11月21日

Comfyui_Object_Migration：一致性换衣模型和工作流实物衣服一键穿上

AI 教程

Comfyui_Object_Migration：一致性换衣模型和工作流实物衣服一键穿上

2024年11月21日

ElevenLabs 推出构建语言对话AI代理的功能可使用其语音模型接入AI模型

XiaoHu.AI日报

ElevenLabs 推出构建语言对话AI代理的功能可使用其语音模型接入AI模型

2024年11月20日

XiaoHu.AI日报

Stripe 推出 Stripe Agent Toolkit：让 AI 代理能自动进行支付帮你购物、订机票等

2024年11月20日

Mistral AI 发布了全新的 Pixtral Large 开源模型超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet

XiaoHu.AI日报

Mistral AI 发布了全新的 Pixtral Large 开源模型超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet

2024年11月19日

Perplexity 推出全新 AI 驱动购物助手：Shop Like a Pro 支持搜索结果一键下单

XiaoHu.AI日报

Perplexity 推出全新 AI 驱动购物助手：Shop Like a Pro 支持搜索结果一键下单

2024年11月19日

No Result

View All Result

Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?

Unlock left : 0

Are you sure want to cancel subscription?