快手发布“可灵”视频大模型类似Sora技术路线能生成超过120秒 1080P视频

快手最新发布的国产视频生成大模型“可灵”大模型，采用了类似Sora的技术路线，并结合了多项自研技术创新，能够生成时长超过120秒、分辨率高达1080p的视频，且能够精准建模复杂运动和物理特性。

主要功能特点

1. 高质量视频生成

时长和帧率：可灵支持生成时长长达2分钟、30fps的超长视频。
分辨率：生成视频的分辨率高达1080p，画质清晰细腻。
宽高比：支持多种宽高比的视频生成，包括竖版视频，适配不同的使用场景和平台。

2. 物理世界模拟

真实物理特性：可灵大模型能够模拟真实世界的物理特性，例如重力、光影反射、液体流动等。
细节刻画：对于物体的运动、表面反射、影子变化等细节刻画非常到位，提供真实的视觉体验。

3. 复杂运动刻画

精准运动建模：能够准确建模复杂且大幅度的运动场景，例如高速奔跑的动物、在月球上行走的宇航员等。
连贯性：生成的视频画面连贯，动作流畅，能够真实再现运动过程中的细微变化。

4. 多种控制信息输入

控制信息输入：支持用户输入相机运镜、帧率、边缘/关键点/深度等控制信息，提供丰富的内容控制能力。
文本提示词优化：设计了专用的语言模型，可以对用户输入的提示词进行高质量扩充及优化，提升生成效果。

技术实现

1. 模型设计

类Sora架构：采用了类Sora的DiT结构，用Transformer代替传统扩散模型中的卷积网络，提升生成能力和扩展性。
3D VAE网络：自研3D VAE网络，实现时空同步压缩，提升视频重建质量。
全注意力机制：设计了3D Attention机制进行时空建模，能够准确建模复杂时空运动，同时兼顾计算效率。

2. 数据保障

标签体系：构建了完备的标签体系，对训练数据进行精细化筛选和调整，确保视频数据的高质量。
视频描述模型：研发了视频描述模型，生成精确、详尽、结构化的视频描述，提高文本指令响应能力。

3. 计算效率

分布式训练集群：使用分布式训练集群，通过算子优化、重算策略优化等手段，大幅提升硬件利用率。
分阶段训练策略：采取分阶段训练策略，先在低分辨率阶段通过大量数据增强模型能力，再在高分辨率阶段提升细节表现。

一些案例

官网：https://kling.kuaishou.com/

Menu

分类目录

快手发布“可灵”视频大模型类似Sora技术路线能生成超过120秒 1080P视频

Related Posts

Livekit推出一个开源的精准语音轮次检测模型可精准识别用户是否说完话

微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

MidJourney 推出个性化档案和情绪版新功能记住你的风格喜好

Google视频和图像生成模型更新包括Veo 2、Imagen 3和一个新工具Whisk

Google发布 2024年值得关注的Chrome扩展程序

Xai 发布 Grok-2 模型新版本速度提升3倍多语言指令遵循能力更强

Recommendeds

英伟达推出生成式AI专家认证费用135美元

IMAGDressing-v1 ：自定义虚拟试衣系统可灵活控制模特面孔、姿势和场景

Runway 推出一款生成式角色表演工具可以把视频转换成任意风格虚拟角色动画并且保持表情语音口型同步

一款开源的 Claude Artifacts 项目可通过 Llama 3.1 405B 生成完整的 React 应用程序和组件

DETECT-2B ：音频深度伪造检测工具可以在只200毫秒内检测30多种语言的音频

iOS 18 推出了全新自定义选项 Apple Intelligence深度集成

Prompt 学习地图 03 | 编写清晰的说明 – 分隔符的重要作用

面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来

教程：使用 IC 灯光变换器重新照亮您的视频随意更换视频背景和光照

Omni-Zero-Couples ：无需图像训练自动生成风格化情侣肖像的扩散模型

Welcome Back!

Retrieve your password

Add New Playlist

Are you sure want to unlock this post?

Are you sure want to cancel subscription?

Menu

分类目录

快手发布“可灵”视频大模型 类似Sora技术路线 能生成超过120秒 1080P视频

主要功能特点

1. 高质量视频生成

2. 物理世界模拟

3. 复杂运动刻画

4. 多种控制信息输入

技术实现

1. 模型设计

2. 数据保障

3. 计算效率

一些案例

Related Posts

Recommendeds

Welcome Back!

Retrieve your password

Add New Playlist

Are you sure want to unlock this post?

Are you sure want to cancel subscription?

快手发布“可灵”视频大模型类似Sora技术路线能生成超过120秒 1080P视频