阿里云发布其第一个MoE模型：Qwen1.5-MoE-A2.7B 匹敌7B性能

by 小互
8月 ago

Qwen团队发布了他们的新型混合专家（MoE）模型——Qwen1.5-MoE-A2.7B，这是一款只有2.7亿激活参数的小型MoE模型，但其性能却能匹配到像Mistral 7B和Qwen1.5-7B这样的7B参数模型。与Qwen1.5-7B相比，Qwen1.5-MoE-A2.7B大大减少了训练成本，降低了75%，并将推理速度提高了1.74倍，有效提高了资源利用率，同时保持了出色的性能。

这一更新不仅是模型功能和性能的提升，也预示着Qwen模型从当前版本向更高级版本Qwen2的转变。Qwen1.5携带了若干重要的更新和优化，为未来Qwen2版本的发布铺垫了基础。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

Categories: XiaoHu.AI日报

Support authors and subscribe to content

加入会员

Related Content

MagicQuill：AI 驱动的图像编辑系统 只需在图像上画几笔即可轻松编辑图像

Runway 推出视频扩展工具：Expand Video 可以无缝的为视频扩展画面

GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的

Comfyui_Object_Migration：一致性换衣模型和工作流 实物衣服 一键穿上

ElevenLabs 推出构建语言对话AI代理的功能 可使用其语音模型接入AI模型

MagicQuill：AI 驱动的图像编辑系统只需在图像上画几笔即可轻松编辑图像

GetPickle AI是一款革新虚拟会议的AI工具让你的替身帮你开会你去干别的

Comfyui_Object_Migration：一致性换衣模型和工作流实物衣服一键穿上

ElevenLabs 推出构建语言对话AI代理的功能可使用其语音模型接入AI模型