研究：语言模型可以通过吸收同源模型的参数来获得新的能力

by 小互
8月 ago

这篇论文展示了语言模型（LMs）可以通过吸收（即融合）来自同源模型的参数来获得新的能力，这个过程不需要重新训练或使用GPU。这种方法的核心是利用DARE（DropAndREscale）技术，它通过减少模型参数中的冗余（即将某些参数设为零并重新缩放剩余参数），使得可以将多个专用于特定任务的模型合并成一个多能力模型，而不损失性能。

这就像超级玛丽能够通过吸收道具来获得额外的能力，如变大、发射火球等。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

Categories: AI 论文

Support authors and subscribe to content

加入会员

Related Content

支付宝发布 EchoMimicV2 ：从数字脸扩展到数字人 可以通过图片+音频生成半身动画视频

OOTDiffusion：支持半身、全身的开源的高分辨率虚拟试穿模型

MagicQuill：AI 驱动的图像编辑系统 只需在图像上画几笔即可轻松编辑图像

Runway 推出视频扩展工具：Expand Video 可以无缝的为视频扩展画面

GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的

支付宝发布 EchoMimicV2 ：从数字脸扩展到数字人可以通过图片+音频生成半身动画视频

MagicQuill：AI 驱动的图像编辑系统只需在图像上画几笔即可轻松编辑图像

GetPickle AI是一款革新虚拟会议的AI工具让你的替身帮你开会你去干别的