JetMoE-8B 是一个高性能的大语言模型,它以不到10万美元的成本训练,性能超过了Meta AI的LLaMA2-7B模型,后者拥有数十亿美元的训练资源。这表明训练大语言模型(LLMs)的成本可以远低于普遍预期。
JetMoE-8B:不到10万美元的训练成本 性能却超越LLaMA2-7B
-
by 小互
- Categories: AI 项目
Related Content
Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构
by
小互
2024年10月5日
哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息
by
小互
2024年10月4日
OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 "Canvas" 的系统提示词泄露
by
小互
2024年10月4日
Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍
by
小互
2024年10月3日
Hugging Face 推出一站式搜索开源成果的平台:Paper Central
by
小互
2024年10月3日