01.AI发布新一代开源模型:Yi-9B 专为中英双语场景优化

01.AI发布新一代开源大语言模型:Yi-9B,特别针对双语(中英文)场景进行训练,拥有强大的语言理解、常识推理、阅读理解等能力。基于3.1T语言语料库训练。

Yi-9B模型,是 Yi 系列中最强的模型,实际参数为 8.8B,默认上下文长度为 4K tokens。Yi-9B 在多个方面的性能都超过了其他开源模型,如 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。此外,Yi-9B(BF 16)和其量化版 Yi-9B(Int8)可以在消费级显卡上轻松部署,使用成本较低,对开发者友好。该公司此前已推出 Yi-34B 和 Yi-6B 两个开源大模型,对学术研究完全开放,并同步开放免费商用申请。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Subscribe

Gain access to all our Premium contents.
More than 100+ articles.
退出移动版