Mistral AI 发布最新一代开源模型:Mistral Large 2 1230亿参数

Mistral AI 宣布了其旗舰模型的最新一代——Mistral Large 2。与前代相比,Mistral Large 2 在代码生成、数学和推理方面显著提升,并提供更强的多语言支持和先进的函数调用能力。

该模型具备128k的上下文窗口,支持多种语言和80多种编程语言。Mistral Large 2 设计用于单节点推理,适合长上下文应用,拥有1230亿参数。

主要特性

性能

多语言支持

功能调用

评估结果

总体性能

代码与推理能力

多语言支持

指令跟随与对话能力

工具使用和功能调用

性能图表

多语言 MMLU 性能

Mistral Large 2 相较于之前的 Mistral Large、Llama 3.1 模型和 Cohere 的 Command R+ 在多语言 MMLU 基准测试中的表现:

多语言 MMLU 的性能(根据基础预训练模型测得)

代码生成与推理性能

Mistral Large 2 在代码生成基准测试、MultiPL-E、GSM8K(8-shot)和 MATH(0-shot, no CoT)生成基准测试中的表现:

 

生成长度

在 MT Bench 基准测试中的平均生成长度:

详细内容:https://mistral.ai/news/mistral-large-2407/

模型下载:https://huggingface.co/mistralai/Mistral-Large-Instruct-2407

在线体验:la Plateforme

退出移动版