StarCoder2拥有三种不同规模的模型,参数量分别为3B、7B和15B。特别地,15B参数的StarCoder2在超过4万亿个token和600多种编程语言上接受了训练,这些训练数据来自于更新且质量更高的代码数据集——Stack v2。所有的StarCoder2模型均采用分组查询注意力机制,具有16384个token的上下文窗口和4096个token的滑动窗口注意力,采用Fill-in-the-Middle训练方法。
StarCoder2:专为编程代码生成和分析而设计开源模型
-
by 小互
- Categories: AI 项目, XiaoHu.AI日报
Related Content
MagicQuill:AI 驱动的图像编辑系统 只需在图像上画几笔即可轻松编辑图像
by
小互
2024年11月23日
Runway 推出视频扩展工具:Expand Video 可以无缝的为视频扩展画面
by
小互
2024年11月23日
GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的
by
小互
2024年11月21日
Comfyui_Object_Migration:一致性换衣模型和工作流 实物衣服 一键穿上
by
小互
2024年11月21日
ElevenLabs 推出构建语言对话AI代理的功能 可使用其语音模型接入AI模型
by
小互
2024年11月20日