机械之心报道 编辑:陈陈 Devstral 是外地安排和装备端使用的理想之选。 法国 AI 首创公司 Mistral 强势回归,再次鼎力大举投身开源 AI 社区。先前,其因未开源 Medium 3 大模子而受到开发者普遍品评。 刚刚,该公司宣布,他们与开源首创公司 All Hands AI(Open Devin 的建设者)相助,宣布了 全新的开源语言模子 Devstral,拥有 240 亿个参数 —— 比许多竞争敌手的模子小得多,所需的算力也低得多。 因而,Devstral 可在单块 RTX 4090 显卡或配备 32GB RAM 的 Mac 上运行,是外地安排和装备端使用的理想之选。 值得一提的是,该模子现已凭证宽松的 Apache 2.0 允许证免费提供,允许开发者和组织不受限制地安排、修改和商业化。 Mistral 体现,虽然典范的 LLM 善于编码使命,例如编写自力函数或代码补全,但它们难以解决现实天下的软件工程问题。在现实天下中,需要在大型代码库中对代码举行上下文关联,以识别差别组件之间的关系,并识别重大函数中的细微过失。 Devstral 的设计初志就是为相识决这个问题。它能解决真实的 GitHub 问题;还能运行在 OpenHands 或 SWE-Agent 等代码智能体框架上。 在顶级 SWE 基准测试中,Devstral 体现优于其他大型模子。 详细而言,Devstral 在 SWE-Bench Verified 基准测试中取得了 46.8% 的得分,领先于先前宣布的所有开源模子,并领先于包括 GPT-4.1-mini 在内的多个闭源模子,它比 GPT-4.1-mini 横跨 20 多个百分点。 注:SWE-Bench Verified 是一个专门用于评估 AI 编程能力的基准测试,主要测试 AI 模子在真实 GitHub 代码库问题(如 bug 修复、功效实现)上的体现。 在相同的测试框架(OpenHands,由 All Hands AI 提供)下举行评估时,Devstral 的体现远超 Deepseek-V3-0324 (671B) 和 Qwen3 232B-A22B 等规模更大的模子。 最后,Devstral 可通过 Mistral 的 Le Platforme API 会见,型号为 devstral-small-2505,定价为每百万输入 Token 0.10 美元,每百万输出 Token 0.30 美元。 许多网友已经用起来了! 各人使用效果怎样,接待谈论区留言。 https://venturebeat.com/ai/mistral-ai-launches-devstral-powerful-new-open-source-swe-agent-model-that-runs-on-laptops/ https://x.com/dani_avila7/status/1925276890840900087