#人工智能 Grok 1.5T 参数版新前沿模型预计将在未来 2~3 周发布,该模型利用 Cursor AI 编码工具的真实开发者交互数据大幅度提升编码能力。Grok 4.2 在复杂编码任务上的表现比较糟糕,新模型编码能力则会大幅度提升,原因就是开发团队通过添加来自 Cursor 的高质量真实交互数据,在复杂编码任务上实现重大改进。查看详情:https://ourl.co/113070
埃隆马斯克日前透露,xAI 正在训练中的新前沿模型预计将在未来 2~3 周内发布,该模型代号为 Grok V9-Medium,其参数规模达到 1.5T (即 1.5 万亿),是当前现役的 Grok 4.2 模型 (0.5T 参数规模) 的 3 倍,而且重点改善编程开发能力。
在 Grok 4.2 中由于训练参数的局限性,该模型在编程开发领域的表现比较糟糕,甚至到最后埃隆马斯克都承认该模型在编程开发领域不如竞争对手,所以新模型重点就是改善编程开发能力,尤其是 SpaceX 还准备直接收购 Cursor AI 开发工具来直接杀入 AI 编程市场。
你在 Cursor 中产生的数据被用于训练模型:
Grok V9-Medium 的训练亮点报告在预训练完成后,开发团队在补充训练阶段添加大量基于 Cursor AI 开发工具的数据,这里面包含开发者发送的真实提示词、代码上下文、代码编辑记录以及任务完成数据等,当然这些数据本身已经被脱敏不会包含私密信息,开发团队还准备在后续继续添加更多这类真实世界中产生的高质量编码数据。
当前 Grok V9-Medium 模型已经进入微调阶段,而强化学习也将在未来几天启动,这些工作的结果就是该模型在复杂编码任务上实现重大改进,埃隆马斯克称其编码能力远超当前服役的 Grok 4.2 模型。
真实世界的编码数据是宝藏:
SpaceX 已经准备以 600 亿美元收购 Cursor AI 编码工具,当前虽然还未收购但双方的合作已经持续很长时间,有充足的真实数据供应,Grok V9-Medium 在编程开发能力上自然会有显著提升。
Grok V9-Medium 的训练策略体现 xAI 在真实世界编码数据上的持续投资,Cursor 作为广受欢迎的 AI 编程工具,其交互数据包含大量高价值、实际场景下的代码编辑轨迹,这有助于模型更好地理解复杂项目上下文、调试逻辑和长链路任务。
按照惯例,新模型在发布后将会首先面向 Grok Premium 和 X Premium 等订阅用户使用,后续会逐步开放订阅层级直到所有用户都可以使用,另外 xAI 可能也会推出自己的 CLI 编程开发工具。
