Meta推出Muse Spark多模态推理模型

Meta 推出全新推理模型 Muse Spark

　　Meta 平台公司今日推出了一款全新的推理模型 Muse Spark，该模型在解答健康问题与分析多模态数据方面表现极为出色。

　　未来几周内，Meta 将把该算法接入面向消费者的 Meta AI 人工智能服务中。此外，Meta 还将通过应用程序编程接口（API）向开发者开放 Muse Spark，目前该 API 处于非公开预览阶段。

多项基准测试中表现领先

　　Meta 表示，Muse Spark 在多项基准测试中超越了 Claude 4.6 Opus、Gemini 3.1 Pro 与 GPT 5.4。其中一项测试为 HealthBench Hard，用于评估 AI 模型解答医学问题的能力，Muse Spark 较第二名 GPT 5.4 得分高出 2% 以上。

　　该模型的优异表现部分得益于 Meta 在 1000 余名医生协助下构建的临床训练数据集。该数据集是 Meta 全面重构 AI 开发流程的成果之一。这家 Facebook 母公司称，工程师还优化了模型架构与训练后流程。

“实现同等能力所需的算力，较我们上一代模型 Llama 4 Maverick 减少了一个数量级以上。这一改进也让 Muse Spark 的效率显著优于当前可对比的主流基础模型。”

科学图表分析能力突出

　　Meta 称，科学图表分析是 Muse Spark 另一项领先竞品的能力。在包含技术图表的基准数据集 CharXiv Reasoning 上，该模型击败了 Opus 4.6 等对手。这种视觉推理能力可广泛应用于其他场景：Meta AI 应用用户可上传超市货架照片，让模型估算每种食品的卡路里。

　　Meta 还在六项以上其他基准测试中对 Muse Spark 进行了验证。在多数测试中，其得分与 Opus 4.6、Gemini 3.1 Pro、GPT 5.4 仅相差几个百分点；在多项评估中，Muse Spark 至少超越了其中一款竞品模型。测试覆盖代码生成、机器人导航与工具使用等场景。

“沉思模式”提升输出质量

　　Muse Spark 可通过开启名为“沉思模式”（Contemplating mode）的设置提升输出质量。该功能会启动多个 AI 智能体，将任务拆解为子步骤并并行执行。Meta 表示，该技术让 Muse Spark 在 AI 领域最难的基准测试之一 HLE 上得分提升了约 8%。

迈向个人超级智能

　　Muse Spark 是 Meta 计划推出的多模态推理模型系列中的首款产品。Meta 在今日博客中称：

“我们正沿着一条可预测、高效率的扩展路线前进。在迈向个人超级智能的道路上，我们期待尽快推出能力更强的模型。”

智算多多

联系我们

官方邮箱：service@zsdodo.com

公司地址：北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部

关注我们

公众号

视频号

隐私协议

用户协议