智算多多



Meta 平台公司今日推出了一款全新的推理模型 Muse Spark,该模型在解答健康问题与分析多模态数据方面表现极为出色。
未来几周内,Meta 将把该算法接入面向消费者的 Meta AI 人工智能服务中。此外,Meta 还将通过应用程序编程接口(API)向开发者开放 Muse Spark,目前该 API 处于非公开预览阶段。
Meta 表示,Muse Spark 在多项基准测试中超越了 Claude 4.6 Opus、Gemini 3.1 Pro 与 GPT 5.4。其中一项测试为 HealthBench Hard,用于评估 AI 模型解答医学问题的能力,Muse Spark 较第二名 GPT 5.4 得分高出 2% 以上。
该模型的优异表现部分得益于 Meta 在 1000 余名医生协助下构建的临床训练数据集。该数据集是 Meta 全面重构 AI 开发流程的成果之一。这家 Facebook 母公司称,工程师还优化了模型架构与训练后流程。
“实现同等能力所需的算力,较我们上一代模型 Llama 4 Maverick 减少了一个数量级以上。这一改进也让 Muse Spark 的效率显著优于当前可对比的主流基础模型。”
Meta 称,科学图表分析是 Muse Spark 另一项领先竞品的能力。在包含技术图表的基准数据集 CharXiv Reasoning 上,该模型击败了 Opus 4.6 等对手。这种视觉推理能力可广泛应用于其他场景:Meta AI 应用用户可上传超市货架照片,让模型估算每种食品的卡路里。
Meta 还在六项以上其他基准测试中对 Muse Spark 进行了验证。在多数测试中,其得分与 Opus 4.6、Gemini 3.1 Pro、GPT 5.4 仅相差几个百分点;在多项评估中,Muse Spark 至少超越了其中一款竞品模型。测试覆盖代码生成、机器人导航与工具使用等场景。
Muse Spark 可通过开启名为“沉思模式”(Contemplating mode)的设置提升输出质量。该功能会启动多个 AI 智能体,将任务拆解为子步骤并并行执行。Meta 表示,该技术让 Muse Spark 在 AI 领域最难的基准测试之一 HLE 上得分提升了约 8%。
Muse Spark 是 Meta 计划推出的多模态推理模型系列中的首款产品。Meta 在今日博客中称:
“我们正沿着一条可预测、高效率的扩展路线前进。在迈向个人超级智能的道路上,我们期待尽快推出能力更强的模型。”