首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

Anthropic推出超强AI模型Claude Mythos,竟遭全面禁用!

发布日期:2026-04-11 来源:网易作者:网易浏览:2

“太危险不能发布”这句话,AI 行业七年前就说过一次

  是2019 年 2 月,OpenAI 发了一个叫 GPT-2 的语言模型。当时OpenAI给出的理由是担心被用来大规模生成虚假信息,所以只放出了一个缩水版。

  七年过去,Anthropic把这句话又说了一遍。

  今天凌晨,Anthropic 悄悄发布了一份长达244页的系统报告,宣布旗下有史以来最强大的模型——Claude Mythos Preview

  Anthropic直接宣布不对外开放。因为新模型能力太强。

  强到什么程度,各项基准全部领先上一代旗舰模型Opus 4.6。

  先上硬数据:

编程能力:

  • SWE-bench Verified 93.9%(模型在真实GitHub仓库里修复bug的能力,Opus 4.6为80.8%);
  • SWE-bench Pro 77.8%(更难的版本,更接近资深工程师日常面对的场景,Opus 4.6仅53.4%);
  • SWE-bench Multimodal 59.0%(同时理解截图和代码才能完成修复,Opus 4.6只有27.1%);
  • SWE-bench Multilingual 87.3%(跨编程语言的代码修复能力,Opus 4.6为77.8%);

推理能力:

  • GPQA Diamond 94.6%(研究生级别的科学问答,Opus 4.6为91.3%);
  • Humanity's Last Exam 不含工具56.8%(全球各学科专家众筹的人类终极考试,Opus 4.6为40.0%),含工具64.6%;

智能体搜索与计算机使用:

  • BrowseComp 86.9%(复杂信息检索与综合推理,Opus 4.6为83.7%);
  • Terminal-Bench 2.0 82.0%(终端环境下的自主操作能力,Opus 4.6为65.4%);
  • OSWorld-Verified 79.6%(在真实操作系统中完成复杂任务);
  • CyberGym 83.1%(自主复现安全漏洞的能力);

  单独领出来,每一项维度的能力提升,都是碾压划时代的提升。

  但最让Anthropic自己紧张的是CyberGym。这个测试衡量的是模型能否自主复现已知安全漏洞。结合前面提到的编程能力,这意味着Mythos不仅能找到漏洞,还能独立构造完整的攻击链。

  这也是为什么Anthropic这次不敢直接发布的最核心原因。

  Anthropic在博客里公布了一组数字,Mythos Preview在测试期间,对主流操作系统和浏览器做了一轮安全扫描——自主发现了数千个高危零日漏洞。

  零日漏洞的意思是,这些漏洞在被Mythos找到之前,没有任何人、任何工具、任何安全团队发现过它们。

  Anthropic在报告里举了几个具体案例:

  头号案例是一个藏了 17 年的 FreeBSD 漏洞。

  简单说,FreeBSD 的网络文件系统(NFS)在验证用户身份时有个bug。攻击者只要能摸到服务器的 2049 端口,就能直接拿到最高权限。

  Mythos 自己构造了一条 20 步的攻击链,第一次尝试就写出了两个能用的 exploit,前后花了 8 小时。

  这条是可以验证的,CVE 编号 CVE-2026-4747,FreeBSD 3 月 26 日出了补丁,安全公告致谢写的是 "Nicholas Carlini using Claude, Anthropic"。Carlini 是 Google DeepMind 的研究员,对抗机器学习方向的标杆人物,这个名字的分量不轻。

  除了这条,还有几个已确认的:

  • OpenBSD 一个 27 年的远程崩溃漏洞、
  • FFmpeg 一个 16 年的 bug、
  • Linux 上的本地提权。

  但 Opus 4.6 两个月前还是“试几百次才成功 2 次”的水平,Mythos 上来就直接Pass@1。

  到这里,你可以以为顶多是一个很厉害的漏洞扫描器,但是Anthropic 红队报告给了一组数据:

  在 Firefox JavaScript Shell 这个测试域里,Mythos 能把 72.4% 的已发现漏洞变成能用的 exploit(尝试构造exploit,验证这个漏洞是不是真的能被攻击者利用),另有 11.6% 走到了 exploit 的前一步(拿到了寄存器控制)。它能把多个漏洞串联起来,组成一条完整的攻击链——从最初的入口一路提权到最终的系统控制。

  从发现到利用,全链条,一个模型,独立完成。

  在过去,能做到这件事的只有两类人:全球排名前几的安全研究员,和国家级网络攻击团队。

  Anthropic这次直接启动了一个叫「玻璃翼计划(Project Glasswing)」的协作项目。拉上亚马逊、微软、苹果、Linux这些合作方,当然新模型的API也率先开放了这些伙伴,目的是让他们先用模型把自家软件的攻防做一遍,让他们用这个模型去扫自己的系统——能堵的洞赶紧堵,能修的代码赶紧修。

  Anthropic为这个计划承诺了最高1亿美元的使用额度,另外还向Alpha-Omega、OpenSSF、Apache Software Foundation等开源安全组织直接捐赠了400万美元。

  定价方面,Mythos Preview的研究预览阶段结束后,正式定价是

  • 输入 25 美元/百万 token,
  • 输出 125 美元/百万 token。

  和Opus 4.6的15 美元/75 美元比,要贵的多。但它的目标用户本来显然不是普通开发者。

  接入渠道很全,Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundary,四个平台都支持。

  对 Anthropic 来说,Glasswing 的战略价值可能比 Mythos 本身还大。AI在代码层面的能力已经强到可以独立挖掘并利用零日漏洞,AI安全就不是一个话题了,而是一个工程问题了。

本文转载自网易, 作者:网易, 原文标题:《 Anthropic推出超强AI模型Claude Mythos,竟遭全面禁用! 》, 原文链接: https://www.163.com/dy/article/KQ78IK5K05566SCS.html。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅