当前位置: 首页 > 行业资讯 > 资讯详情

AI理科碾压人类状元，却被这道文科题戳中了死穴

发布日期：2026-05-07 来源：网易作者：网易浏览：2

谁敢信？

　　日本最难考的顶尖学府——东京大学和京都大学，刚刚被AI实现了突破。

　　不仅是考上，成绩还大幅领先。

　　在LifePrompt公司和日本老牌补习机构“河合塾”搞的一场闭卷盲测中，OpenAI的最新大模型ChatGPT 5.2 Thinking，大幅领先人类顶尖考生。

　　但值得注意的是。

　　在翻看这份成绩单时，我们发现了一个AI得分率仅为25%的“显著薄弱环节”。

　　这个大坑，或许恰好是当代高考生和准大学生们的“核心竞争力所在”。

多考50分，数学拿满分

　　先来看一眼这份成绩单。

　　这可不是开卷考试。测试全程物理断网，AI只能凭自己的“脑力”（预训练权重）硬做。

　　结果呢？

　　在号称日本地狱级难度的东大理科三类（医学部）考试里，满分550分，ChatGPT 5.2拿了503分。

　　作为参照，今年考上这个专业的人类最高分，仅仅是453分。

　　整整高了50分！

　　更值得注意的是，它的数学直接拿了满分，英语得分率也稳稳踩在90%的基准线上。

　　京都大学同样取得了突破性成绩。在医学部考试中，AI获得1176分，把人类状元的1098分远远甩在身后。

　　要知道，AI进化速度令人瞩目。

　　回看2024年，老前辈GPT-4在这套卷子面前未能通过所有科目，连最低录取线都没够到。

　　2025年，加了强化学习的o1模型终于首次达到录取合格线。

　　结果才过了一年，ChatGPT 5.2以最高分通过考试。

得分率25%的短板

　　数学满分，英语90%，理应是无敌的存在了吧？

　　但是！

　　在这份优异的成绩单中，有一科的成绩明显不足——

　　世界史论述题，满分60，它只拿了15分，得分率仅为25%。

　　为何一个拥有庞大知识储备、数学能力极强的模型，会在文科论述题上表现明显不佳？

　　阅卷的河合塾老师和技术社区的专家们给出了答案：因为这届AI，严重缺乏结构化组织能力（Structural organization）。

　　世界史论述题可不是背年份填空。

　　它需要你把历史长河里的碎片串起来，理出政治和经济的因果，写出一篇逻辑严密、首尾呼应的大文章。

　　一句话：需要人类的“宏大叙事”。

　　而这，恰恰是大模型目前的死穴。

　　当让它写上千字长文时，它写着写着就偏离了主题。

　　开发者社区做过极端测试：如果让现在的AI去维持一个超长文本的“连贯思想主线”，往往在几轮逻辑转折后，它就开始出现结构性断裂（Structural collapse）。

　　更要命的是，在处理极度复杂的宏大卷宗时，它还可能遭遇“长期记忆坍缩”，上下文丢失，逻辑线瞬间重置。

　　也就是说，目前的大模型依然缺乏全局架构能力。

　　它写出来的东西，单看每一句辞藻都很华丽；但拼在一起，整体缺乏逻辑连贯性，完全没有人类统领全局的“世界观”。

准大学生的“反击指南”

　　看懂了这个25%的软肋，高考生和准大学生的破局方向也就清晰了。

　　日本人工智能学会会长Satoshi Kurihara教授说得好：人类绝对不该在同一条赛道上与AI直接竞争。

　　打个比方，你非要跟计算器比算数快，这显然不是明智之举。

　　在AI轻松超越人类顶尖理科考生的时代，准大学生们的技能树，必须得换个点法了：

　　第一，减少对“规则内机械做题”的依赖。

　　不管你微积分算得多快，法条背得多熟练，你都拼不过几美分调用一次的API接口。

　　靠疯狂刷题、机械记忆去换取职场高薪的路线，正在急速贬值。果断把你的时间精力，从纯粹的“拼记忆、拼算力”里抽离出来。

　　第二，将重心转向“宏观架构能力”的培养。

　　AI连世界史大题都统筹不好，说明它目前根本当不了“总工程师”。

　　未来的高薪岗位，属于那些懂行的“AI项目经理”。

　　你需要重点培养的能力是：如何提出直击本质的犀利问题？如何把一个庞大模糊的任务，精准拆解成十几个AI能听懂的标准指令？最后，如何用人类的战略眼光，把AI生成的一堆碎片，拼装成一套能用的系统。

　　第三，去那些充满复杂性和不确定性的现实场景中历练。

　　AI喜欢干净、透明、结构化的数据。但在真实的社会里，到处是混沌、情绪和谎言。

　　在一场剑拔弩张的商务谈判里，怎么察言观色搞定客户？

　　在公司不同派系的利益博弈中，怎么调解冲突？

　　面对一团乱麻的市场反馈，谁来顶住压力拍板担责？

　　这些需要同理心、信任背书、道德抉择的“高感触（High-touch）”领域，是AI目前无法有效介入的领域。

　　时代真的变了。机器的履带已经越过了知识评估的及格线。

　　与其在AI擅长的规则中过度内卷，不如退一步，去填补那些技术无法替代的领域。

本文转载自网易，作者：网易，原文标题：《 AI理科碾压人类状元，却被这道文科题戳中了死穴》，原文链接： http://m.163.com/dy/article/KS2QN3HT05118O92.html。本平台仅做分享和推荐，不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题，请与我们联系，我们将在第一时间删除内容！

本文相关推荐

暂无相关推荐

点击立即订阅

智算多多

联系我们

官方邮箱：service@zsdodo.com

公司地址：北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部

关注我们

公众号

视频号