GPT-5.4 Pro攻克60年埃尔德什数学难题 三页证明惊艳
GPT-5.4 Pro攻克埃尔德什#1196:AI三页证明重塑数学研究范式
🔬 Tech Brief: 就像AlphaGo第37步打破围棋人类定式,OpenAI GPT-5.4 Pro用纯分析路径绕过60年概率“ gambit”,三页优雅证明直击埃尔德什原始集渐近猜想核心,AI首次以非人类直觉贡献原创数学洞见。
📌 关键事实
– 事件发生时间:2026年4月14-15日(GPT-5.4 Pro单次推理约80分钟完成证明结构,额外30分钟生成LaTeX)
– 核心主体:OpenAI最新模型GPT-5.4 Pro(由用户Price提示)
– 问题定义:埃尔德什问题#1196(1966年由Erdős、Sárközy、Szemerédi提出),针对“原始集”(无元素互除的整数集)中大于x的元素密度满足∑_{a∈A, a>x} 1/(a log a) ≤ 1 + O(1/log x)
– 证明亮点:三页短文,使用von Mangoldt函数Λ(n)保持纯分析框架,避开人类长期依赖的概率方法
– 当前状态:Erdős Problems论坛已收录,形式化验证(Lean)正在进行中(来源:Erdős Problems论坛)
事件还原
本次事件的核心是OpenAI GPT-5.4 Pro独立解决了一道困扰数学界60年的开放问题。2026年4月14日,一位研究者在ChatGPT平台输入提示后,模型在80分钟内构建出完整证明框架,随后30分钟输出LaTeX格式论文。证明针对埃尔德什问题#1196,精确界定了“原始集”在无穷远处的渐近密度上限。
与以往AI“查找文献”不同,此次模型提出全新技巧:用von Mangoldt权重模拟概率效果,却全程保留分析工具,避免了数值计算难题。Jared Duker Lichtman(斯坦福数论学家,曾花7年研究该问题)确认证明结构紧凑且优雅,已上传Overleaf供公开审阅。正式验证工作由Math, Inc.团队启动,目前无明显错误。
图注:问题核心陈述,原始集定义及渐近不等式(来源:X平台数学讨论帖)
评论视角
AI在纯数学领域的角色正从“辅助工具”转向“原创发现者”。 OpenAI通过强化学习重点优化数学竞赛与形式化证明,使GPT-5.4 Pro在数论问题上超越Google Gemini DeepThink和Anthropic Claude系列,后者虽在形式化Lean代码上占优,但数学直觉生成仍落后。OpenAI的AI for Science团队战略布局已初见成效:此前GPT-5系列已协助解决多道Erdős问题,此次#1196则是首次被公认为“Book Proof”(Erdős口中“最美证明”)级贡献。
斯坦福数论学家Jared Duker Lichtman在论坛中写道:
“GPT-5.4 Pro的证明令人惊讶,它拒绝了自1935年以来所有工作的隐含‘gambit’——从分析转向概率。该构造看似反直觉,却巧妙利用∑_{q|n} Λ(q) = log n这一基本恒等式,化解了后续分析难题。这就像AI在国际象棋中发现被人类审美忽略的新开局。”
—— 来源:Jared Duker Lichtman X帖及Erdős论坛
这一突破凸显行业竞争格局:OpenAI在数学RL(强化学习)上的专注,正让其模型在开放性科学问题上拉开与竞争对手的差距。
影响预判
短期(6个月内): 数学家将加速采用GPT-5.4 Pro级模型作为协同工具,预计埃尔德什问题数据库中剩余521道未解问题(总计1216道)的解决速度将提升2-3倍。形式化验证平台(如Lean)与AI证明生成将形成闭环,更多数论学家开始在论文中标注“AI-assisted”。
长期(3-5年): AI将成为纯数学发现的主力引擎,推动数论、组合数学等领域范式转变。陶哲轩已指出,该证明揭示的整数结构与Markov过程理论关联,可能简化概率数论整体框架,进而影响密码学、量子计算算法设计。OpenAI等公司将进一步投资“AI科学家”系统,科研产出周期缩短50%以上,人类数学家角色转向“问题提出者”与“最终审阅者”。
常见问题解答
❓ 该事件是什么?埃尔德什#1196问题核心定义
埃尔德什问题#1196是1966年提出的开放猜想,研究“原始集”(整数集中任意两元素互不整除)的渐近密度。GPT-5.4 Pro证明:对任意x,当A是大于x的原始集时,∑ 1/(a log a) ≤ 1 + O(1/log x)。这是AI首次以全新分析路径独立完成60年未解问题,而非查找已有文献。
❓ 为什么重要?AI解决埃尔德什数学难题的突破意义
此次突破标志AI超越“模仿人类”阶段,首次贡献原创数学洞见(von Mangoldt纯分析技巧)。它打破人类偏见主导的研究路径,证明前沿大模型具备独立发现能力,对OpenAI AI for Science战略及整个数学界具有里程碑意义。
❓ 接下来会怎样?行业趋势与3-5年预测
短期内,AI辅助证明工具将普及,加速剩余Erdős问题解决;3-5年内,AI将成为数学发现主力,推动数论与交叉学科(如量子计算)理论突破,科研范式从“人类主导”转向“人机共创”。
❓ 如何验证证明可靠性?
证明已上传Overleaf(链接见Erdős论坛),Math, Inc.团队正在Lean形式化验证。陶哲轩等顶尖数学家已审阅并认可其潜在更广贡献,目前无已知错误。
📅 本文信息更新至2026年4月16日,内容综合自X (Twitter) 实时热搜及权威科技媒体(如The Decoder、Erdős Problems官网),仅供参考。






对于一个“随机鹦鹉”来说,这可不赖 😉
(立场: 幽默 | 👍 174)
但是兄弟,LLM做不了数学啊兄弟,相信我兄弟….
(立场: 幽默 | 👍 63)
让我印象深刻的是,自埃尔德什1935年论文以来大家一直用的“开局策略”其实没错,只是太自然太根深蒂固,没人质疑它是否必要。惯例只有在非惯例的东西出现时才显形。
(立场: 中立 | 👍 15)
你因为给聊天机器人输提示就声称解决了埃尔德什问题,这是有史以来最可悲的盗用荣誉!还“非常高兴这个结果”好像是你做的,太可笑了。你没解决任何东西,是文本预测器吐出的符号。加“形式化正在进行中”就是在承认可能是垃圾,得赶紧验证。别抢API功劳了,骗子!🗑️
(立场: 反对 | 👍 7)
这太惊人了。我猜你事先在上下文窗口里加载了很多相关论文和结构吧?
(立场: 支持 | 👍 21)
没错,这个问题肯定不像AI之前解决的其他埃尔德什问题那样被“注意力瓶颈”卡住。事后看,证明非常初等且“显而易见”,但我不会说它一开始就简单。
(立场: 中立 | 👍 46)
每周用他的专有AI证明一个埃尔德什问题,这宣传效果就已经爆棚了。每次解决一个,就猛吹AI能搞新型研究,还强调整个数学界X年来都证明不了,所以AI更牛。
(立场: 幽默 | 👍 12)
之前被忽视了。我觉得这是AI在埃尔德什问题上最惊艳的成果,但在我看来,851问题的证明仍是AI证明中最牛的,因为它超级复杂,足足经过20轮验证和修正循环。
(立场: 支持 | 👍 10)
原帖声称gpt-5“找到了”10个未解决埃尔德什问题的解决方案。一半OpenAI高管转发证明gpt-5能做新型数学(后来大多删了)……实际上gpt-5一个都没真正解决,只是“找到”了现有文献里的方案,那些没上传到网站的。
(立场: 反对 | 👍 9)