您現(xiàn)在的位置：首頁 > 科技 > 正文

AI成為數(shù)學家得力助手還要多久

時間：2025-06-19 10:10:41 來源：科技日報

從計算機科學到醫(yī)學再到國家安全，數(shù)學是眾多關鍵應用的基石，但數(shù)學領域的進步可能需要數(shù)年時間才能實現(xiàn)。

幾百年來，數(shù)學家使用的工具依然簡樸：一張紙、一支筆。他們憑借邏輯與靈感，在符號的迷宮中尋找通往真理的路徑。

為了打破這一局面，美國國防高級研究計劃局今年4月啟動了“指數(shù)性數(shù)學”計劃，旨在開發(fā)一種能極大提升數(shù)學研究效率的人工智能（AI）“合著者”系統(tǒng)。

幾十年來，數(shù)學家借助計算機進行輔助計算或驗證命題，如今的AI或許能更上層樓，挑戰(zhàn)那些人類長年未解的難題。不過，從能解高中題的AI，到能協(xié)助攻克前沿數(shù)學難關的AI，中間仍隔著一道鴻溝。

解決重大難題仍力不從心

大型語言模型（LLM）并不擅長數(shù)學。它們常常出現(xiàn)“幻覺”，甚至可能被誤導相信2+2=5。但新一代大型推理模型，如OpenAI的o3、Anthropic的Claude 4 Thinking等，展現(xiàn)出的進步令數(shù)學家眼前一亮。

今年，這些模型在美國數(shù)學邀請賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過去“一錘定音”式的輸出，這些模型開始嘗試模擬數(shù)學家逐步推理的思考過程。

同時，一些將LLM與某種事實核查系統(tǒng)相結合的新型混合模型也取得了突破。例如，谷歌“深度思維”的AlphaProof系統(tǒng)將語言模型與棋類AI——AlphaZero結合，成為首個取得與國際數(shù)學奧林匹克競賽銀牌得主成績相當?shù)南到y(tǒng)。今年5月，谷歌的AlphaEvolve模型更進一步，在多個長期未解的數(shù)學與計算難題上找到優(yōu)于人類現(xiàn)有方案的解法。

美國《麻省理工科技評論》指出，盡管這些AI成績亮眼，但專家們普遍認為，它們仍不具備真正的協(xié)助科研的能力。競賽題雖難，卻更像是智力游戲，有一定“套路”。真正的數(shù)學研究則更開放、更復雜。面對“P vs NP”“黎曼猜想”等重大難題時，AI仍力不從心。

為了更準確地評估AI的能力，初創(chuàng)公司Epoch AI去年推出了FrontierMath測試，聯(lián)合60多位數(shù)學家設計出全新高難度題目，避開模型已見過的訓練數(shù)據(jù)，結果LLM幾乎集體“交白卷”。

這些測試表明，AI在數(shù)學道路上雖已邁步，但離“合著者”角色仍有很長一段路要走。

需攻克“超長推理鏈”

仔細觀察數(shù)學問題會發(fā)現(xiàn)，它們在某些方面類似：解決問題需完成一系列連續(xù)步驟，關鍵在于找到這些步驟。

美國加州理工學院謝爾蓋·古科夫指出，困難的差異往往體現(xiàn)在路徑的長度上。高中數(shù)學可能只需10到40步，而像黎曼猜想這樣的難題，路徑可能長達百萬步。

這類“超長路徑”極難處理。就像下圍棋時尋找一條制勝序列，AI必須在指數(shù)級增長的可能路徑中找到正確解法。而在數(shù)學中，這個復雜度要遠超棋類游戲。

據(jù)物理學家組織網(wǎng)今年2月報道，為應對這一挑戰(zhàn)，古科夫團隊開發(fā)了一種方法，將多個步驟打包成“超級步驟”，相當于穿上“巨人靴”跨越大段路程。他們設計了一個系統(tǒng)，其中強化學習模型負責提出超級步驟，另一個模型負責驗證其合理性。

該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想，但借助AI，科學家推翻了一個40年來被廣泛引用的“反例”。這曾被視為證明該猜想錯誤的關鍵依據(jù)。

牛津大學數(shù)學家馬丁·布里森對此表示肯定：“排除錯誤路徑，是科研中非常有價值的一步。”

古科夫相信，這種“壓縮路徑”的思路適用于所有需要推理鏈條的領域。他希望，這種方法不僅能推動AI跳出固有模式，也為數(shù)學研究帶來新突破。

真正的創(chuàng)新和突破仍屬人類

跳出思維定式，正是數(shù)學家攻克難題的關鍵。數(shù)學常被看作機械推理，而高等數(shù)學則更像是一場實驗，充滿一波三折的試錯與靈光乍現(xiàn)的頓悟。

這正是AlphaEvolve等AI工具的優(yōu)勢所在。它通過LLM不斷生成并改進解題代碼，配合第二個模型評估每一輪結果，最終提出比人類更優(yōu)的解法。這種方法不僅能獨立探索，也支持人類隨時介入，提供靈感和指令。

澳大利亞悉尼大學數(shù)學家喬迪·威廉姆森強調，探索性思維是數(shù)學的核心。據(jù)英國《新科學家》網(wǎng)站報道，他與Meta合作開發(fā)了PatternBoost AI系統(tǒng)，可根據(jù)一個數(shù)學想法生成相似概念，幫助激發(fā)靈感。他說：“這就像是這里有一堆有趣的東西，我不知道是怎么回事，但你能再生成一些類似的東西嗎？”

這種頭腦風暴在數(shù)學中至關重要，它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過純粹推理發(fā)現(xiàn)了它，其形狀并不存在于自然界中，卻深刻影響了數(shù)學的發(fā)展。威廉姆森希望，AI未來也能協(xié)助發(fā)現(xiàn)類似的“新數(shù)學對象”。

不過，目前AI仍缺乏真正的創(chuàng)造力。讓AI贏棋是一回事，讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺的“偵察兵”，幫助人們發(fā)現(xiàn)路徑、避開死路，但專家普遍認為，真正的創(chuàng)新與突破，仍然屬于人類。

關鍵詞：

上一篇：從“能用”到“好用”：AI激活醫(yī)療創(chuàng)新動能
下一篇：最后一頁

超碰香蕉人人网99精品,天天摸夜夜添久久精品,人人澡人人透人人爽,看国产黄大片在线观看

AI成為數(shù)學家得力助手還要多久

最近更新

特別關注

成都趙磊

永琰小楷書《御制詠文房四事詩》

今明兩天，這個停車場提供兩小時免費服務！

Novitec為邁凱輪GT提供了近700bhp的功率

「遙遙領先」的領克 08，開局就自「刀」

《數(shù)據(jù)資產(chǎn)評估指導意見》出臺提供數(shù)據(jù)估值實操指南、強調質量評價

威爾高：惠州威爾高電子有限公司是江西威爾高電子股份有限公司的全資子公司

貴州省第十屆慈善項目推介會在六盤水舉行

電科數(shù)字：2022年公司的華為消費終端產(chǎn)品銷售和授權服務收入占營收比重約1.25%

北京雨情：目前昌平、豐臺局地回波較強，未來兩小時將影響城區(qū)

焦點資訊