国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解析陳天橋的 AGI 工程標(biāo)尺:為何“300步”推理是生與死的分界線?

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2026-02-10 13:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 領(lǐng)域,我們聽?wèi)T了萬億參數(shù)、Context Window(上下文窗口)這些指標(biāo),但盛大集團(tuán)創(chuàng)始人陳天橋提出了一個(gè)全新的工程度量衡:在300步復(fù)雜推理后,依然維持99%的正確率 。

為什么要死磕“300步”?這背后是殘酷的概率學(xué)。陳天橋?qū)⑼评淼淖钚挝欢x為“標(biāo)準(zhǔn)原子步”(SIU),即每一步只執(zhí)行單一邏輯,且可被工具檢驗(yàn) ?,F(xiàn)狀是,即便大模型單步準(zhǔn)確率達(dá)到驚人的 98%,在經(jīng)過 300 步的鏈?zhǔn)椒磻?yīng)后,端到端的成功率也會(huì)指數(shù)級(jí)衰減至 0.23% 。這意味著,依靠當(dāng)前 Transformer 架構(gòu)的“概率預(yù)測”來解決長鏈路科學(xué)問題(如新藥研發(fā)、工程設(shè)計(jì)),在數(shù)學(xué)上是死路一條。

陳天橋的解決方案極具工程思維:將推理過程解耦為“邏輯生成層”與“檢驗(yàn)層” 。

生成層(想): 負(fù)責(zé)將大問題遞歸拆解為原子操作;

檢驗(yàn)層(查): 對(duì)每一個(gè)原子步進(jìn)行外部驗(yàn)證(仿真、工具、數(shù)據(jù))。

這種架構(gòu)要求 AI 必須具備“可累積的長期記憶”和“自我糾錯(cuò)”能力 。MiroMind 的 BrowseComp 實(shí)踐證明了這條路徑的可行性:僅用 235B 參數(shù)的小模型,通過反復(fù)的 Agent/環(huán)境交互和糾錯(cuò),擊敗了依賴一次性生成的更大模型 。

這標(biāo)志著 AGI 的研發(fā)重點(diǎn)正在發(fā)生轉(zhuǎn)移:從訓(xùn)練更會(huì)“蒙”的大模型,轉(zhuǎn)向構(gòu)建一個(gè)高可信、可審計(jì)的通用推理引擎 。對(duì)于開發(fā)者而言,未來的核心競爭力或許不在于 Prompt Engineering,而在于構(gòu)建能夠把每一步推理“釘死”的工具鏈驗(yàn)證系統(tǒng)。

以下為陳天橋博文全文:

言語道斷,因果自現(xiàn)——我心中的AGI是什么

過去這一兩年,我們親眼看著大模型的語言能力以肉眼可見的速度躍遷:寫作、總結(jié)、對(duì)話、問答、解題,越來越“像人”;HLE 之類的評(píng)測分?jǐn)?shù)一再刷新紀(jì)錄,連奧數(shù)級(jí)別的題目也能被系統(tǒng)性攻克。于是一個(gè)看上去順理成章的結(jié)論開始流行:“所謂 AGI、大一統(tǒng)的通用智能,大概也就差不多了?!钡谖铱磥恚@是一場美麗的誤會(huì)。

為了把這件事講清楚,我借用一個(gè)比喻:今天主流的大模型,更像是“文科大模型”。它以語言生成與文本一致性為中心,把知識(shí)組織成“像真的敘述”和“像對(duì)的答案”。它的價(jià)值在于“模擬”:它能理解我們的委婉與修辭,能生成優(yōu)雅的文字、逼真的對(duì)話、動(dòng)人的故事;它會(huì)在教育、溝通、內(nèi)容生產(chǎn)上變成新的基礎(chǔ)設(shè)施,像電、像水,潤物無聲。但是即便它能解奧數(shù)、HLE 也能拿高分,這些勝利也大多發(fā)生在封閉系統(tǒng)里:題目定義明確、規(guī)則固定、對(duì)錯(cuò)可判、反饋即時(shí)。

但我一直堅(jiān)信,人類真正需要 AI 去對(duì)抗的,是衰老、疾病、能源、材料、氣候這些問題;這些戰(zhàn)場不在考試題的封閉世界里,沒有標(biāo)準(zhǔn)答案等你生成,只有現(xiàn)象、噪聲、偏差、缺失變量與緩慢反饋;正確不是“寫出來”的,而是被外部世界“確認(rèn)出來”的。封閉世界的高分,證明了推理工程的成熟,但并不代表已經(jīng)擁有了穩(wěn)定的知識(shí)生產(chǎn)機(jī)制;高水平解題固然是走向發(fā)現(xiàn)的必要基礎(chǔ),卻遠(yuǎn)非充分條件,因?yàn)檎嬲龥Q定未來的,不是封閉的敘述,而是那條冰冷而精確的因果紅線;它關(guān)心的不是“說得對(duì)不對(duì)勁”,而是“這個(gè)假設(shè)能不能被現(xiàn)實(shí)否決或確認(rèn)”;它的終極產(chǎn)物不是新作品,而是新知識(shí)——新的定理、新的材料、新的藥物、新的工藝、新的工程結(jié)構(gòu)。我把這種范式稱為“理科大模型”。它的價(jià)值在于“發(fā)現(xiàn)”。

需要澄清一點(diǎn):我說的“文科/理科”,不是兩種模型的物種差異,而是兩種默認(rèn)動(dòng)作的差異:文科大模型傾向給出一個(gè)“看起來不錯(cuò)的最終答案”,理科大模型傾向先給出一組可證偽的假設(shè),并同時(shí)給出把這些假設(shè)變成證據(jù)的路徑;文科模型在不確定處更容易把答案“湊圓”,理科模型在不確定處更像本能地停一下,然后去查證、去拆解,把問題拆成可驗(yàn)證的小問題;理科模型把因果當(dāng)作第一公民,回答“條件改變后會(huì)發(fā)生什么”;理科模型還必須有可累積的長期記憶,把每一次驗(yàn)證得到的結(jié)論以可追溯的方式寫回去。總之,理科模型更像一個(gè)握著手術(shù)刀的外科醫(yī)生:在無數(shù)方案里,識(shí)別哪一刀真正觸及因果紅線;它知道,一旦切下去,現(xiàn)實(shí)會(huì)給出最誠實(shí)、也最殘酷的反饋,形成真正的因果閉環(huán)——這種對(duì)“真實(shí)代價(jià)”的敬畏,正是兩種范式之間最本質(zhì)的鴻溝。

所以,真正決定 AGI 應(yīng)該是什么,取決于我們的價(jià)值取向:我們究竟更在意一個(gè)能理解所有修辭,還能取代人類工作的“靈魂伴侶”,還是更迫切地需要一個(gè)能幫我們撕開迷霧、照亮未知,創(chuàng)造價(jià)值的“因果明鏡”?我認(rèn)為是后者。所以,實(shí)現(xiàn) AGI 不是為了再造一個(gè)更會(huì)聊天的會(huì)生成的系統(tǒng),而是為了打造一種“會(huì)發(fā)現(xiàn)”的智能。

讓我們帶著這樣的價(jià)值觀去審視一下現(xiàn)有的 AGI 定義的主要流派。一種是行為主義范式,源于圖靈測試,認(rèn)為 AGI 的標(biāo)準(zhǔn)是“機(jī)器表現(xiàn)出的行為與人類無法區(qū)分”。這是目前大眾最直觀的評(píng)判標(biāo)準(zhǔn)。但如果一個(gè) AI 只是在模仿人類說話,它永遠(yuǎn)無法告訴我們那些人類還沒發(fā)現(xiàn)的真理。第二種是功能主義范式。以 OpenAI 為代表,定義 AGI 為“在大多數(shù)具有經(jīng)濟(jì)價(jià)值的工作中超越人類的自適應(yīng)系統(tǒng)”,側(cè)重于對(duì)人類勞動(dòng)力的替代能力。但人類文明的每一次飛躍,都不是靠把舊工作做得更快,而是靠發(fā)現(xiàn)前所未有的新規(guī)律。第三種是能力分級(jí)范式。以 DeepMind 為代表,將 AGI 分為從 "Emerging" 到 "Superhuman" 的五個(gè)層級(jí),核心指標(biāo)是在廣泛且未見過的任務(wù)中的“泛化能力”與“表現(xiàn)分值”??涩F(xiàn)實(shí)世界不是考場,沒有標(biāo)準(zhǔn)答案,真正的智慧是要在沒有考卷的地方,自己找到那條正確的路。當(dāng)然還有一些其他的范式都或多或少存在上述問題。

那么我心目中 AGI 目標(biāo)究竟要做什么?用一句話概括:它是一個(gè)高可信、可驗(yàn)證、可糾錯(cuò)的通用推理引擎。在工程上能夠做到三百步以上的復(fù)雜推理后,依然維持接近 99% 級(jí)別的整體正確率,并通過形式化和工具鏈把每一步推理“釘死”為可檢查的證據(jù),最終對(duì)任意復(fù)雜問題給出閉環(huán)解決方案。

為什么我們死磕“300 步”?我們必須先定義推理的最小單位——標(biāo)準(zhǔn)原子步(SIU, Standard Inference Unit),作為可審計(jì)的基本推理單元。每一步只執(zhí)行單一邏輯操作,依賴最小必要輸入,其結(jié)果可以通過工具或規(guī)則直接檢驗(yàn)。按照這個(gè)標(biāo)準(zhǔn),現(xiàn)在的大模型單步推理準(zhǔn)確率最高能沖到 98%,哪怕每一步都能做到這個(gè)最高水平,300 步后的端對(duì)端成功率也只有 0.23%,已經(jīng)接近歸零。這意味著在 300 步之后,概率和運(yùn)氣基本失效,系統(tǒng)必須依賴可檢驗(yàn)的推理與外部反饋閉環(huán),而不是靠“看起來合理”的續(xù)寫去蒙混過關(guān)。所以我認(rèn)為 300 步是獨(dú)立解決復(fù)雜現(xiàn)實(shí)問題的“跨度起點(diǎn)”。

為什么 99% 必須是硬杠?因?yàn)榘l(fā)現(xiàn)式系統(tǒng)不是用來“聊天”,而是要進(jìn)入現(xiàn)實(shí)成本區(qū)間:實(shí)驗(yàn)、工程、醫(yī)療、決策。低一個(gè)點(diǎn)的可靠性,就意味著高頻的錯(cuò)誤下注;而現(xiàn)實(shí)世界的錯(cuò)誤,不是“答錯(cuò)題”,而是浪費(fèi)實(shí)驗(yàn)窗口、燒掉工程預(yù)算、甚至造成不可逆的損耗。99% 不是面子指標(biāo),而是“可質(zhì)押、可簽字”的門檻。

所以,我心目中的 AGI,是能在 300 步的邏輯長征中,靠自我糾錯(cuò)熬過“概率死亡”,最終抵達(dá)地圖之外的起點(diǎn)。從這里開始,AGI 就可以在科學(xué)、工程、決策規(guī)劃等任意領(lǐng)域里,作為一個(gè)可審計(jì)、可驗(yàn)證的通用問題求解器存在。

當(dāng)然,我并不認(rèn)為這是一條“喊口號(hào)就能到達(dá)”的路線。把目標(biāo)釘在“300 步仍保持 99% 可靠性”,本質(zhì)上是在主動(dòng)面對(duì)三個(gè)工程硬點(diǎn):長鏈誤差累積、開放世界驗(yàn)證缺口、以及組合爆炸下的預(yù)算約束。正因如此,我們?cè)诠こ躺媳仨氝M(jìn)行解剖,將推理過程分為兩層:邏輯生成層與檢驗(yàn)層。生成層負(fù)責(zé)“想”:將大問題遞歸地拆解,直到細(xì)化為原子級(jí)操作,我們還要做檢驗(yàn)層負(fù)責(zé)“查”:對(duì)每一個(gè)原子步通過工具、仿真或外部數(shù)據(jù)逐一驗(yàn)證。一旦某一步不過關(guān),系統(tǒng)就在局部進(jìn)行回退和重生成,而不是推翻整條推理鏈。

MiroMind 已經(jīng)在這條路走出了第一步。以 BrowseComp 為例,MiroMind 僅用 235B 參數(shù)模型就給出了 SOTA 的成績,它的意義不在于“分?jǐn)?shù)本身”,而在于證明了一個(gè)工程事實(shí):我們正在把推理從“單次生成”推進(jìn)到“時(shí)間序列上的反復(fù)求證”。更具體地說,我們不是依賴一次性長鏈思考去賭對(duì)答案,而是訓(xùn)練模型在更深、更頻繁的 agent/環(huán)境交互中不斷獲取外部反饋并糾錯(cuò),讓推理過程逐步變成可審計(jì)的證據(jù)鏈。對(duì)我們而言,這就是“通用求解器”的第一塊地基,然后在 99% 可靠性前提下逐步推到 300 步以上的跨度。這個(gè)過程沉默、緩慢、嚴(yán)謹(jǐn)、甚至有點(diǎn)殘酷,它拋棄了人類語言的精妙模仿,卻在枯燥、嚴(yán)苛、卻能被現(xiàn)實(shí)反復(fù)復(fù)現(xiàn)的因果閉環(huán)中,緩慢破土而出,即使有耐心資本的加持和理想主義的堅(jiān)守,這也會(huì)是一個(gè)非常痛苦的過程。

佛經(jīng)里有個(gè)詞,叫“大圓鏡智”。說的是一個(gè)人的心若能修到像一面大圓鏡,就能如實(shí)照見萬物因果,不被塵埃遮蔽,不被偏見扭曲,這是智慧的最高境界。我對(duì)這個(gè)智慧一直很向往,甚至創(chuàng)辦的科普視頻號(hào)也取名叫做大圓鏡。而我心中的 AGI 就是一個(gè)無限接近“大圓鏡智”的智能系統(tǒng),不迷戀漂亮的語言,而是追問事實(shí)的真相是什么;不急著給出答案,而是去求證背后的因果是什么。在一個(gè)被語言和敘事塞滿的 AI 時(shí)代,我們需要一面只對(duì)“因果和真相”負(fù)責(zé)的鏡子。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39754

    瀏覽量

    301342
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    101

    瀏覽量

    10819
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    天橋:模仿人類不是AI的正確方向

    在人工智能技術(shù)邁入深水區(qū)的2026年春節(jié)前夕,天橋首次向旗下MiroMind全體員工發(fā)布了一封題為《我如何和AGI公司一起成長》的內(nèi)部信。在這封信中,
    的頭像 發(fā)表于 02-06 09:17 ?423次閱讀

    DeepMind CEO揭示AGI的現(xiàn)實(shí)路徑與科學(xué)革命·下

    Agi
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月28日 13:42:33

    教授從人類語言心理告訴你,AGI的未來究竟在哪里?

    Agi
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月26日 13:58:03

    DeepMind CEO揭示AGI的現(xiàn)實(shí)路徑與科學(xué)革命

    Agi
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月26日 13:40:23

    面對(duì)AI降維打擊,天橋的全新解法:人類必須“肉身進(jìn)化”

    “堅(jiān)船利炮已經(jīng)出現(xiàn)在地平線上,而我們還堅(jiān)持用大刀長矛守港口?!?這是天橋在最新文章中對(duì)當(dāng)前人類處境的驚人比喻。這里的“堅(jiān)船利炮”,指的是正在爆發(fā)的人工智能。與主流觀點(diǎn)擔(dān)憂AI搶走工作不同,
    的頭像 發(fā)表于 01-16 17:11 ?811次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    復(fù)制人類智能的AI---AGI。 走向AGI的五個(gè)層次發(fā)現(xiàn)階段: ①L1,聊天機(jī)器人:具備基礎(chǔ)的對(duì)話能力,能夠理解和回應(yīng)簡單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析
    發(fā)表于 09-18 15:31

    《AI芯片:科技探索與AGI愿景》—— 勾勒計(jì)算未來的戰(zhàn)略羅盤

    AGI曙光”的關(guān)鍵路標(biāo)與潛在挑戰(zhàn),讓讀者對(duì)技術(shù)發(fā)展的脈絡(luò)有了全局性認(rèn)知。 (圖2:AGI技術(shù)演進(jìn)概念路線圖) 這本書并非只為工程師而寫。它更適合科技政策的制定者、戰(zhàn)略投資者以及所有對(duì)未來充滿
    發(fā)表于 09-17 09:32

    《AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    《AI芯片:科技探索與AGI愿景》一書如同一張?jiān)敱M的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構(gòu)的“內(nèi)存墻”瓶頸切入,清晰闡述了
    發(fā)表于 09-17 09:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    《AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI芯片領(lǐng)域的功力和造詣。 作者畢業(yè)于上海交通大學(xué)電子
    發(fā)表于 09-05 15:10

    【書籍評(píng)測活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請(qǐng)于9月3日前,前往【書籍評(píng)測活動(dòng)NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請(qǐng) 添加小助手微信
    發(fā)表于 07-28 13:54

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    網(wǎng)絡(luò)智能診斷平臺(tái)。通過對(duì)私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準(zhǔn)度與實(shí)用性。該方案實(shí)現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與AI智能推理分析能力的有機(jī)融合
    發(fā)表于 07-16 15:29

    MCSDK 6.2.1位置模式過沖的原因?如何解決?

    3.3s或則大于3.7秒,則電機(jī)會(huì)在停止時(shí)超過目標(biāo)位置,再快速回調(diào)到目標(biāo)位置,產(chǎn)生一個(gè)明顯的抖動(dòng)。 具有明顯的分界線,3.7秒Ramp運(yùn)行時(shí)間就是正常的,把Ramp運(yùn)行時(shí)間調(diào)整為3.8秒,其他參數(shù)都不
    發(fā)表于 07-11 08:17

    壩基滲流壓力觀測:方法、規(guī)范與智能預(yù)警系統(tǒng)解析

    觀測的核心目標(biāo)是實(shí)時(shí)掌控壩體浸潤線變化趨勢。浸潤線作為壩體滲流場的分界線,其位置變化直接反映壩體滲流穩(wěn)定性。通過持續(xù)監(jiān)測,可有效識(shí)別三大安全隱患:滲流侵蝕、管涌風(fēng)險(xiǎn)及壩體滲透變形。工
    的頭像 發(fā)表于 04-30 14:21 ?908次閱讀
    壩基滲流壓力觀測:方法、規(guī)范與智能預(yù)警系統(tǒng)<b class='flag-5'>解析</b>

    科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本

    本篇分析來自科大訊飛技術(shù)團(tuán)隊(duì),深度解析了DeepSeek-V3 / R1 推理系統(tǒng)成本,旨在助力開發(fā)者實(shí)現(xiàn)高性價(jià)比的MoE集群部署方案。感謝訊飛研究院副院長&AI工程院常務(wù)副院長龍明康、AI
    的頭像 發(fā)表于 04-15 13:46 ?4012次閱讀
    科大訊飛深度<b class='flag-5'>解析</b>DeepSeek-V3/R1<b class='flag-5'>推理</b>系統(tǒng)成本

    中科馭數(shù)高性能網(wǎng)卡產(chǎn)品 成就DeepSeek推理模型網(wǎng)絡(luò)底座

    2025年初,DeepSeek-V3與DeepSeek-R1推理模型的開源引爆了AI社區(qū),這兩款產(chǎn)品作為通用千億級(jí)模型與專用推理優(yōu)化模型,為全球AI技術(shù)生態(tài)帶來重大變革,不僅展示了中國AGI技術(shù)
    的頭像 發(fā)表于 03-31 11:56 ?684次閱讀
    中科馭數(shù)高性能網(wǎng)卡產(chǎn)品 成就DeepSeek<b class='flag-5'>推理</b>模型網(wǎng)絡(luò)底座