近日,據(jù)月之暗面報道,OpenAI發(fā)布了一項令人矚目的研究報告。報告指出,DeepSeek和Kimi兩個研究團隊通過獨立研究,成功利用思維鏈學習方法,在數(shù)學解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。
Kimi團隊的研究員Flood Sung在社交媒體上發(fā)文,分享了團隊的研究心得。他提到,長思維鏈的有效性在團隊內(nèi)部已經(jīng)得到了驗證。在實際訓(xùn)練過程中,研究人員發(fā)現(xiàn)模型的表現(xiàn)會隨著訓(xùn)練的深入而不斷提升,并且token數(shù)也在不斷增加。這一發(fā)現(xiàn)證明了在強化訓(xùn)練過程中,模型具備自我涌現(xiàn)的能力,能夠不斷挖掘和發(fā)揮自身的潛力。
值得一提的是,就在1月20日,DeepSeek和Kimi兩個團隊在同一天發(fā)布了各自的推理模型R1和k1.5。這一巧合不僅展示了兩個團隊在研究領(lǐng)域的默契,也進一步凸顯了思維鏈學習方法在提升模型性能方面的巨大潛力。
OpenAI的這一研究報告,不僅揭示了DeepSeek和Kimi兩個團隊在思維鏈學習方法上的突破,也為人工智能領(lǐng)域的研究提供了新的思路和啟示。
-
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265381 -
模型
+關(guān)注
關(guān)注
1文章
3752瀏覽量
52111 -
OpenAI
+關(guān)注
關(guān)注
9文章
1245瀏覽量
10072 -
DeepSeek
+關(guān)注
關(guān)注
2文章
835瀏覽量
3266
發(fā)布評論請先 登錄
大模型 ai coding 比較
廣和通成功部署DeepSeek-R1-0528-Qwen3-8B模型
?Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】+混合專家
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】--全書概覽
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】書籍介紹+第一章讀后心得
【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘
DeepSeek開源新版R1 媲美OpenAI o3
雷軍:小米玄戒O1已開始大規(guī)模量產(chǎn)
小米自研芯片玄戒O1跑分出爐 單核2709多核8125 小米聯(lián)想加速“造芯”
雷軍官宣小米造芯 雷軍宣布小米芯片進展 手機SoC芯片玄戒O1于5月下旬發(fā)布
全新訊飛星火X1還有哪些升級
HarmonyOS NEXT開發(fā)實戰(zhàn):DevEco Studio中DeepSeek的使用
AI研究所丨DeepSeek最強專業(yè)拆解來了,清交復(fù)教授超硬核解讀
OpenAI:DeepSeek與Kimi揭秘o1,長思維鏈提升模型表現(xiàn)
評論