国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國產(chǎn)AI卷翻硅谷,奧特曼發(fā)文“陰陽”,類o1模型都在卷什么?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-01-22 15:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


wKgZPGeQmpiAKapyAAo08dZqdN8157.jpg

兩個國產(chǎn)推理模型的發(fā)布,讓全球AI圈“提前過年”了。

前兩天,月之暗面推出了Kimi k1.5多模態(tài)思考模型,DeepSeek也發(fā)布了DeepSeek-R1文本推理模型,二者都在推理能力上對標OpenAI正式版o1。

wKgZO2eQmpiANTvSAAJ5UfXpNgk813.jpg

不到兩個月,國產(chǎn)推理模型就實現(xiàn)了對OpenAI o1滿血版(2024年12月上線)的對標,而且與OpenAI藏著掖著的技術(shù)秘訣不同,兩家中國公司雙雙公開了他們的特色技術(shù)道理:DeepSeek R1的極高性價比,kimi k1.5原創(chuàng)技術(shù)long2short 高效思維鏈+原生多模態(tài)。

因此Kimi/DeepSeek“雙子星”一夜卷翻硅谷,技術(shù)報告paper一放出,就吸引了大量海內(nèi)外同行的關(guān)注和解讀,在github的熱度飆升。

wKgZPGeQmpmAenUuAAMTznBqob8800.jpg

目前來看,海外同行的反饋以振奮為主流。比如Answera公司的創(chuàng)始人保羅·庫弗特(Paul Couvert)就感嘆,兩款中國o1同日發(fā)布,(中國AI)追趕速度越來越快了!

wKgZO2eQmpmASPRGAAC88xw11c4242.jpg

當然,自然也少不了“潑冷水”的。

OpenAI CEO奧特曼在社交媒體說,“twitter hype is out of control”(推特上的各種炒作已經(jīng)失控了)。他認為外界猜測的“AI即將取代大部分中層崗位”(主要靠推理模型)過度夸大了。希望大家冷靜下來,把期待值降低100倍(cut your expectations 100x)。

wKgZPGeQmpmAV3HNAADRGz682DY446.jpg

或許有人好奇,國產(chǎn)推理模型真的崛起了嗎?大模型技術(shù)如何從“規(guī)模擴展”發(fā)展到“推理擴展”?對于推理模型這個路線,我們到底該保持興奮還是冷靜一下?本文就來給大家一一解讀。

wKgZO2eQmpmAXXSvAAJhTxIzvKU414.jpg

兩個中國AI公司的新模型,吸引了全球海內(nèi)外同行的高度關(guān)注。原因很簡單,推理模型太火了。

2024年第四季度,出現(xiàn)了reasoning model的新形態(tài)LLM,采用思維鏈進行“慢思考”,在推理階段投入更多計算(推理拓展思路),這種創(chuàng)新帶給大模型超前的推理能力,可以減少幻覺,提高可靠性,處理更為復(fù)雜的任務(wù),達到人類專家/研究生級別的智能,被認為是規(guī)模拓展Scaling Law撞墻后最具潛力的新技術(shù)。

o1系列之后,頭部模廠都開始向“慢思考”的推理模型技術(shù)路線投入,包括大廠谷歌、百度、阿里、科大訊飛、夸克,以及AI六小虎中的智譜、DeepSeek、階躍星辰等,此前也都推出過準o1的推理模型,但一直沒有全面對標正式版o1的國產(chǎn)推理模型。

要證明國產(chǎn)推理模型的崛起,有兩個前提條件:一是經(jīng)得起全球同行的審視;二是具備原創(chuàng)能力而非簡單跟隨,全面對標而非部分達標。

目前來看,Kimi k1.5/ DeepSeeK R1達到了上述條件。

Kimi k1.5/ DeepSeeK R1首次真正對標了正式版o1,取得了SOTA成績。其中,k1.5還是國內(nèi)首個多模態(tài)o1,同時支持文本和圖像推理。這在全球推理模型領(lǐng)域都是比較亮眼的成績。

而且,不同于OpenAI o1藏著掖著的風(fēng)格,Kimi和DeepSeeK都發(fā)布了詳細的技術(shù)報告,分享模型訓(xùn)練技術(shù)的探索經(jīng)驗,立刻在海外AI圈掀起了解讀論文的熱潮。

比如英偉達的研究科學(xué)家第一時間開扒,得出的結(jié)論是,Kimi和DeepSeeK的研究“振奮人心”。

wKgZO2eQmpqAT9_dAATANVjp7gg865.jpg

作為當前AI領(lǐng)域最主流的敘事和技術(shù)高地,推理模型的風(fēng)吹草動,都會引發(fā)全球從業(yè)者的目光。而中國公司一口氣在推理模型賽道上,拿出兩個重磅論文,模型含金量高,經(jīng)過了目光聚焦且嚴苛的審視,其中還包含很多原創(chuàng)技術(shù)。

可以說,從Kimi k1.5/ DeepSeeK R1的“雙子星”開始,國產(chǎn)推理模型是真的崛起了。

wKgZPGeQmpuAT3hTAAIeIkxZ94c387.jpg

推理模型,國內(nèi)AI公司是怎么追趕的?我們和海外AI圈一起“黑著眼眶熬著夜”,苦讀kimi/ DeepSeek論文,簡單總結(jié)一下:

總路線上,k1.5和R1都使用了強化學(xué)習(xí)(RL)技術(shù),來提升模型推理能力。但在技術(shù)細節(jié)上,kimi/ DeepSeek都拿出了全新的思路。

DeepSeek沒有采用業(yè)界普遍的監(jiān)督微調(diào)(SFT)作為冷啟動的方案,提出了一種多階段循環(huán)的訓(xùn)練方式,用少量冷啟動數(shù)據(jù),微調(diào)模型作為強化學(xué)習(xí)的起點,然后在RL環(huán)境中通過獎勵信號來自我進化,實現(xiàn)了非常好的推理效果。

wKgZO2eQmpuADpKdAAF57nQqY5Q343.jpg

Kimi k1.5則首創(chuàng)了long2short思維鏈,讓LLM通過獎勵機制進行探索性學(xué)習(xí),自主擴展訓(xùn)練數(shù)據(jù),來擴展上下文長度,從而優(yōu)化RL訓(xùn)練表現(xiàn),在短鏈思維推理方面取得了SOTA成績。

wKgZPGeQmpuAOk_OAAD0TqoLUJU889.jpg

性能最強的long-CoT版本Kimi k1.5,數(shù)學(xué)、代碼、多模態(tài)推理能力可以達到長思考SOTA模型OpenAI o1正式版的水平。

基于long-CoT版本簡化的short-CoT,性能依舊強悍,但推理更加高效,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領(lǐng)先達到550%。

wKgZO2eQmpyAK9Q7AAMacTAKeLQ950.jpg

除此之外,兩大國產(chǎn)推理模型還各有亮點。

DeepSeek-R1延續(xù)了“AI界拼多多”的優(yōu)秀傳統(tǒng),API每百萬輸出tokens 16 元,與o1每百萬輸出tokens 60美元的定價一比,性價比拉滿。

Kimi k1.5則是OpenAI之外,首個達到o1多模態(tài)推理性能的模型,k1.5支持文本、圖像交疊的多模態(tài)輸入,可以進行聯(lián)合推理,填補了國內(nèi)多模態(tài)思考模型的空白。

在人類的感官中,視覺信息占比超過70%,有了多模態(tài)能力,認識自家的Benchmark圖表自然不在話下。

wKgZPGeQmpyAAvMhAAEI_F45ROk785.jpg

眾所周知,o1要么用起來貴(200美元每月的訂閱費),要么根本用不上(OpenAI不向國內(nèi)提供服務(wù))。因此,國產(chǎn)推理模型的上述亮點,帶給海內(nèi)外AI開發(fā)者的價值不是一般大,很多開發(fā)者都倍感興奮。

一位開發(fā)者在論壇感嘆,這兩個中國實驗室“用更少的資源做更多的事情,他們對模型效率和精煉的巨大關(guān)注,造福我們所有人”。

wKgZO2eQmp2AL5PvAAKefnTCxE0115.jpg

Amarok開發(fā)者Mark Kretschmann也在社交媒體上不吝褒獎,直呼k1.5是“多模態(tài)AI領(lǐng)域的重大突破”。

wKgZPGeQmp2ATWrbAAI9pWY7GI4862.jpg

可以看到,面對“推理拓展”這個全新技術(shù)領(lǐng)域,中國AI“雙子星”靠原創(chuàng)硬實力穩(wěn)穩(wěn)拿下,并走出了一條有別于OpenAI的發(fā)展創(chuàng)新之路。

wKgZO2eQmp6AWiFNAAJfFGCmWfY334.jpg

OpenAI奧特曼建議大家放低預(yù)期,那么,中國AI公司發(fā)力推理模型,價值究竟有沒有、有多大?

對于中國AI公司來說,點亮推理模型的技術(shù)版圖,有兩方面的意義:

一是仰望星空,可以拉近中美AI的技術(shù)距離。大模型的領(lǐng)先不會從天上掉下來,而是日拱一卒、水滴石穿的努力,保持對最新技術(shù)路線的跟進,能讓中國AI的水平快速提高。對標ChatGPT用了半年左右,而對標正式版o1只用了不到三個月,

以Kimi為例,去年11月推出k0-math數(shù)學(xué)模型,12月發(fā)布k1視覺思考模型,今年1月發(fā)布k1.5多模態(tài)思考模型,三個月三次迭代,進化速度極快。說明對天花板技術(shù)的貼身跟進,是中國AI最快最好的練兵場。

wKgZPGeQmp6AQNQUAADdwGTdO90078.jpg

二是腳踏實地,中國的行業(yè)沃土為國產(chǎn)AI提供了更廣闊的落地場景,推理模型的落地情況會比o1更好。海外AI多以個人消費者為主,o1的主要用例是程序員的代碼助手、數(shù)據(jù)分析師、個人開發(fā)者,普通人上手門檻高。而國產(chǎn)大模型更多面向行業(yè)場景,AI改造的業(yè)務(wù)場景中包含大量容錯率低的嚴肅生產(chǎn)場景,以前的大語言模型很難解決復(fù)雜任務(wù),十分需要少幻覺、高可靠的推理模型。所以,國產(chǎn)推理模型的落地也許會更快、更廣。

從這些角度看,在各行各業(yè)引入專家級AI的推理模型,加速行業(yè)智能化,恐怕仍會由國產(chǎn)AI率先垂范。k1.5、R1等國產(chǎn)推理模型,將在其中貢獻不可或缺的基座價值。Kimi官方也表示,2025會繼續(xù)沿著路線圖,加速升級k系列強化學(xué)習(xí)模型,帶來更多模態(tài)、更多領(lǐng)域的能力和更強的通用能力。

所以不出預(yù)料的話,我們很快就能用上花錢少、出活好的專家級國產(chǎn)AI了。

中國AI“雙子星”炸開的2025年大模型開局,分外精彩。推理模型作為模廠的下一個分水嶺,誰抓住了國產(chǎn)推理模型的崛起時刻,也就先一步抓住了未來。

wKgZO2eQmp6ASB6UAAHnoM_99I0589.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39755

    瀏覽量

    301349
  • 硅谷
    +關(guān)注

    關(guān)注

    1

    文章

    124

    瀏覽量

    17185
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52097
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Keil開發(fā)環(huán)境中的O1/O3選項,什么意思

    Keil開發(fā)環(huán)境中的O1/O3選項
    的頭像 發(fā)表于 02-21 09:14 ?3172次閱讀
    Keil開發(fā)環(huán)境中的<b class='flag-5'>O1</b>/<b class='flag-5'>O</b>3選項,什么意思

    友思特案例 | 金屬行業(yè)視覺檢測案例一:彩涂鋼板檢測

    在彩涂鋼板的生產(chǎn)過程中應(yīng)用友思特Neuro-T深度學(xué)習(xí)視覺系統(tǒng),檢測諸如凹痕和劃痕等關(guān)鍵表面缺陷。這一舉措克服了傳統(tǒng)基于規(guī)則的系統(tǒng)的局限性,顯著提高了檢測效率和準確性。
    的頭像 發(fā)表于 01-16 11:55 ?433次閱讀
    友思特案例 | 金屬行業(yè)視覺檢測案例一:彩涂鋼板<b class='flag-5'>卷</b>對<b class='flag-5'>卷</b>檢測

    艾邁斯歐司朗與合作伙伴聯(lián)合推出可大幅降低二氧化碳排放的紙質(zhì)盤LED運輸解決方案

    艾邁斯歐司朗(SIX:AMS)宣布,與奧德堡集團(Zumtobel Group)聯(lián)合開發(fā)出用于運輸LED燈帶及電子元器件的塑料盤替代方案——采用紙質(zhì)盤運輸。該紙質(zhì)盤可顯著改善環(huán)境績效指標,實現(xiàn)
    的頭像 發(fā)表于 12-11 10:11 ?418次閱讀

    用PLC實現(xiàn)徑計算的兩種算法

    徑計算,是動態(tài)計算如鋼,紙卷等存料量的一種方法,它是實現(xiàn)張力控制和自動充放料、以及甩尾控制的重要前提。徑計算目前主流的方法有兩種,一種是根據(jù)機列速度(產(chǎn)線速度)和和被測的轉(zhuǎn)動角
    的頭像 發(fā)表于 11-14 16:54 ?2073次閱讀
    用PLC實現(xiàn)<b class='flag-5'>卷</b>徑計算的兩種算法

    金屬之軀,AI之心:螢石智能鎖如何出新高度

    智能鎖到盡頭,螢石用AI開啟下半場
    的頭像 發(fā)表于 10-11 16:18 ?5520次閱讀
    金屬之軀,<b class='flag-5'>AI</b>之心:螢石智能鎖如何<b class='flag-5'>卷</b>出新高度

    Docker容器存儲管理策略

    想象一下這個場景:凌晨3點,你正在熟睡,突然手機瘋狂響起。生產(chǎn)環(huán)境數(shù)據(jù)庫容器異常重啟,3TB的用戶數(shù)據(jù)瞬間蒸發(fā)!原因?存儲配置不當,數(shù)據(jù)沒有持久化。
    的頭像 發(fā)表于 08-22 11:51 ?553次閱讀

    提升布機效能:PLC智能數(shù)據(jù)采集與遠程監(jiān)控解決方案

    布機PLC數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)解決方案
    的頭像 發(fā)表于 07-03 14:47 ?742次閱讀
    提升<b class='flag-5'>卷</b>布機效能:PLC智能數(shù)據(jù)采集與遠程監(jiān)控解決方案

    布機數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)方案

    在紡織工廠的生產(chǎn)車間中,布機作為關(guān)鍵設(shè)備,承擔(dān)著布料收、張力控制及質(zhì)量檢測等關(guān)鍵任務(wù)。然而,傳統(tǒng)的布機管理模式存在諸多弊端。以往依賴人工巡檢來監(jiān)測布機的運行狀態(tài),這不僅耗費大量
    的頭像 發(fā)表于 06-26 17:35 ?790次閱讀
    <b class='flag-5'>卷</b>布機數(shù)據(jù)采集遠程監(jiān)控系統(tǒng)方案

    物聯(lián)網(wǎng)模塊開啟“小而美”革命:體積,更性能與效率!

    隨著Semtech公司LoRa應(yīng)用方案的推出,長距離、低功耗的物聯(lián)網(wǎng)應(yīng)用難題得到了有效緩解。然而,物聯(lián)網(wǎng)行業(yè)的競爭焦點正悄然轉(zhuǎn)變,從距離、功耗邁向了體積的新階段。在追求設(shè)備小型化、高度集成化的浪潮中,如何在有限的空間內(nèi)實現(xiàn)
    的頭像 發(fā)表于 06-23 16:15 ?1102次閱讀
    物聯(lián)網(wǎng)模塊開啟“小而美”革命:<b class='flag-5'>卷</b>體積,更<b class='flag-5'>卷</b>性能與效率!

    今日看點丨小米爆料:玄戒芯片不止O1一款;消息稱一汽南京全員解散,賠償 N+4

    1. 小米盧偉冰爆猛料:玄戒芯片不止O1 一款 ? 5月21日晚,小米發(fā)布會進行最后一次彩排,小米集團總裁盧偉冰爆料,玄戒芯片不止O1一款。目前小米只預(yù)熱了玄戒O1芯片,這顆芯片將由小
    發(fā)表于 05-22 11:34 ?3286次閱讀

    實用電路圖-第1 家用與民用電路

    學(xué)習(xí)當前各種實際的電路的資料,介紹了各種家電、通用模擬、通用數(shù)字、測量與傳感、通信、特殊六大的電路。 是實際操練的很好借鑒。(其他幾可在我主頁搜索) 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持一下哦~)
    發(fā)表于 05-20 16:28

    雷軍:小米玄戒O1已開始大規(guī)模量產(chǎn)

    雷軍今日又爆出大消息,雷軍在微博宣布,由小米自主研發(fā)設(shè)計的3nm旗艦芯片玄戒O1已開啟大規(guī)模量產(chǎn)。 據(jù)悉,玄戒O1芯片為“1+3+4”八核三叢集架構(gòu),玄戒O1包含
    的頭像 發(fā)表于 05-20 14:37 ?1087次閱讀

    小米自研芯片玄戒O1跑分出爐 單核2709多核8125 小米聯(lián)想加速“造芯”

    小米芯片玄戒O1(XRING O1)是小米自主研發(fā)設(shè)計的手機SoC芯片,預(yù)計將于2025年5月下旬發(fā)布。目前從媒體爆出的消息來看;小米玄戒O1芯片或采用“1+3+4”八核三叢集設(shè)計,還
    的頭像 發(fā)表于 05-19 09:47 ?2331次閱讀

    雷軍官宣小米造芯 雷軍宣布小米芯片進展 手機SoC芯片玄戒O1于5月下旬發(fā)布

    估計在發(fā)布會上肯定會一一列舉。 在5月15日晚,雷軍在微博發(fā)文爆出大消息 “小米自主研發(fā)設(shè)計的手機SoC芯片,名字叫玄戒O1,即將在5月下旬發(fā)布。” 市場傳聞,小米芯片玄戒O1(XRING O
    的頭像 發(fā)表于 05-16 10:22 ?1671次閱讀

    電機工程手冊 (第二版) 基礎(chǔ)(二)

    基礎(chǔ)知識 純分享帖,需要者可點擊附件獲取完整資料~~~ (免責(zé)聲明:本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!)
    發(fā)表于 04-02 15:19