国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國內(nèi)大模型爭霸賽,你最看好哪家?

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-05-19 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI Vs Google

e597a338-f620-11ed-90ce-dac502259ad0.png

目前大模型 top2 應該就是 OpenAI 的 GPT-4,以及谷歌的PALM-2。這兩家公司早已布局,而且技術(shù)實力雄厚。國內(nèi)大模型和 GPT-4 相比,還是有比較大的差距。

但是國內(nèi)的勢頭目前不錯,百家齊鳴,還沒有一家有絕對的優(yōu)勢。

讓人頭暈的排名

e5a19d3e-f620-11ed-90ce-dac502259ad0.png

之前有媒體給出了目前國內(nèi)Top-5的大模型公司,分別是:百度的文心一言、阿里的通義千問、騰訊的混元、華為的盤古以及360的智腦。

而最近,中文通用大模型基準(SuperCLUE)評測公布了最新結(jié)果,GPT-4 遙遙領(lǐng)先,而國內(nèi)成績最好的是科大訊飛的星火認知大模型。這里面文心一言居然排在了最后一名,甚至比ChatGLM-6B的得分還低,實在難以置信。

e5aa4c36-f620-11ed-90ce-dac502259ad0.png

但是我又仔細看了一下這個評測。媽呀,評測集是SuperCLUE,而非SuperGLUE。

眾所周知,在國際NLP領(lǐng)域,有大名鼎鼎的數(shù)據(jù)集 GLUE 和 SuperGLUE,非常權(quán)威,OpenAI、谷歌等的大模型都在上面評測,極大推動了 NLP 領(lǐng)域的發(fā)展。

這次這份 SuperCLUE 評測的發(fā)起方為 Chinese GLUE 組織 (簡稱 CLUE),CLUE 是仿照 GLUE由國內(nèi)民間組織的評測,權(quán)威度和影響力與 GLUE 相比差很遠,其微信賬號主體屬性為個人。但這也迷惑了不少圈內(nèi)人,GLUE和 CLUE 分不清楚,堪稱李逵和李鬼。

還有一點存疑,評測榜單發(fā)布當天5月9日,其官網(wǎng)顯示信息,中文基準測評成員顧問中排名第一的是崔一鳴,身份為學術(shù)顧問委員會主任,哈工大訊飛聯(lián)合實驗室(HFL)資深級研究員。而5月10日,官網(wǎng)已刪除此條顧問的信息。

而001號創(chuàng)始會員徐亮,是會長,相當于這個榜單的實際負責人。昵稱 brightmart,中文任務基準測評發(fā)起人。多個預訓練模型中文版、文本分類和數(shù)據(jù)集開源項目作者。

徐亮還有另一個身份,在5月9日官網(wǎng)中顯示,他是杭州實在智能算法專家,也就是元語智能的創(chuàng)始人,曾在2月份發(fā)布自稱“國內(nèi)首個功能對話大模型ChatYuan”,不僅無法測試,發(fā)布幾天即被監(jiān)管叫停。4月,又被報道套殼推出開源組件。有分析人士認為,不排除創(chuàng)業(yè)公司有融資壓力,蹭熱度吸引投資人關(guān)注。

該 SpuerClue 榜單發(fā)起方,001號顧問是訊飛身份背景、001號基準發(fā)起人是創(chuàng)業(yè)公司創(chuàng)始人。在榜單發(fā)布后,擔心行業(yè)質(zhì)疑其公平、公正,相關(guān)信息還被刪除。這就有點不言而喻了。

僅用100道評測題目就出來了一份“權(quán)威報告”

最后來說下這個榜單本身,業(yè)內(nèi)人士一眼就可以看出來,評測的很不合理,首先,沒有公布評估數(shù)據(jù),以及具體的評估方式。同時從它的公開表述,可推斷總共題目就 100 道題目。這個題目量少到難以置信。專業(yè)人士可能有參與過,像國際權(quán)威 SuperGlue 榜單,題目一般都得有 2 萬多道,離權(quán)威可是差了幾萬倍。況且,它的評測得分榜首都是人類,那這個評分的基準到底是什么?是否有很多主觀性因素在里面?是否某些大模型提前在這個數(shù)據(jù)集上已經(jīng)訓練過?

任務設計太武斷,所謂“通用”基準,是用以測試通用的人工認知能力的,那么我們自然希望,評測任務是參考了模型想要模擬的認知能力及相關(guān)理論,系統(tǒng)化地選擇出來的。而實際上,我們觀察到的則是,基準的作者們在選擇任務的時候,更像是圖方便、省事。以往,CLUE 中存在著部分數(shù)據(jù)集,一味考慮任務的復雜性,卻在最起碼的分布邊界劃分上(如NER各個類別的邊界,如場所、景點類,組織機構(gòu)及其子類),模糊不清,且數(shù)據(jù)的一致性無法保證。

要么別比,要比就來點正規(guī)的比賽。自己出題自己考,說不準還搶跑,自己還是評委,那這是欺不負了解真相的吃瓜群眾。投機取巧,終皆散去。苦練內(nèi)功,才是王道。

國內(nèi)大模型排名(僅供參考)

拋開這些,從模型規(guī)模、模型效果、市場占有率等多個角度,百度的文心一言、華為的盤古、阿里的通義千問、騰訊的混元排在前四,應該是比較合理的,至于后面的排名,就不大能保證了。不過下面的排名也可以參考一下:

e5b3b104-f620-11ed-90ce-dac502259ad0.png

下面是一份完整的名單:

e5b8a9b6-f620-11ed-90ce-dac502259ad0.png

e5c31432-f620-11ed-90ce-dac502259ad0.png

按發(fā)布時間排序:

e5c914ea-f620-11ed-90ce-dac502259ad0.png

百度:文心一言

作為國內(nèi)最早發(fā)布的大模型,百度的文心一言在今年3月16號就發(fā)布了,隨后經(jīng)過了多個版本的迭代。目前已經(jīng)有上千家企業(yè)接入。文心一言支持圖片、語音等多模態(tài)。

3月16日,百度在全球大廠中率先發(fā)布對標 ChatGPT 的大模型產(chǎn)品文心一言。據(jù)了解,文心一言內(nèi)測一個多月,就完成了4次大的技術(shù)升級,大模型推理性能提升近10倍。

李彥宏在5月4日百度內(nèi)部活動中表示,百度之所以能夠在Google、Meta、Amazon等大廠之前率先發(fā)布生成式大模型產(chǎn)品,是因為百度在芯片、框架、模型、應用等四個層面做到全棧布局、層層領(lǐng)先。

360:360智腦

百度是國內(nèi)搜索市場排名第一公司,而排名第二就是360。

大模型依靠的算力、數(shù)據(jù)、算法、場景,這兩家公司都具備,這也是搜索公司的優(yōu)勢,有業(yè)務和數(shù)據(jù)支撐大模型研發(fā)和落地。

5月16日,360集團和智譜AI宣布達成戰(zhàn)略合作,雙方共同研發(fā)的千億級大模型“360GLM”已具備新一代認知智能通用模型水準。

而在今天的世界智能大會上,周鴻祎展示了“360智腦”的多輪對話和“360鴻圖”的AI生圖兩個能力。

e5d272d8-f620-11ed-90ce-dac502259ad0.png

就像谷歌和微軟,一個擁有谷歌搜索,一個擁有必應。國內(nèi)的百度和360,一個擁有百度搜索,一個擁有360搜索。

搜索公司應該是這場大模型爭霸賽最后的贏家。(只是個人看法)

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52099
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16871
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10058

原文標題:國內(nèi)大模型爭霸賽,你最看好哪家?這是你心目中的大模型排名嗎?

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    國內(nèi)哪家 SLIC 芯片支持定制?思電子脫穎而出

    在當今科技飛速發(fā)展的時代,芯片作為各類電子設備的核心部件,其重要性不言而喻。對于特定行業(yè)和應用場景而言,定制化的SLIC(用戶線路接口)芯片需求愈發(fā)凸顯,那么國內(nèi)究竟哪家SLIC芯片支持定制呢?今天
    的頭像 發(fā)表于 01-20 14:49 ?1250次閱讀
    <b class='flag-5'>國內(nèi)</b><b class='flag-5'>哪家</b> SLIC 芯片支持定制?<b class='flag-5'>賽</b>思電子脫穎而出

    國內(nèi)恒溫晶振廠家哪家好?

    在科技飛速發(fā)展的今天,恒溫晶振作為一種高精度、高穩(wěn)定性的頻率控制元件,在國內(nèi)眾多行業(yè)都有著廣泛的應用。那么,國內(nèi)的恒溫晶振廠家究竟哪家更好呢?這是一個值得深入探討的問題。一、技術(shù)實力是關(guān)鍵要評判一家
    的頭像 發(fā)表于 01-08 15:42 ?353次閱讀
    <b class='flag-5'>國內(nèi)</b>恒溫晶振廠家<b class='flag-5'>哪家</b>好?

    百度文心大模型5.0 Preview榮登LMArena文本榜國內(nèi)第一

    12月23日,LMArena大模型競技場發(fā)布最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國內(nèi)第一該模型在創(chuàng)意寫作、高難度指
    的頭像 發(fā)表于 12-23 15:02 ?536次閱讀

    openDACS 2025 開源EDA與芯片題七:基于大模型的生成式原理圖設計

    領(lǐng)域,對促進產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要意義。本項包含7道題,下面是題七 基于大模型的生成式原理圖設計的介紹。 2. 命題單位及題Chai
    發(fā)表于 11-13 11:49

    百度文心大模型5.0-Preview文本能力國內(nèi)第一

    11月8日凌晨,LMArena大模型競技場最新排名顯示,文心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第一該模型在創(chuàng)意寫作、復雜長問題理解、指令遵循等方面表現(xiàn)突出,超過多款
    的頭像 發(fā)表于 11-11 17:15 ?1453次閱讀

    知識分享 | 使用MXAM進行AUTOSAR模型的靜態(tài)分析:Embedded Coder與TargetLink模型

    知識分享在知識分享欄目中,我們會定期與讀者分享來自MES模思的基于模型的軟件開發(fā)相關(guān)Know-How干貨,關(guān)注公眾號,隨時掌握基于模型的軟件設計的技術(shù)知識。使用MXAM進行AUTOSAR模型
    的頭像 發(fā)表于 08-27 10:04 ?718次閱讀
    知識分享 | 使用MXAM進行AUTOSAR<b class='flag-5'>模型</b>的靜態(tài)分析:Embedded Coder與TargetLink<b class='flag-5'>模型</b>

    可編程SLIC語音芯片哪家好?

    呢?思電子科技無疑是其中的佼佼者。思電子科技作為國內(nèi)知名的數(shù)模混合芯片廠商,在可編程SLIC語音芯片領(lǐng)域展現(xiàn)出了強大的實力。其推出的ASX630系列芯片,堪稱
    的頭像 發(fā)表于 06-12 13:55 ?744次閱讀
    可編程SLIC語音芯片<b class='flag-5'>哪家</b>好?

    商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態(tài)大模型首輪評估。 商湯日日新SenseNova融合模態(tài)大模型在所有模型中,獲得當前最高評級——4+級,并成為國內(nèi)首家
    的頭像 發(fā)表于 06-11 11:57 ?1415次閱讀

    手表芯片多強爭霸賽開啟!小米玄戒T1入局,格局生變?

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當前,國內(nèi)可穿戴設備主控芯片市場呈現(xiàn)出“一超多強、梯度競爭”的競爭態(tài)勢,就在5月,小米重磅推出智能手表玄戒T1,在通信性能、功耗控制和功能擴展方面展現(xiàn)了新的突破,標志著
    的頭像 發(fā)表于 05-29 01:05 ?1.1w次閱讀
    手表芯片多強<b class='flag-5'>爭霸賽</b>開啟!小米玄戒T1入局,格局生變?

    當我問DeepSeek國內(nèi)壓力傳感器哪家強,它這樣回答

    特意問DeepSeek國內(nèi)壓力傳感器發(fā)展現(xiàn)狀,以及國內(nèi)壓力傳感器到底哪家強,DeepSeek這樣回復我——壓力傳感器在工業(yè)自動化、汽車電子和醫(yī)療設備領(lǐng)域有著廣泛應
    的頭像 發(fā)表于 05-28 14:48 ?1509次閱讀
    當我問DeepSeek<b class='flag-5'>國內(nèi)</b>壓力傳感器<b class='flag-5'>哪家</b>強,它這樣回答

    時鐘系統(tǒng)推薦,時鐘系統(tǒng)哪家好?思時鐘系統(tǒng)助力中國氣象科學研究院構(gòu)建智慧氣象網(wǎng)絡

    時鐘系統(tǒng)推薦,時鐘系統(tǒng)哪家好?思時鐘系統(tǒng)助力中國氣象科學研究院構(gòu)建智慧氣象網(wǎng)絡
    的頭像 發(fā)表于 05-20 09:32 ?875次閱讀
    時鐘系統(tǒng)推薦,時鐘系統(tǒng)<b class='flag-5'>哪家</b>好?<b class='flag-5'>賽</b>思時鐘系統(tǒng)助力中國氣象科學研究院構(gòu)建智慧氣象網(wǎng)絡

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸
    的頭像 發(fā)表于 05-17 17:31 ?912次閱讀
    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄<b class='flag-5'>爭霸</b>”

    西威端側(cè)大模型重塑智能座艙體驗

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動的智能化升級將成為產(chǎn)業(yè)突破的核心引擎。在日前召開的2025上海車展國際汽車關(guān)鍵技術(shù)論壇上,德西威技術(shù)中心人工智能實驗室專家張書赫博士以《端側(cè)智能·重塑體驗》為題,分享了對大模型
    的頭像 發(fā)表于 05-15 09:13 ?1782次閱讀

    西威與面壁智能發(fā)布端側(cè)大模型語音交互方案

    日前,全球領(lǐng)先的移動出行科技公司德西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側(cè)大模型語音交互方案,這是雙方自2024年12月簽署戰(zhàn)略合作協(xié)議以來發(fā)布的首個合作成果。
    的頭像 發(fā)表于 05-14 17:40 ?1289次閱讀

    當 RDK X3 遇上倉儲機器人,智鏈團隊讓效率原地起飛

    倉儲界現(xiàn)在是"卷王"爭霸賽!2023年全國消費狂飆47萬億,網(wǎng)購更是坐火箭般漲了11%,但老派倉儲還在用"人海戰(zhàn)術(shù)",設備像戴著近視眼鏡,看啥都不清不楚。別急
    的頭像 發(fā)表于 04-21 01:18 ?874次閱讀
    當 RDK X3 遇上倉儲機器人,智鏈團隊讓效率原地起飛