国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開源風波后在AlpacaEval直追GPT4,零一靠技術如何重建生態信心

AI科技大本營 ? 來源:AI科技大本營 ? 2023-12-11 17:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

斯坦福大學研發的大語言模型評測 AlpacaEvalLeaderboard備受業內認可,在 2023 年 12 月 7 日 更新的排行榜中,Yi-34B-Chat 以 94.08% 的勝率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 經認證的模型類別中,成為僅次于 GPT-4 英語能力的大語言模型。

3ed85ecc-9808-11ee-8b88-92fbcf53809c.jpg

同一周,在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現追平GPT-3.5。

多個Benchmark遙遙領先

在五花八門的大模型評測中,伯克利LMSYS ORG排行榜采用了一個最為接近用戶體感的「聊天機器人競技場」特殊測評模式,讓眾多大語言模型在評測平臺隨機進行一對一 battle,通過眾籌真實用戶來進行線上實時盲測和匿名投票,11月份經25000的真實用戶投票總數計算了20個大模型的總得分。
Elo評分越高,說明模型在真實用戶體驗上的表現越出色,可說是眾多大模型評測集中最能展現「Moment of Truth」真實關鍵一刻” 的用戶導向體驗對決。

3ee46bb8-9808-11ee-8b88-92fbcf53809c.jpg

在開源模型中,Yi-34B-Chat成為當之無愧的「最強王者」之一(英語能力),LMSYS ORG 在12月8日官宣11月份總排行時評價:「Yi-34B-Chat 和 Tulu-2-DPO-70B 在開源界的進擊表現已經追平 GPT-3.5」。

風波終結,爭議理清

Yi-34B開源發布后,開發者Eric Hartford發現了模型存在的一個問題,就簡略留言在 Yi 的項目頁面。然而Eric自己也沒有預想到,他的留言引發了后續輿論關于Yi模型「抄襲」LLaMA的質疑。

他在郵件中寫道,「感謝你們提供了一個優秀的模型。Yi模型使用了與LLaMA模型完全相同的架構,只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具,保持張量名稱的一致性是有價值的。」Eric建議,在Yi被廣泛傳播前,及時恢復張量名稱。 客觀來說,一個模型核心技術護城河是在架構之上,通過數據訓練獲得的參數和代碼。大多數有志于參與基座大模型競爭的團隊,也多是從零開始,用高質量的數據集再進行訓練,普遍都是在沿用LLaMA架構。零一后來解釋他們為了執行對比實驗的需要,對部分推理參數進行了重新命名,原始出發點是為了充分測試模型,而非刻意隱瞞來源。

身處這場輿論風暴的中心,Eric 意識到了可能給一些人帶來了誤解,開始解釋自己之前的發言。

3ef41dba-9808-11ee-8b88-92fbcf53809c.jpg

他在X(twitter)上寫道,「他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物,已經發表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創建的數據集訓練Yi,對開源領域的貢獻是值得贊揚的。使用Llama架構沒有任何問題。訓練才是關鍵。Yi給了我們目前可獲得的最佳模型,沒有任何可抱怨的。」 現在,Eric 自己也在使用Yi-34B 系列,用Yi-34b-200k數據集訓練其他的模型產品。 Yi模型開源首月,數據也很亮眼。在Hugging Face社區下載量為16.8萬,魔搭社區下載量1.2萬。在GitHub 獲得超過4900個Stars。

由于性能表現強勁,多家知名公司和機構推出了基于Yi模型基座的微調模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區數字經濟研究院(簡稱IDEA研究院)認知計算與自然語言研究中心(簡稱CCNL中心)聯合發布的SUS-Chat-34B等,均性能表現優異。 而AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。

模型好不好,開發者最知道在大模型實際使用體驗上,最有發言權的還是一線的開發者。 知名技術作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,「從這點看 Yi 對于開源生態的幫助還是非常巨大的。」 他會時不時的瀏覽下 HF 的榜單,在最近榜單中的前三十名,有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,從這點看 Yi 對于開源生態的幫助還是非常巨大的。

蘇洋還將他的訓練經驗和心得在CSDN上做了分享(https://blog.csdn.net/soulteary/article/details/134904434)。

3f1c556e-9808-11ee-8b88-92fbcf53809c.png

蘇洋認為 34B 普通用戶努努力還是能自己相對低成本跑起來的,68 和 70B 的模型想要本地運行,需要更多的資源。但其實目前分數其實相比較 34B 拉不開太多,也就三四分平均分,但參數量差了一倍。換言之,企業想部署使用,所需要的成本也可以得到非常大的節約。

目前國產大模型在開源榜單上已經是第一梯隊,但如果把競爭范圍追加到閉源模型、尤其是海外的模型,仍有很大的距離要去追趕。目前的普遍體驗是開源模型最多只有 GPT-3.5 + 的水平。

蘇洋認為國產大模型,是能夠很快追趕至第一梯隊的。時間也會證明大模型自身的價值,以及驗證出團隊是否對開源有真的持續投入。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    571

    瀏覽量

    11319
  • 聊天機器人
    +關注

    關注

    0

    文章

    348

    瀏覽量

    13092
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5189

原文標題:開源風波后在 AlpacaEval 直追 GPT4,零一靠技術如何重建生態信心

文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科微瀾亮相香港開源技術應用及生態發展論壇

    研發、應用落地、生態建設等多個領域,作為多元化交流平臺,匯聚產業、學界與科研力量,共同探討香港構建安全、可信、活躍的開源技術生態,以
    的頭像 發表于 12-22 16:59 ?482次閱讀

    開源鴻蒙生態設備南向分論壇成功舉辦

    11月28日,開源鴻蒙生態設備南向分論壇深圳舉辦,聚焦開源鴻蒙設備端發展與生態共建的最新進展。論壇邀請來自
    的頭像 發表于 12-04 16:57 ?960次閱讀

    開源鴻蒙生態成果集中亮相浦江,展示技術賦能與產業共進新圖景

    “浦江開源鴻蒙生態大會”期間,深開鴻攜眾多生態伙伴聯合打造的“開源鴻蒙生態展區”精彩亮相。展區
    的頭像 發表于 10-14 17:28 ?1557次閱讀
    <b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>生態</b>成果集中亮相浦江,展示<b class='flag-5'>技術</b>賦能與產業共進新圖景

    深開鴻亮相開源鴻蒙技術大會2025,以核心技術共建開源生態新格局

    2025年9月27日,開源鴻蒙技術大會2025長沙國際會議中心圓滿召開。大會由開源鴻蒙項目群技術指導委員會(TSC,TechnicalSt
    的頭像 發表于 09-28 15:36 ?1015次閱讀
    深開鴻亮相<b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>技術</b>大會2025,以核心<b class='flag-5'>技術</b>共建<b class='flag-5'>開源</b><b class='flag-5'>生態</b>新格局

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    這是通過軟件來實現的,GPT 硬件本身不支持輸出單個脈沖(One-Shot)功能。 當使用單個脈沖(One-Shot)模式時,必須要開啟中斷,計時器需要在脈沖周期結束 ISR 中斷服務函數中被停止
    發表于 09-01 15:20

    地方開源生態建設分論壇成功舉辦

    近日,2025開放原子開源生態大會——地方開源生態建設分論壇北京成功舉辦。論壇匯聚了來自政府部門、開源
    的頭像 發表于 08-05 10:57 ?1390次閱讀

    潤和軟件亮相2025開放原子開源生態大會

    7月23-24日,2025開放原子開源生態大會在北京國家會議中心盛大舉辦。作為由開放原子開源基金會主辦的年度開源盛會,本屆大會以“開源賦能產
    的頭像 發表于 08-01 17:49 ?2032次閱讀

    九聯科技亮相2025開放原子開源生態大會

    近日,以“開源賦能產業,生態共筑未來”為主題的開放原子開源生態大會在北京成功舉辦。本次大會吸引了眾多行業專家、企業代表以及技術領域的領軍人物
    的頭像 發表于 07-30 18:15 ?1253次閱讀

    開源鴻蒙出席地方開源生態建設圓桌交流會

    近日,2025開放原子開源生態大會“地方開源生態建設圓桌交流會”上,開源鴻蒙項目群工作委員會委
    的頭像 發表于 07-28 17:41 ?900次閱讀

    openKylin開源生態論壇順利召開

    近日,2025開放原子開源生態大會在北京舉辦。作為本次大會的一部分,openKylin開源生態論壇順利召開。論壇匯聚了芯片廠商、整機企業、軟件伙伴、教育機構等社區伙伴代表,共同探討
    的頭像 發表于 07-28 17:24 ?1238次閱讀

    榮膺“開源先鋒企業”!拓維信息攜開鴻智谷持續助力開源鴻蒙生態繁榮

    開源產業實踐,深度解析開源技術千行百業的落地成效與未來潛力。作為開放原子開源基金會黃金捐贈人、OpenHarmony項目群A類捐贈人,
    的頭像 發表于 07-24 18:09 ?1462次閱讀
    榮膺“<b class='flag-5'>開源</b>先鋒企業”!拓維信息攜開鴻智谷持續助力<b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>生態</b>繁榮

    2025開放原子開源生態大會精彩搶先看

    開源領軍企業代表、開發者及跨界精英,通過開幕式、26場專題論壇、多場交流會及開源生態交流區等多元形式,全面展現開源技術
    的頭像 發表于 07-15 17:11 ?1028次閱讀

    開源鴻蒙硬件生態分論壇圓滿舉辦

    近日,開源鴻蒙開發者大會2025(OHDC.2025)硬件生態分論壇深圳圓滿舉辦。本次論壇主題為“開源鴻蒙硬件新生態”,特邀行業
    的頭像 發表于 06-05 15:35 ?1051次閱讀

    開源鴻蒙大屏生態分論壇圓滿舉辦

    近日,開源鴻蒙開發者大會2025(OHDC.2025)深圳成功舉辦。主論壇上隆重舉行了“開源鴻蒙TV SIG”成立儀式,開源鴻蒙TV S
    的頭像 發表于 06-05 15:27 ?1247次閱讀