国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

摩爾線程預訓練語言模型MusaBert榮登CLUE榜單TOP10

摩爾線程 ? 來源:摩爾線程 ? 作者:摩爾線程 ? 2022-12-19 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摩爾線程聯(lián)合潞晨科技研發(fā)的預訓練語言模型MusaBert(MUSA為摩爾線程提出的通用元計算架構),在12月16日的中文語言理解領域權威CLUE榜單上進入TOP 10,最終以82.889得分在CLUE1.1總排行榜中排名(除人類成績以外)第9,并在AFQMC任務中以86.92分取得排名第一的成績,這意味著摩爾線程AI在語義理解與匹配能力上超越了人類水平。同時,這也是潞晨科技的AI大模型開發(fā)系統(tǒng)Colossal-AI在自然語言處理領域應用的重要進展。

eafabd56-7f42-11ed-8abf-dac502259ad0.png

(2022年12月16日CLUE1.1總排行榜最新成績)

相較于CLUE總排行榜TOP 10的其他中文預訓練模型,MusaBert僅包含3億參數量,是前十名中規(guī)模最小的模型,并且為單模型(single model),沒有進行任何集成。此外,摩爾線程基于MusaBert的語義嵌入模型MusaSim在AFQMC任務上擊敗一眾大規(guī)模模型,取得第一名,不僅為檢索系統(tǒng)、分類對話等更深度語義理解研究打下堅固基石,也證明了摩爾線程在中文自然語言處理領域和低資源大模型訓練方面的強大能力。

一直以來,語義理解都是NLP(自然語言處理)技術的重要目標,通過一系列AI算法,可將文本解析為結構化的、機器可讀的意圖與詞槽信息。通常來說,訓練數據的獲取與處理、模型的迭代和訓練等都是NLP技術的落地難點。MusaBert僅使用了極少的參數量便取得了比肩甚至超越百億參數大模型的成績,主要是得益于多方面獲得的突破性進展:

▼技術層面:摩爾線程擁有“軟硬一體”的技術能力,使得MusaBert能夠從底到上進行優(yōu)化;摩爾線程多功能GPU內置AI加速和并行計算等硬件模塊,能夠提供AI和科學計算在內的全棧功能,能夠為AI推理計算加速、低資源大模型訓練等應用場景提供通用、高性價比、節(jié)能環(huán)保的AI能力。

▼算法層面:MusaBert使用了潞晨科技的AI大模型開發(fā)系統(tǒng)Colossal-AI,在上游訓練方面,充分發(fā)揮了該系統(tǒng)的易用性及強大的并行訓練性能,同時MusaBert針對模型數據預處理使用的DataLoader進行了優(yōu)化,可以在低資源的條件下快速處理大規(guī)模數據;在下游任務方面,摩爾線程通過采用合適的優(yōu)化建模、在領域內進行數據增強以及在模型的訓練優(yōu)化中采用了先進的Adan優(yōu)化器等方式,盡可能發(fā)掘和展現(xiàn)出預訓練語言模型強大的語義理解能力。摩爾線程自研的語義嵌入模型MusaSim以MusaBert為基座模型,使用對比學習方法進行精調,并利用了摩爾線程收集的百萬對有監(jiān)督數據。得益于MusaBert和高質量的數據集,MusaSim不僅在語義相似度任務上超越了眾多更大規(guī)模的模型,在意圖識別、情緒分析等分類任務上,也能得到較好的效果。

▼數據層面:MusaBert除使用了摩爾線程自身收集的高質量語義相似數據以外,還使用了200GB悟道開源數據和80GB的CLUE社區(qū)數據,以及浪潮電子信息產業(yè)股份有限公司提供的1T高質量數據集。大規(guī)模高質量的數據使得模型在相對小的規(guī)模下仍然保持了較高的性能。

目前,MusaBert作為基座模型,已經應用于摩爾線程研發(fā)的智能客服與數字人等項目,并相繼在下游語義相似度、情緒識別、閱讀理解、聲韻識別等領域落地。

為了更進一步降低大模型開發(fā)和應用的門檻,MusaBert代碼現(xiàn)已開源到Colossal-AI倉庫(https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/roberta),使用該腳本,可在短時間內訓練出高質量的中文Bert模型。包括MusaBert和MusaSim在內的一系列高質量模型也將在近期開源以貢獻中文NLP社區(qū)。此外,經摩爾線程與潞晨科技的嚴格測試,僅通過摩爾線程多功能GPU單卡,即可進行MusaBert甚至是更大規(guī)模的GPT2的訓練,大大降低了預訓練成本,這也為雙方實現(xiàn)低資源大模型訓練的共同愿景,邁出了堅實一步。

作為中文語言理解領域最具權威性的測評基準之一,CLUE 涵蓋文本相似度、分類、自然語言推理、閱讀理解等眾多語義分析和理解類子任務,工業(yè)界和學術界紛紛用 CLUE 作為預訓練算法能力的驗證和衡量標準。此次進入CLUE榜單TOP 10,代表了摩爾線程與潞晨科技聯(lián)合研發(fā)團隊在中文預訓練研究領域已達到業(yè)內領先水平。

展望未來,摩爾線程還將與潞晨科技緊密合作,著手更適當規(guī)模的自然語言大模型研究,充分利用上游數據,產出能力更強的模型并且開源。同時,保持算法和系統(tǒng)兩個層面并行,持續(xù)優(yōu)化大模型在摩爾線程多功能GPU上的訓練能力,尤其在單張消費級顯卡等低資源場景下的訓練能力,可以大大降低使用大模型訓練的門檻和成本,進一步促進AI民主化。

▼ 關于潞晨科技

潞晨科技是一家致力于“解放AI生產力”的全球性公司,核心產品面向大模型時代的通用深度學習系統(tǒng) Colossal-AI,可實現(xiàn)高效快速部署AI大模型訓練和推理,降低AI大模型應用成本。自開源以來,Colossal-AI已經多次在GitHub熱榜位列世界第一,獲得GitHub Star約七千顆,并成功入選SC、AAAI、PPoPP等國際AI與HPC頂級會議的官方教程。相關解決方案已成功在自動駕駛云計算、零售、醫(yī)藥、芯片等行業(yè)知名廠商落地應用、廣受好評。

▼ 關于摩爾線程

摩爾線程是一家以 GPU 芯片設計為主的集成電路高科技公司,專注于研發(fā)設計全功能 GPU 芯片及相關產品,能夠為中國科技生態(tài)合作伙伴提供強大的計算加速能力。公司成立于 2020年10月,致力于創(chuàng)新面向元計算應用的新一代 GPU,構建融合視覺計算、3D 圖形計算、科學計算及人工智能計算的綜合計算平臺,建立基于云原生 GPU計算的生態(tài)系統(tǒng),助力驅動數字經濟發(fā)展。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI算法
    +關注

    關注

    0

    文章

    271

    瀏覽量

    13149
  • 自然語言處理

    關注

    1

    文章

    630

    瀏覽量

    14667
  • 摩爾線程
    +關注

    關注

    2

    文章

    279

    瀏覽量

    6456

原文標題:Colossal-AI助力,摩爾線程預訓練語言模型MusaBert榮登CLUE榜單TOP10

文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    摩爾線程新一代大語言模型對齊框架URPO入選AAAI 2026

    近日,摩爾線程在人工智能前沿領域取得重要突破,其提出的新一代大語言模型對齊框架——URPO統(tǒng)一獎勵與策略優(yōu)化,相關研究論文已被人工智能領域的國際頂級學術會議AAAI 2026收錄。這一
    的頭像 發(fā)表于 11-17 16:03 ?496次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>新一代大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>對齊框架URPO入選AAAI 2026

    易華錄入選全國數智企業(yè)TOP10榜單

    近日,2025全球數字貿易博覽會——西湖論劍·數字安全大會在杭州召開。活動現(xiàn)場,北京交通大學教授張向宏發(fā)布《全國數智產業(yè)發(fā)展研究報告(2024-2025)》,并推出全國首個數智產業(yè)動態(tài)化智能圖譜及《全國數智企業(yè)TOP10榜單》,旨在為數智產業(yè)的高質量發(fā)展提供參考與指引。
    的頭像 發(fā)表于 10-13 15:13 ?758次閱讀

    摩爾線程發(fā)布大模型訓練仿真工具SimuMax v1.0

    近日,摩爾線程正式發(fā)布并開源大模型分布式訓練仿真工具SimuMax 1.0版本。該版本在顯存和性能仿真精度上實現(xiàn)突破性提升,同時引入多項關鍵功能,進一步增強了
    的頭像 發(fā)表于 09-11 18:19 ?3716次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>發(fā)布大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>仿真工具SimuMax v1.0

    深演智能入選最具全球發(fā)展?jié)摿Φ闹袊鳤gent TOP10榜單

    智能從 150 家參評企業(yè)、近 300 個產品 / 解決方案中脫穎而出,成功入選 “最具全球發(fā)展?jié)摿Φ闹袊?Agent” TOP10 榜單,再度印證其在 AI Agent 領域的技術硬實力與全球化發(fā)展?jié)摿Α?/div>
    的頭像 發(fā)表于 09-01 16:00 ?1044次閱讀

    潤和軟件“潤知“知識處理大模型榮登“2025中國大模型TOP30”榜單

    ”知識處理大模型成功入選。這一榮譽不僅體現(xiàn)了潤和軟件在多模態(tài)大模型技術上的領先地位,也標志著其在推動企業(yè)智能化轉型方面邁出了堅實一步。 ?潤和軟件“潤知”知識處理大模型榮登“2025中
    的頭像 發(fā)表于 08-22 10:13 ?4200次閱讀

    摩爾線程“AI工廠”:五大核心技術支撐,打造大模型訓練超級工廠

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代AI訓練基礎設施,致力于為AGI時代打
    的頭像 發(fā)表于 07-28 11:28 ?4549次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“AI工廠”:五大核心技術支撐,打造大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>超級工廠

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎設施

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代AI訓練基礎設施,致力于為AGI時代打
    發(fā)表于 07-28 10:34 ?2801次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎設施

    天合儲能榮獲自產電池系統(tǒng)TOP10榜單

    近日,在2025高工儲能產業(yè)TOP50企業(yè)的頒獎典禮上,天合儲能憑借深厚的全棧自研能力、卓越的系統(tǒng)集成優(yōu)勢和強大的全球化交付實力,榮膺 “自產電池·系統(tǒng)” TOP10榜單。這一獎項不僅是對天合儲能技術實力與市場地位的認可,更是對
    的頭像 發(fā)表于 07-11 17:44 ?1190次閱讀

    中國固態(tài)電池綜合競爭力企業(yè)TOP10榜單發(fā)布,寧德時代、太藍新能源領跑

    近日,中國最強固態(tài)電池TOP10榜單《中國固態(tài)電池綜合競爭力企業(yè)TOP10》正式發(fā)布。該榜單由OFweek產業(yè)研究中心以技術、產能、市場及生態(tài)四維評價體系,深度剖析電池廠商在固態(tài)電池賽
    的頭像 發(fā)表于 04-19 13:44 ?7560次閱讀

    兆芯榮登2025中國IC設計處理器公司TOP10榜單

    的自主CPU產品體系、以及顯著的行業(yè)信創(chuàng)成果等多項優(yōu)勢,兆芯成功入圍中國IC設計處理器公司TOP10榜單,再度收獲業(yè)界高度贊許。 ? ? 2025中國IC設計Fabless100榜單覆蓋MCU、AI芯片
    的頭像 發(fā)表于 04-07 11:59 ?1439次閱讀
    兆芯<b class='flag-5'>榮登</b>2025中國IC設計處理器公司<b class='flag-5'>TOP10</b><b class='flag-5'>榜單</b>

    銳成芯微榮登2025中國IC設計Fabless100排行榜之TOP10 IP公司

    近日,國際電子技術領域頭部媒體AspenCore發(fā)布了《2025中國IC設計Fabless100排行榜》,銳成芯微憑借自主創(chuàng)新實力、技術生態(tài)布局及行業(yè)貢獻,再度榮登TOP10 IP公司”榜單
    的頭像 發(fā)表于 03-31 17:49 ?1746次閱讀

    敏芯股份榮登2025中國IC設計Fabless100排行榜之TOP10傳感器公司

    近日,AspenCore發(fā)布了“2025中國IC設計Fabless100”排行榜,向社會展示了一批優(yōu)秀企業(yè)以及各類TOP10榜單,這也是AspenCore第六年發(fā)布產業(yè)榜單。敏芯股份入選“TO
    的頭像 發(fā)表于 03-31 14:45 ?1742次閱讀

    摩爾線程GPU成功適配Deepseek-V3-0324大模型

    架構和全功能GPU的強大技術實力,摩爾線程迅速響應并完成了對DeepSeek-V3的無縫升級,實現(xiàn)了零報錯、零兼容性問題的光速部署,充分展現(xiàn)了摩爾線程在AI大
    的頭像 發(fā)表于 03-31 11:34 ?1281次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU成功適配Deepseek-V3-0324大<b class='flag-5'>模型</b>

    用PaddleNLP為GPT-2模型制作FineWeb二進制訓練數據集

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 《用PaddleNLP在4060單卡上實踐大模型訓練技術》發(fā)布后收到讀者熱烈反響,很多讀者要求進一步講解更多的技術細節(jié)。本文主要針對大語言
    的頭像 發(fā)表于 03-21 18:24 ?4315次閱讀
    用PaddleNLP為GPT-2<b class='flag-5'>模型</b>制作FineWeb二進制<b class='flag-5'>預</b><b class='flag-5'>訓練</b>數據集

    摩爾線程GPU原生FP8計算助力AI訓練

    并行訓練和推理,顯著提升了訓練效率與穩(wěn)定性。摩爾線程是國內率先原生支持FP8計算精度的國產GPU企業(yè),此次開源不僅為AI訓練和推理提供了全新
    的頭像 發(fā)表于 03-17 17:05 ?1528次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計算助力AI<b class='flag-5'>訓練</b>