国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OPPO登頂CLUE與MUGE,刷新中文自然語言理解與圖文多模態雙榜記錄

荷葉塘 ? 來源:OPPO ? 作者:廠商供稿 ? 2022-11-10 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2022年11月9日,OPPO語音語義研究部融智團隊提出的中文預訓練大模型CHAOS ,在中文自然語言理解測評基準CLUE上登頂,以30億參量同時刷新了CLUE總排行榜、CLUE分類任務排行榜和CLUE閱讀理解排行榜的最好成績。其中在“AFQMC,TNEWS,CSL,CHID1.1”4個賽道的成績超過了人類識別精確準確度,總成績距離超越人類表現僅差0.1。

同期,在業界首個大規模中文多模態評測基準MUGE上,該團隊自主訓練的中文多模態預訓練模型也在綜合“圖文檢索、看圖說話、文本到圖像生成”三個賽道的總成績上位列總榜第一名。


OPPO 中文預訓練大模型CHAOS登頂CLUE


OPPO中文多模態預訓練模型登頂MUGE


CLUE (Chinese Language Understanding Evaluation) 是中文自然語言理解最權威測評榜單之一,包含了文本分類、閱讀理解、句間關系等眾多語義分析和語義理解類子任務,旨在推動NLP(自然語言處理)訓練模型技術的不斷進步和突破,對學術界和工業界都產生了較大的影響。

MUGE(Multimodal Understanding and Generation Evaluation)是業界首個大規模中文多模態評測基準,由達摩院聯合浙江大學、阿里云天池平臺聯合發布,中國計算機學會計算機視覺專委會(CCF-CV專委)協助推出,旨在幫助中文多模態研究人員全方位評估算法模型。

NLP(自然語言處理)技術是人工智能領域的一個核心研究方向,其目的是使得計算機具備人類的聽、說、讀、寫等能力,并利用知識和常識進行推理和決策。而圖文融合的多模態能力的建設,目前工作主要集中在建立圖像模態和文本模態的聯系,相關能力的構建能夠廣泛落地到搜索、推薦、服飾設計、智能文案等真實場景中。

“融合多種智能,研發統一的基礎模型”是OPPO語音語義研究部融智團隊的目標,也是“融智”二字的含義。未來融智團隊將在推進感知認知融合,更可控/可編輯的視覺生成,及促進工業化落地轉化的模型小型化等方向上繼續突破。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • OPPO
    +關注

    關注

    20

    文章

    5294

    瀏覽量

    85034
  • 人工智能
    +關注

    關注

    1817

    文章

    50097

    瀏覽量

    265316
  • 自然語言處理

    關注

    1

    文章

    630

    瀏覽量

    14667
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    商湯開源SenseNova-MARS:突破模態搜索推理天花板

    今日,商湯正式開源模態自主推理模型 SenseNova-MARS(8B/32B 版本),其在模態搜索與推理的核心基準測試中以 69.7
    的頭像 發表于 01-29 23:53 ?152次閱讀
    商湯開源SenseNova-MARS:突破<b class='flag-5'>多</b><b class='flag-5'>模態</b>搜索推理天花板

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個分支,它會教計算機如何理解口頭和書面形式的人類語言自然語言處理將計算語言學與機器學習
    的頭像 發表于 01-29 14:01 ?362次閱讀
    <b class='flag-5'>自然語言</b>處理NLP的概念和工作原理

    云知聲論文入選自然語言處理頂會EMNLP 2025

    近日,自然語言處理(NLP)領域國際權威會議 ——2025 年計算語言學與自然語言處理國際會議(EMNLP 2025)公布論文錄用結果,云知聲提交的《面向門診病歷生成的高質量醫患對話合成技術
    的頭像 發表于 11-10 17:30 ?803次閱讀
    云知聲論文入選<b class='flag-5'>自然語言</b>處理頂會EMNLP 2025

    格靈深瞳模態大模型Glint-ME讓圖文互搜更精準

    在電商、安防等場景下,圖文互搜應用廣泛。隨著以CLIP為代表的模態表征方法相繼提出,過去單一模態搜索(文搜文、圖搜圖)被突破,模型可以同時理解
    的頭像 發表于 11-02 15:56 ?1714次閱讀
    格靈深瞳<b class='flag-5'>多</b><b class='flag-5'>模態</b>大模型Glint-ME讓<b class='flag-5'>圖文</b>互搜更精準

    商湯日日新V6.5模態大模型登頂全球權威榜單

    Pro)模態大模型以82.2的綜合成績登頂榜首,領先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。
    的頭像 發表于 09-10 09:55 ?792次閱讀

    成都匯陽投資關于大模型白熱化,應用加速分化

    Gemini 2.5 Flash Image登頂 主流圖像,Meta 也從 Midjourney 授權 AI 圖像模型;視頻領域,阿里字節等刷新能力高度 ,谷歌將視頻模型推進至實
    的頭像 發表于 09-09 09:30 ?919次閱讀

    米爾RK3576部署端側模態輪對話,6TOPS算力驅動30億參數LLM

    加載 → 圖片預處理 → 用戶交互 → 推理輸出”的核心流程,支持圖文一體的模態對話,適配輪問答、視覺問答等典型場景。 具體運行機制可拆解為以下步驟:1. 模型初始化首先加載大
    發表于 09-05 17:25

    【HZ-T536開發板免費體驗】5- 無需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開發板上搭建 MCP 服務器,自然語言輕松控板

    GPIO 等),并返回結果。 Cangjie Magic 角色 :構建MCP服務器,同時提供自然語言理解能力,將用戶輸入的文本(如 “查看開發板 IP 地址”“點亮 LED1”)轉換為機器可識別的指令(如
    發表于 08-23 13:10

    飛凌嵌入式RK3576模態大模型圖像理解助手,讓嵌入式設備“看懂”世界

    (LLM)+視覺語言模型(VLM)模態架構,推出模態大模型圖像理解助手,為嵌入式設備打造 “
    的頭像 發表于 07-25 11:09 ?1665次閱讀
    飛凌嵌入式RK3576<b class='flag-5'>多</b><b class='flag-5'>模態</b>大模型圖像<b class='flag-5'>理解</b>助手,讓嵌入式設備“看懂”世界

    云知聲四篇論文入選自然語言處理頂會ACL 2025

    結果正式公布。云知聲在此次國際學術盛會中表現卓越,共有4篇論文被接收,其中包括2篇主會論文(Main Paper)和2篇Findings。入選的4篇論文聚焦大語言模型知識溯源、圖文模態
    的頭像 發表于 05-26 14:15 ?1312次閱讀
    云知聲四篇論文入選<b class='flag-5'>自然語言</b>處理頂會ACL 2025

    基于MindSpeed MM玩轉Qwen2.5VL模態理解模型

    模態理解模型是讓AI像人類一樣,通過整合多維度信息(如視覺、語言、聽覺等),理解數據背后的語義、情感、邏輯或場景,從而完成推理、決策等任務
    的頭像 發表于 04-18 09:30 ?3019次閱讀
    基于MindSpeed MM玩轉Qwen2.5VL<b class='flag-5'>多</b><b class='flag-5'>模態</b><b class='flag-5'>理解</b>模型

    自然語言提示原型在英特爾Vision大會上首次亮相

    在英特爾Vision大會上,Network Optix首次展示了自然語言提示原型,該方案將重新定義視頻管理,為各行各業由AI驅動的洞察和效率提速。
    的頭像 發表于 04-09 09:30 ?963次閱讀

    商湯“日日新”融合大模型登頂語言模態榜單

    據弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯合頭豹研究院發布的《2025年中國大模型年度評測》結果顯示:在語言模態核心能力測評中,商湯“日日新”融合大模型斬獲國內第一梯隊成績。
    的頭像 發表于 03-18 10:35 ?1140次閱讀

    ?VLM(視覺語言模型)?詳細解析

    視覺語言模型(Visual Language Model, VLM)是一種結合視覺(圖像/視頻)和語言(文本)處理能力的模態人工智能模型,能夠理解
    的頭像 發表于 03-17 15:32 ?8828次閱讀
    ?VLM(視覺<b class='flag-5'>語言</b>模型)?詳細解析

    ?模態交互技術解析

    模態交互 模態交互( Multimodal Interaction )是指通過多種感官通道(如視覺、聽覺、觸覺等)或多種交互方式(如語音、手勢、觸控、眼動等)與計算機系統進行
    的頭像 發表于 03-17 15:12 ?4400次閱讀