国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發布“源”Yuan-EB助力RAG檢索精度新高

浪潮AIHPC ? 來源:浪潮AIHPC ? 2024-11-26 13:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,浪潮信息發布 “源”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務第一名,以78.41的平均精度刷新大模型RAG檢索最高成績,將基于元腦企智EPAI為構建企業知識庫提供更高效、精準的知識向量化能力支撐,助力用戶使用領先的RAG技術加速企業知識資產的價值釋放。

2a0c093e-a659-11ef-93f3-92fbcf53809c.png

“源”Yuan-EB 在HuggingFace的C-MTEB榜單中排名第一

Yuan-EB(版本號Yuan-embedding-1.0) 是專為增強中文文本檢索能力而設計的嵌入模型(也稱Embedding模型),在 “源2.0” 大模型的工作基礎上,創新性地采用了“源2.0-M32”大模型進行數據重寫與合成,并通過索引技術、樣本排序等系列方法完成高質量微調數據集構建,能夠有效提升RAG系統的檢索精度。

C-MTEB是目前業內最權威的嵌入模型測試榜單。其中,檢索任務(Retrieval)是檢索增強生成(RAG)場景下最為重要、應用最廣泛的任務能力,考察的是Embedding模型從大量的數據集中找到并返回與給定查詢最相關或最匹配的信息的過程。“源”Yuan-EB基于該任務提供的醫療、新聞、電商、娛樂等8個中文文本數據集,實現了業界領先的海量文本檢索精度。

2a18dba0-a659-11ef-93f3-92fbcf53809c.png

C-MTEB榜單Retrieval任務提供8個測試數據集

“源” Yuan-EB 助力RAG檢索精度新高

嵌入模型在RAG流程中扮演著關鍵角色,它能夠將復雜的高維數據(例如文本、圖像或音頻)轉換為機器可理解的向量形式,直接決定了RAG檢索的精準性和效率。

2a3da4ee-a659-11ef-93f3-92fbcf53809c.png

“源”Yuan-EB通過數據準備與模型微調兩個方面的技術創新,實現了模型精度的大幅提升:

■ 在數據方面,基于“源2.0”微調階段的問答數據進行清洗與篩選,構建問題(query)與文本(corpus)數據集;使用“源2.0-M32”對C-MTEB 訓練數據進行重寫與合成,通過索引技術與排序模型進行高效的難負樣本提取,完成大規模難負例樣本挖掘,形成高質量微調數據集;

■ 在微調方面,通過兩個階段的領先微調方法實現模型能力提升。第一階段,使用各個領域(醫療、新聞、長文本、娛樂等方向)的大規模數據進行對比學習訓練;第二階段,采用“源2.0-M32”生成的合成數據進一步微調,并使用MRL方法完成“源”Yuan-EB訓練;

“源”Yuan-EB為用戶提供了大模型企業知識庫應用開發的最優模型選擇,能夠在 RAG流程的多個方面起到顯著的精度提升,包括信息檢索的準確性、處理大規模數據的效率、消除語義歧義、降低計算成本、增強對長文檔的處理能力以及模型魯棒性等,最大化提升RAG流程的整體性能和應用效果。

元腦企智EPAI集成“源”Yuan-EB,加速知識庫構建與性能提升

目前,“源”Yuan-EB已經在開源社區和企業大模型開發平臺元腦企智EPAI中全面開放下載。用戶可以在元腦企智EPAI平臺中快速使用“源”Yuan-EB,并結合EPAI自研的多階段RAG技術,零代碼、低成本地基于企業數據構建大模型知識庫應用。

企業大模型開發平臺“元腦企智”EPAI(Enterprise Platform of AI),是浪潮信息為企業AI大模型落地應用打造的高效、易用、安全的端到端開發平臺,提供數據準備、模型訓練、知識檢索、應用框架等系列工具,支持調度多元算力和多模算法,幫助企業高效開發部署生成式AI應用、打造智能生產力。

元腦企智EPAI已經支持超過13種類型文檔的信息識別與提取,結合創新的多級混合檢索策略,有效提升元腦企智EPAI在管理、解析、檢索知識庫與生成內容方面的最終效果,幫助企業用戶實現基于私有數據、行業數據下的精準檢索、精準問答,確保專業場景下大模型生成內容的準確性和可靠性,加速大模型創新力釋放。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 浪潮
    +關注

    關注

    1

    文章

    476

    瀏覽量

    25421
  • 開源
    +關注

    關注

    3

    文章

    4207

    瀏覽量

    46141
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5183

原文標題:浪潮信息發布“源”Yuan-EB,刷新大模型RAG檢索精度紀錄!

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RAG(檢索增強生成)原理與實踐

    思想 RAG的核心思想非常直觀:在生成答案之前,先從知識庫中檢索相關信息,然后將這些信息作為上下文提供給大語言模型,讓模型基于這些\"參考資料\"來生成更準確的回答。 這就像是讓AI在
    發表于 02-11 12:46

    Elektrobit EB civion平臺助力SDV 2.0智能座艙開發

    基于此,Elektrobit推出EB civion——一套專為SDV 2.0設計的智能座艙工程化工具鏈與開發平臺,助力行業實現從研發到量產的高效一體化轉型。
    的頭像 發表于 01-26 10:05 ?1924次閱讀

    發布元服務填寫審核信息與聯系方式

    填寫審核信息 登錄AppGallery Connect,點擊“APP與元服務”。 選擇要發布的元服務。 左側導航選擇“應用上架 > 版本信息”下待發布的版本。 進入“應用審核
    發表于 12-01 14:30

    RAG實踐:一文掌握大模型RAG過程

    RAG(Retrieval-Augmented Generation,檢索增強生成), 一種AI框架,將傳統的信息檢索系統(例如數據庫)的優勢與生成式大語言模型(LLM)的功能結合在一
    的頭像 發表于 10-27 18:23 ?1562次閱讀
    <b class='flag-5'>RAG</b>實踐:一文掌握大模型<b class='flag-5'>RAG</b>過程

    浪潮信息發布&quot;元腦SD200&quot;超節點,面向萬億參數大模型創新設計

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發布面向萬億參數大模型的超節點AI服務器"元腦SD200"。該產品基于浪潮信息創新研發的多主機低延遲內存語義通信架構,以開放系統設計向上
    的頭像 發表于 08-08 22:17 ?677次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>&quot;元腦SD200&quot;超節點,面向萬億參數大模型創新設計

    飛利信與浪潮信息達成戰略合作

    近日,2025年浪潮信息北京ISP戰略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術有限公司等22家戰略合作伙伴達成簽約,其中將面向北京人工智能應用大市場,在產品技術共創、行業場景深化及區域
    的頭像 發表于 06-24 17:37 ?1107次閱讀

    使用 llm-agent-rag-llamaindex 筆記本時收到的 NPU 錯誤怎么解決?

    使用 conda create -n ov-nb-demos python=3.11 創建運行 llm-agent-rag-llamaindex notebook 的環境。 執行“創建
    發表于 06-23 06:26

    軟通動力發布智慧園區RAG解決方案

    近日,鯤鵬昇騰開發者大會2025(KADC 2025)在北京正式啟幕。軟通動力作為鯤鵬路線堅定的擁護者與實踐者,受邀出席大會,正式發布軟通動力智慧園區RAG(Retrieval Augmented Generation 檢索增強
    的頭像 發表于 05-29 10:00 ?886次閱讀
    軟通動力<b class='flag-5'>發布</b>智慧園區<b class='flag-5'>RAG</b>解決方案

    如何在基于Arm Neoverse平臺的Google Axion處理器上構建RAG應用

    你是否好奇如何防止人工智能 (AI) 聊天機器人給出過時或不準確的答案?檢索增強生成 (Retrieval-Augmented Generation, RAG) 技術提供了一種強大的解決方案,能夠顯著提升答案的準確性和相關性。
    的頭像 發表于 04-28 14:34 ?1088次閱讀
    如何在基于Arm Neoverse平臺的Google Axion處理器上構建<b class='flag-5'>RAG</b>應用

    DevEco Studio AI輔助開發工具兩大升級功能 鴻蒙應用開發效率再提升

    ) 模型微調(Fine-tuning):針對特定領域優化生成模型的表現。RAG支持實時更新官方數據,避免傳統微調模型因數據滯后產生的幻象。 圖1:DeepSeek RAG檢索流程 另
    發表于 04-18 14:43

    納芯微發布新高精度雙通道電流檢測放大器NSCSA285系列

    近日,納芯微發布新高精度雙通道電流檢測放大器NSCSA285系列。NSCSA285系列憑借高達76V的寬共模電壓范圍、±12μV的超低輸入偏移電壓及140dB的直流共模抑制比(CMRR),具備
    的頭像 發表于 04-12 14:39 ?1406次閱讀
    納芯微<b class='flag-5'>發布</b>全<b class='flag-5'>新高精度</b>雙通道電流檢測放大器NSCSA285系列

    筑基&quot;AI+人才&quot;培養,浪潮信息攜手元腦伙伴拓爾思推出智慧教育新平臺

    北京2025年3月22日?/美通社/ -- 近期,元腦生態伙伴拓爾思信息技術股份有限公司(以下簡稱:拓爾思)攜手浪潮信息,聯合為高校AI人才培養推出"AI創新培養綜合服務平臺",基于該平臺實現實訓
    的頭像 發表于 03-27 16:56 ?824次閱讀
    筑基&quot;AI+人才&quot;培養,<b class='flag-5'>浪潮信息</b>攜手元腦伙伴拓爾思推出智慧教育新平臺

    天瞳威視與浪潮信息達成戰略合作,推進高階智駕車載計算系統創新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達成戰略合作協議。此次合作依托浪潮信息提供的車載算力平臺硬件系統、底層軟件環境
    的頭像 發表于 03-27 16:55 ?639次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達成戰略合作,推進高階智駕車載計算系統創新

    浪潮信息:元腦企智DeepSeek一體機將舉辦生態伙伴推介體驗會

    ?3月11日,浪潮信息將面向全國元腦生態伙伴舉辦"元腦企智DeepSeek一體機生態伙伴推介體驗會"。活動現場,伙伴可深入了解元腦企智DeepSeek一體機的最新功能亮點,上手實操體驗深度優化的元腦
    的頭像 發表于 03-09 14:20 ?596次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智DeepSeek一體機將舉辦生態伙伴推介體驗會

    《AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫

    應用。第六章深入探討了RAG架構的工作原理,該技術通過在推理過程中實時檢索和注入外部知識來增強模型的生成能力。RAG架構的核心是檢索器和生成器兩大模塊,
    發表于 03-07 19:49