国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Nemotron-4 340B模型幫助開發者生成合成訓練數據

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-09-06 14:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式 AI 訓練的數據集。

NVIDIA 于近日發布Nemotron-4 340B。開發者可以使用這組開源模型生成用于訓練大語言模型(LLM)的合成數據,訓練出的 LLM 可用于醫療、金融、制造、零售等各個行業的商業應用。

高質量的訓練數據對于自定義 LLM 的性能、準確性和回答質量來說至關重要,但強大的數據集通常非常昂貴且難以獲得。

通過獨樹一幟的開源模型許可證,Nemotron-4 340B 為開發者提供了一種免費、可擴展的合成數據生成方法,幫助他們構建強大的 LLM。

Nemotron-4 340B 系列包含基礎模型、指導模型和獎勵模型,由它們組成的流水線能夠生成用于訓練和完善 LLM 的合成數據。為了能夠與NVIDIA NeMo協同工作,這些模型專門進行了優化。NVIDIA NeMo 是一個適用于端到端模型訓練的開源框架,涵蓋數據管護、定制、評估等步驟。該系列模型還針對開源NVIDIA TensorRT-LLM庫的推理進行了優化。

Nemotron-4 340B 現已可以從NVIDIA NGC目錄和 Hugging Face 下載。開發者很快就能在 ai.nvidia.com 上訪問這些模型,它們將被打包成帶有標準應用編程接口的NVIDIA NIM微服務,可在任意位置進行部署。

將 Nemotron 用于生成合成數據

在難以獲得大型多樣化標記數據集的情況下,這些 LLM 可以幫助開發者生成合成訓練數據。

Nemotron-4 340B Instruct模型可生成各種模擬現實世界數據特征的合成數據,通過提高數據質量,增強自定義 LLM 在各個領域的性能和穩健性。

隨后,為了提高 AI 生成數據的質量,開發者可以使用Nemotron-4 340B Reward模型來篩選高質量的回答。Nemotron-4 340B Reward 模型根據五個方面對回答進行評分,這五個方面分別是:有用性、正確性、連貫性、復雜性和冗長性。該模型目前在 AI2 專為評估獎勵模型能力、安全性和缺陷而創建的“Hugging Face RewardBench 排行榜”上排名第一。

wKgZombaqFaAYqNYAAEgri7KFqc769.jpg

在這個合成數據生成流水線中,(1)Nemotron-4 340B Instruct 模型首先生成基于文本的合成輸出。然后來到評估模型,

(2)Nemotron-4 340B Reward 模型對生成的文本進行評估,并提供指導反復改進的反饋,確保合成數據準確、相關且符合特定要求。

研究者還可以使用自己的專有數據,并結合隨附的HelpSteer2 數據集自定義 Nemotron-4 340B Base 模型,創造出自己的指導或獎勵模型。

使用 NeMo 進行微調

并使用 TensorRT-LLM 優化推理

開發者可以使用開源的 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 提高其指導和獎勵模型的效率,以便生成合成數據并對回答進行評分。

所有 Nemotron-4 340B 模型均使用 TensorRT-LLM 優化,能夠利用張量并行性,這是一種模型并行技術,通過將單個權重矩陣分割到多個 GPU 和服務器上,實現大規模的高效推理。

Nemotron-4 340B Base在 9 萬億個 token 上訓練而成。可使用 NeMo 框架對它進行自定義,使其適應特定的用例或領域。這一微調過程得益于大量的預訓練數據,使模型能夠針對特定的下游任務提供更加準確的輸出。

NeMo 框架提供多種自定義方法,包括有監督的微調和各種參數高效微調方法,比如低秩自適應(LoRA)。

為了提升模型質量,開發者可以使用NeMo Aligner以及由 Nemotron-4 340B Reward 模型注釋的數據集對齊模型。校準是 LLM 訓練過程中的一個關鍵步驟。在該步驟中,模型的行為通過人類反饋強化學習(RLHF)等算法進行微調,以保證其輸出結果安全、準確、符合上下文并與其預期目標一致。

尋求企業級支持和生產環境安全性的企業也可以通過NVIDIA AI Enterprise云原生軟件平臺訪問 NeMo 和 TensorRT-LLM。該平臺為生成式 AI 基礎模型提供更加快速和高效的運行時。

評估模型安全性并開始使用

Nemotron-4 340B Instruct 模型經過包括對抗測試在內的大量安全性評估,其各項風險指標均表現良好。但用戶仍應對該模型的輸出結果進行仔細評估,確保合成生成的數據適合且安全而準確地用于自己的用例。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109723
  • 模型
    +關注

    關注

    1

    文章

    3752

    瀏覽量

    52101
  • LLM
    LLM
    +關注

    關注

    1

    文章

    346

    瀏覽量

    1329

原文標題:NVIDIA 發布適用于訓練大語言模型的開源合成數據生成流水線

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業和各國現在能夠使用自有數據與 Llama 3.1 405BNVIDIA Nemotron
    發表于 07-24 09:39 ?1168次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業打造自定義 Llama 3.1 <b class='flag-5'>生成</b>式 AI <b class='flag-5'>模型</b>

    2021 OPPO開發者大會:NLP預訓練模型

    2021 OPPO開發者大會:NLP預訓練模型 2021 OPPO開發者大會上介紹了融合知識的NLP預訓練
    的頭像 發表于 10-27 14:18 ?2162次閱讀
    2021 OPPO<b class='flag-5'>開發者</b>大會:NLP預<b class='flag-5'>訓練</b>大<b class='flag-5'>模型</b>

    NVIDIA提供用于AI訓練合成數據生成工具

    提供合成數據生成工具和服務的企業以及開發者現在可以使用 Omniverse Replicator SDK 構建自定義、物理級精確的合成數據生成
    的頭像 發表于 07-03 10:06 ?2846次閱讀

    NVIDIA NeMo最新語言模型服務幫助開發者定制大規模語言模型

    NVIDIA NeMo 大型語言模型(LLM)服務幫助開發者定制大規模語言模型NVIDIA B
    發表于 09-22 10:42 ?1242次閱讀

    使用 NVIDIA TAO 工具套件和預訓練模型加快 AI 開發

    可以訪問預訓練模型的完整源代碼和模型權重。 該工具套件能夠高效訓練視覺和對話式 AI 模型。由于簡化了復雜的 AI
    的頭像 發表于 12-15 19:40 ?1937次閱讀

    NVIDIA 與 Hugging Face 將連接數百萬開發者生成式 AI 超級計算

    8 月 8 日 — NVIDIA 與 Hugging Face 宣布建立合作伙伴關系,為數百萬開發者提供生成式 AI 超級計算服務,幫助他們構建大語言
    發表于 08-09 11:41 ?480次閱讀
    <b class='flag-5'>NVIDIA</b> 與 Hugging Face 將連接數百萬<b class='flag-5'>開發者</b>與<b class='flag-5'>生成</b>式 AI 超級計算

    NVIDIA 加快企業自定義生成式 AI 模型開發

    的業務數據進行自定義。 如今,免費、開源的大語言模型對企業來說就像是一頓“自助餐”。但對于構建自定義生成式 AI 應用的開發者來說,這頓“大餐”可能會讓他們應接不暇,因為他們需要滿足各
    的頭像 發表于 11-16 21:15 ?1492次閱讀
    <b class='flag-5'>NVIDIA</b> 加快企業自定義<b class='flag-5'>生成</b>式 AI <b class='flag-5'>模型</b><b class='flag-5'>開發</b>

    NVIDIA將全球數百萬開發者轉變為生成式 AI 開發者

    和測試 ? NVIDIA 于今日宣布,全球 2,800 萬開發者現可下載NVIDIA NIM——一種推理微服務,通過經優化的容器的形式提供模型——以部署在云、
    的頭像 發表于 06-03 18:21 ?1910次閱讀

    英偉達開源Nemotron-4 340B系列模型,助力大型語言模型訓練

    近日,英偉達宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發者們打開了通往高性能大型語言模型(LLM)
    的頭像 發表于 06-17 14:53 ?1340次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發者和企業提供業務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜
    發表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI <b class='flag-5'>模型</b>系列,助力<b class='flag-5'>開發者</b>和企業構建代理式 AI 平臺

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新

    推理模型,讓開發者以前所未有的方式控制世界生成NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供
    的頭像 發表于 03-20 19:01 ?1338次閱讀

    NVIDIA Nemotron Nano 2推理模型發布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發表于 08-27 12:45 ?1780次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b>發布

    NVIDIA Nemotron模型如何推動AI發展

    Nemotron 開源技術能夠幫助開發者與企業構建強大的通用和專用智能系統。
    的頭像 發表于 10-13 11:12 ?1022次閱讀

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據
    的頭像 發表于 12-01 09:25 ?1133次閱讀

    NVIDIA 推出 Nemotron 3 系列開放模型

    token 數。 ● Nemotron 通過先進的強化學習技術以及大規模并行多環境后訓練,實現了卓越的準確率。 ● NVIDIA 率先推出整套前沿的開放模型
    的頭像 發表于 12-16 09:27 ?626次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Nemotron</b> 3 系列開放<b class='flag-5'>模型</b>