国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

8G顯存一鍵訓練,解鎖Llama2隱藏能力!XTuner帶你玩轉大模型

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-09-04 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自 ChatGPT 發布以來,大模型的強大讓人們看見了通用人工智能的曙光,各個科技大廠也紛紛開源自家的大語言模型。然而,大模型也意味著高昂的硬件成本,讓不少平民玩家望而卻步。

為了讓大模型走入千家萬戶,賦能百業,上海人工智能實驗室開發了低成本大模型訓練工具箱 XTuner,旨在讓大模型訓練不再有門檻。通過 XTuner,最低只需 8GB 顯存,就可以打造專屬于你的 AI 助手。

X 種選擇

a60b02ea-49aa-11ee-97a6-92fbcf53809c.png

XTuner 提供了豐富的功能,上圖中的各項功能都可以隨意組合搭配。

除單點功能外,XTuner 還有以下三個黑科技,讓開發者可以做到真正的“面向數據”工作。

高效的數據引擎

XTuner 適配了多個熱門開源數據集格式,開發者如已有對應格式的數據集,可以直接使用,并支持多種格式數據源的混合使用:

Alpaca 格式,斯坦福大學開源數據集的格式,也是社區開源項目使用較多的一種格式

MOSS 格式,復旦大學開源指令微調數據集的格式,包含多輪對話和工具調用

Gunacao 格式,QLoRA 項目中所使用數據集的格式

OpenAI 格式,GPT-3.5-Turbo Finetune 接口要求的數據集格式

更多數據集格式正在持續添加中......

pip install xtuner # 訓練混合了 Alpaca 格式和 Gunacao 格式的數據 xtuner train internlm_7b_qlora_alpaca_enzh_oasst1_e3

除了支持多種數據集格式外,XTuner 還針對大語言模型數據的特點,對各種數據集格式做了充分的解耦,相較于其他的 Finetune 開源項目,可以在不破壞 Chat 模型對話模版的情況下,對 Chat 模型進行 Finetune。

pip install xtuner # 不破壞 Chat 模型對話模版,繼續增量指令微調 xtuner train internlm_chat_7b_qlora_oasst1_e3

針對 GPU 計算特點,在顯存允許的情況下,XTuner 支持將多條短數據拼接至模型最大輸入長度,以此最大化 GPU 計算核心的利用率,可以顯著提升訓練速度。例如,在使用 oasst1 數據集微調 Llama2-7B 時,數據拼接后的訓練時長僅為普通訓練的 50%。

多種訓練引擎

XTuner 首次嘗試將 HuggingFace 與 OpenMMLab 進行結合,兼顧易用性和可配置性。支持使用 MMEngine Runner 和 HuggingFace Trainer 兩種訓練引擎,開發者如有深度定制化需求,可根據使用習慣靈活配置。

pip install xtuner # 使用 MMEngine Runner 訓練 xtuner train internlm_7b_qlora_oasst1_e3 # 使用 HugingFace Trainer 訓練 xtuner train internlm_7b_qlora_oasst1_e3_hf

一鍵啟動訓練

XTuner 內置了增量預訓練、單輪&多輪對話指令微調、工具類指令微調的標準化流程,讓開發者只需聚焦于數據本身。

同時, XTuner 集成了 QLoRA、DeepSpeed 和 FSDP 等技術,提供各種尺寸模型在各種規格硬件下的訓練解決方案,通過 XTuner 一鍵式啟動訓練,僅需 8GB 顯存即可微調 7B 模型。

pip install 'xtuner[deepspeed]' # 8G 顯存微調 Llama2-7B xtuner train llama2_7b_qlora_oasst1_512_e3 --deepspeed deepspeed_zero2

基于此,開發者可以專注于數據,其他環節放心交給 XTuner,抽出更多精力去奔向大模型的星辰大海!

X 種玩法

通過 XTuner,開發者可以給大模型添加插件,補足大模型欠缺的能力,甚至獲得某些 ChatGPT 才有的技能。

XTuner 在 HuggingFace Hub 上提供了豐富的大模型插件,以下示例都可以在 Hub 中找到,歡迎大家下載體驗!

ColoristLlama -- 你的專屬調色師

通過在少量顏色注釋數據集上對 Llama2-7B 進行指令微調訓練,XTuner 成功解鎖了其調色能力。最終得到的模型甚至可以像“你的甲方”一樣反復修訂!

a65a773a-49aa-11ee-97a6-92fbcf53809c.gif

a6751fd6-49aa-11ee-97a6-92fbcf53809c.gif

pip install xtuner xtuner chat hf meta-llama/Llama-2-7b-hf --adapter xtuner/Llama-2-7b-qlora-colorist --prompt-template colorist

Llama "聯網" -- 更可靠及時的回答

借助 XTuner 及插件開源數據集,我們還解鎖了 Llama 2、QWen 等開源模型的隱藏能力, 使其可以像 ChatGPT 一樣聯網搜索、調用工具,獲得更可靠的回復。

a68d9408-49aa-11ee-97a6-92fbcf53809c.gif

a6cac03a-49aa-11ee-97a6-92fbcf53809c.gif

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135431
  • 顯存
    +關注

    關注

    0

    文章

    112

    瀏覽量

    14094
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5179

原文標題:8G顯存一鍵訓練,解鎖Llama2隱藏能力!XTuner帶你玩轉大模型

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DP1323EL的電動車解鎖方案:超高速讀寫,提升電動車一鍵解鎖體驗

    在快節奏的都市生活中,電動車已成為許多人的首選出行工具。然而,傳統的機械鑰匙往往帶來諸多不便:容易丟失、操作繁瑣,甚至在雨天或匆忙時成為負擔。 ? ? 隨著物聯網和智能科技的快速發展,一鍵解鎖方案
    的頭像 發表于 12-05 18:06 ?1869次閱讀

    【CIE全國RISC-V創新應用大賽】基于 K1 AI CPU 的大模型部署落地

    代碼與步驟 項目結構 /contest_14b ├── spacemit-llama.cpp.riscv64.0.0.4/ (官方工具) ├── run_contest.sh(一鍵啟動
    發表于 11-27 14:43

    RA8P1部署ai模型指南:從訓練模型到部署?|?本周六

    在嵌入式邊緣AI中,如何把“訓練好的模型”穩定地“跑在板子上”,決定了項目能否落地。我們帶你基于RA8P1平臺,跑通從數據準備、模型
    的頭像 發表于 11-20 18:06 ?2078次閱讀
    RA<b class='flag-5'>8</b>P1部署ai<b class='flag-5'>模型</b>指南:從<b class='flag-5'>訓練</b><b class='flag-5'>模型</b>到部署?|?本周六

    基于DP1323EL的電動車解鎖方案:超高速讀寫,提升電動車一鍵解鎖體驗

    發展,一鍵解鎖方案應運而生。其中,手機APP藍牙解鎖和NFC刷卡解鎖作為兩大主流方式,不僅實現了無鑰匙操作,還提升了車輛的安全性和智能化水平。 1.方案介紹 藍牙
    的頭像 發表于 11-10 18:06 ?1359次閱讀

    基于DP1323EL的電動車解鎖方案:超高速讀寫,提升電動車一鍵解鎖體驗

    及各類非接觸式應用設備。 電動車一鍵解鎖方案通過“手機APP藍牙 + 刷卡”雙模設計,不僅讓用戶在不同場景下都能便捷、安全地開鎖,同時大幅提升了整車的智能化體驗。藍牙模塊提供遠程管理與身份認證能力
    發表于 11-10 17:45

    在Ubuntu20.04系統中訓練神經網絡模型些經驗

    本帖欲分享在Ubuntu20.04系統中訓練神經網絡模型些經驗。我們采用jupyter notebook作為開發IDE,以TensorFlow2
    發表于 10-22 07:03

    借助NVIDIA Megatron-Core大模型訓練框架提高顯存使用效率

    隨著模型規模邁入百億、千億甚至萬億參數級別,如何在有限顯存中“塞下”訓練任務,對研發和運維團隊都是巨大挑戰。NVIDIA Megatron-Core 作為流行的大模型
    的頭像 發表于 10-21 10:55 ?1146次閱讀
    借助NVIDIA Megatron-Core大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>框架提高<b class='flag-5'>顯存</b>使用效率

    代超大模型訓練引擎XTuner V1開源

    9月8日,上海人工智能實驗室(上海AI實驗室)開源書生大模型訓練引擎XTuner V1。
    的頭像 發表于 09-10 10:55 ?1134次閱讀

    模型推理顯存和計算量估計方法研究

    隨著人工智能技術的飛速發展,深度學習大模型在各個領域得到了廣泛應用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應用帶來了挑戰。為了解決這問題,本文將探討大
    發表于 07-03 19:43

    群暉發布AI模型全流程存儲解決方案,破局訓練效率與數據孤島難題

    兼容數據歸集、高速訓練、高可用部署全場景,支持?Llama2?等千億參數模型,讀寫效率提升?90% 上海?2025年6月24日?/美通社/ -- 當算力狂奔時,數據存儲正成為AI進化的新瓶頸。 據
    的頭像 發表于 06-25 16:03 ?696次閱讀
    群暉發布AI<b class='flag-5'>模型</b>全流程存儲解決方案,破局<b class='flag-5'>訓練</b>效率與數據孤島難題

    使用 NPU 插件對量化的 Llama 3.1 8b 模型進行推理時出現“從 __Int64 轉換為無符號 int 的錯誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    發表于 06-25 07:20

    一鍵下單+低至0元打板!華秋DFM帶你解鎖PCB制造新姿勢

    親愛的工程師小伙伴們,你們是否還在為 PCB設計隱患而頭禿 ?是否還在為 打樣成本而肉疼 ? 看我!華秋DFM軟件不僅幫你 一鍵掃雷設計問題 ,還能讓你 躺贏多重優惠 ~ 想要 輕松設計檢查+快樂薅
    發表于 06-04 14:46

    U盤一鍵制作

    在電腦維修中啟動盤很重要,靠譜的u盤一鍵啟動制作方法
    發表于 05-06 16:10 ?44次下載

    請問如何在imx8mplus上部署和運行YOLOv5訓練模型

    我正在從事 imx8mplus yocto 項目。我已經在自定義數據集上的 YOLOv5 上訓練了對象檢測模型。它在 ubuntu 電腦上運行良好。現在我想在我的 imx8mplus
    發表于 03-25 07:23

    企業級Claude API應用方案!完整調用攻略來襲:帶你解鎖Claude 3.5/3.7大模型

    企業級Claude API大模型應用開發,完整調用攻略來襲,帶你解鎖Claude 3.5/3.7大模型,滿足企業級生產!無需魔法,無需外幣充值,無需擔心封號問題
    的頭像 發表于 03-19 19:55 ?1997次閱讀
    企業級Claude API應用方案!完整調用攻略來襲:<b class='flag-5'>帶你</b><b class='flag-5'>解鎖</b>Claude 3.5/3.7大<b class='flag-5'>模型</b>