国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

低成本開源聊天機器人Vicuna:可達到ChatGPT/Bard 90%以上水平

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-04-06 11:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大型語言模型 (LLM) 的快速發(fā)展徹底改變了聊天機器人系統(tǒng),從而實現(xiàn)了前所未有的智能水平,譬如 OpenAI 的 ChatGPT。但 ChatGPT 的訓練和架構細節(jié)仍不清楚,阻礙了該領域的研究和開源創(chuàng)新。受 Meta LLaMA 和 Stanford Alpaca 項目的啟發(fā),來自加州大學伯克利分校、CMU、斯坦福大學和加州大學圣地亞哥分校的成員,共同推出了一個 Vicuna-13B 開源聊天機器人,由增強的數(shù)據(jù)集和易于使用、可擴展的基礎設施支持。

根據(jù)介紹,通過根據(jù)從 ShareGPT.com (一個用戶可以分享他們的 ChatGPT 對話的網(wǎng)站) 收集的用戶共享對話微調(diào) LLaMA 基礎模型,Vicuna-13B 與 Stanford Alpaca 等其他開源模型相比展示了具有競爭力的性能。

以 GPT-4 為評判標準的初步評估顯示,Vicuna-13B 達到了 OpenAI ChatGPT 和 Google Bard 90% 以上的質(zhì)量,同時在 90% 以上的情況下超過了 LLaMA 和 Stanford Alpaca 等其他模型的表現(xiàn)。訓練 Vicuna-13B 成本約為 300 美元。訓練和服務代碼,以及在線演示都是公開的,可用于非商業(yè)用途。

f66c4af6-d40b-11ed-bfe3-dac502259ad0.png

為了確保數(shù)據(jù)質(zhì)量,Vicuna 團隊將 HTML 轉換回 markdown 并過濾掉一些不合適或低質(zhì)量的樣本。以及將冗長的對話分成更小的部分,以適應模型的最大上下文長度。其訓練方法建立在 Stanford Alpaca 的基礎上,并進行了以下改進:

內(nèi)存優(yōu)化:為了使 Vicuna 能夠理解長上下文,開發(fā)團隊將最大上下文長度從 Alpaca 中的 512 擴展到 2048,大大增加了 GPU 內(nèi)存需求。通過利用 utilizing gradient checkpointing 和 flash attention 來解決內(nèi)存壓力。

多輪對話:調(diào)整訓練損失以考慮多輪對話,并僅根據(jù)聊天機器人的輸出計算微調(diào)損失。

通過 Spot 實例降低成本:40 倍大的數(shù)據(jù)集和 4 倍的訓練序列長度對訓練費用提出了相當大的挑戰(zhàn)。Vicuna 團隊使用 SkyPilot managed spot 來降低成本,方法是利用更便宜的 spot 實例以及自動恢復搶占和自動區(qū)域切換。該解決方案將 7B 模型的訓練成本從 500 美元削減至 140 美元左右,將 13B 模型的訓練成本從 1000 美元左右削減至 300 美元。

Vicuna 團隊構建了一個服務系統(tǒng),該系統(tǒng)能夠使用分布式 workers 為多個模型提供服務;它支持來自本地集群和云的 GPU worker 的靈活插件。通過利用 SkyPilot 中的容錯控制器和 managed spot 功能,該服務系統(tǒng)可以很好地與來自多個云的更便宜的 spot 實例一起工作,以降低服務成本。它目前是一個輕量級的實現(xiàn),未來將努力將集成更多的最新研究成果。

具體來說,開發(fā)團隊首先從 ShareGPT.com 收集了大約 7 萬個對話,然后增強了 Alpaca 提供的訓練腳本,以更好地處理多輪對話和長序列;訓練在一天內(nèi)在 8 個 A100 GPU 上使用 PyTorch FSDP 完成。為了提供演示服務,他們還實現(xiàn)了一個輕量級的分布式服務系統(tǒng)。通過創(chuàng)建一組 80 個不同的問題并利用 GPT-4 來判斷模型輸出,對模型質(zhì)量進行了初步評估。為了比較兩個不同的模型,團隊成員將每個模型的輸出組合成每個問題的單個提示。然后將提示發(fā)送到 GPT-4,GPT-4 評估哪個模型提供更好的響應。

f6b1275c-d40b-11ed-bfe3-dac502259ad0.png

LLaMA、Alpaca、ChatGPT 和 Vicuna 的詳細對比如下:

f6e820cc-d40b-11ed-bfe3-dac502259ad0.png

Vicun 團隊展示了 Alpaca 和 Vicuna 對基準問題的回答示例。在使用 70K 用戶共享的 ChatGPT 對話對 Vicuna 進行微調(diào)后,其發(fā)現(xiàn)與 Alpaca 相比,Vicuna 能夠生成更詳細、結構更合理的答案,并且質(zhì)量與 ChatGPT 相當。

例如,在要求 “撰寫一篇引人入勝的旅游博文,介紹最近的夏威夷之行,突出文化體驗和必去的景點” 時,GPT-4 的評價得分為:Alpaca-13b 7/10,Vicuna-13b 10/10。并闡述理由稱,Alpaca 提供了旅行博文的簡要概述,但沒有按照要求實際撰寫博文,導致得分較低。Vicuna-13b 則就最近的夏威夷之行撰寫了一篇詳細而有吸引力的旅游博文,強調(diào)了文化體驗和必看的景點,完全滿足了用戶的要求,因此獲得了較高的分數(shù)。

與此同時,Vicun 的初步發(fā)現(xiàn)表明,在比較聊天機器人的答案時,GPT-4 可以產(chǎn)生高度一致的等級和詳細的評估。下圖中總結的基于 GPT-4 的初步評估顯示,Vicuna 達到了 Bard/ChatGPT 的 90% 能力。不過總的來說,為聊天機器人建立一個評估系統(tǒng)仍是一個需要進一步研究的開放式問題。

f70dc6ce-d40b-11ed-bfe3-dac502259ad0.png

Vicun 團隊提出了一個基于 GPT-4 的評估框架來自動評估聊天機器人的性能。設計了八個問題類別,以測試聊天機器人性能的各個方面。并基于每個類別選擇十個問題,分別由 LLaMA、Alpaca、ChatGPT、Bard 和 Vicuna 生成答案,然后要求 GPT-4 根據(jù)有用性、相關性、準確性和細節(jié)來評估答案質(zhì)量。結果發(fā)現(xiàn) GPT-4 不僅可以產(chǎn)生相對一致的分數(shù),而且可以詳細解釋為什么給出這樣的分數(shù)(詳細示例鏈接)。但在判斷編碼 / 數(shù)學任務方面,GPT-4 則不太擅長。

f7292e00-d40b-11ed-bfe3-dac502259ad0.png

數(shù)據(jù)表明在超過 90% 的問題中,相較 LLaMA、Alpaca 等,GPT-4 更傾向 Vicuna 生成的答案,并且它實現(xiàn)了可與專有模型(ChatGPT、Bard)競爭的性能。在 45% 的問題中,GPT-4 將 Vicuna 的回答評為優(yōu)于或等于 ChatGPT 的回答。

f764593a-d40b-11ed-bfe3-dac502259ad0.png

總的來說,雖然最近行業(yè)發(fā)展如火如荼,但事實上聊天機器人仍然面臨局限性,例如難以解決基本的數(shù)學問題或編碼能力有限。且為聊天機器人開發(fā)一個全面、標準化的評估系統(tǒng),也是一個需要進一步研究的懸而未決的問題。

開發(fā)團隊承認,Vicuna 不擅長涉及推理或數(shù)學的任務,并且在準確識別自己或確保其輸出的事實準確性方面可能存在局限性。此外,它還沒有得到充分優(yōu)化以保證安全性或減輕潛在的毒性或偏見。為了解決安全問題,他們使用 OpenAI moderation API 來過濾掉在線演示中不適當?shù)挠脩糨斎搿?/p>

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    4203

    瀏覽量

    46125
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26190
  • 聊天機器人
    +關注

    關注

    0

    文章

    348

    瀏覽量

    13089
  • OpenAI
    +關注

    關注

    9

    文章

    1245

    瀏覽量

    10059

原文標題:低成本開源聊天機器人Vicuna:可達到ChatGPT/Bard 90%以上水平

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    資訊速遞 | 具身智能PMC(籌)發(fā)布“零成本開源鴻蒙智能機器人系統(tǒng)

    面向具身智能機器人系統(tǒng)與應用開發(fā),Ubuntu 等操作系統(tǒng)可以用 ROS2 生態(tài)、機器人仿真器、英偉達算力。 然而在國產(chǎn)化方面,開源鴻蒙操作系統(tǒng)缺失 ROS2 支持、缺失與機器人仿真器
    的頭像 發(fā)表于 01-05 16:24 ?403次閱讀
    資訊速遞 | 具身智能PMC(籌)發(fā)布“零<b class='flag-5'>成本</b>”<b class='flag-5'>開源</b>鴻蒙智能<b class='flag-5'>機器人</b>系統(tǒng)

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    更多"、"互動更流暢"是開發(fā)者面臨的核心挑戰(zhàn)。傳統(tǒng)的單一屏幕和有限的視覺輸入已成為提升機器人智能化水平的瓶頸。而瑞芯微RK3576高性能處理器的出現(xiàn)
    發(fā)表于 10-29 16:41

    機器人消息:智元機器人獲富臨精工數(shù)千萬元訂單 越疆發(fā)布二代人形機器人平臺

    機器人數(shù)量2035年將超過200萬臺,2050年將超過3億臺,2050年市場規(guī)模將達1.4萬億~1.7萬億美元,人形機器人的價格成本或將下降七成以上。業(yè)界多認為人形
    的頭像 發(fā)表于 08-11 16:19 ?1368次閱讀

    【EASY EAI Orin Nano開發(fā)板試用體驗】基于RKLLM大模型的聊天機器人

    計劃在EASY EAI Orin Nano開發(fā)板部署QWEN大模型,然后通過部署flask服務將其web化,成為一個web聊天對話機器人,最后再對接語音識別模塊,最終實現(xiàn)一個語音聊天機器人的目標
    發(fā)表于 08-07 16:52

    開源鴻蒙驅動機器人與AI產(chǎn)業(yè)生態(tài)發(fā)展,M-Robots OS正式開源

    7月24日,2025開放原子開源生態(tài)大會——開源鴻蒙助力機器人與人工智能產(chǎn)業(yè)生態(tài)發(fā)展論壇在北京順利舉行,本次分論壇聚焦機器人和人工智能產(chǎn)業(yè)生態(tài)發(fā)展,探討
    的頭像 發(fā)表于 07-26 14:20 ?1128次閱讀
    <b class='flag-5'>開源</b>鴻蒙驅動<b class='flag-5'>機器人</b>與AI產(chǎn)業(yè)生態(tài)發(fā)展,M-Robots OS正式<b class='flag-5'>開源</b>

    工業(yè)機器人的特點

    0.3%的年化生產(chǎn)力提升。因此,發(fā)展工業(yè)機器人推動國內(nèi)自動化水平,提高產(chǎn)出是目前的不二之選。 ** 適用范圍廣** 機器人相對于工人的優(yōu)勢還體現(xiàn)在應用范圍廣。機器人可以運用在危險、惡劣
    發(fā)表于 07-26 11:22

    全國首個開源鴻蒙機器人操作系統(tǒng) M-Robots OS 正式開源

    機器人操作系統(tǒng)M-RobotsOS,推動機器人行業(yè)生態(tài)融合、能力復用、智能協(xié)同。構建機器人共通語言解決產(chǎn)業(yè)協(xié)同難題機器人行業(yè)正面臨兩大關鍵挑戰(zhàn):一方面,傳統(tǒng)通用操
    的頭像 發(fā)表于 07-24 10:56 ?1021次閱讀
    全國首個<b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>機器人</b>操作系統(tǒng) M-Robots OS 正式<b class='flag-5'>開源</b>

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    全球80多個國家和地區(qū)。近日,大象機器人聯(lián)合進迭時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot280RISC-V”,為開發(fā)者打造全新的機器人
    的頭像 發(fā)表于 06-06 16:55 ?1415次閱讀
    大象<b class='flag-5'>機器人</b>攜手進迭時空推出 RISC-V 全棧<b class='flag-5'>開源</b>六軸機械臂產(chǎn)品

    小智 AI 聊天機器人 (XiaoZhi AI Chatbot)

    小智 AI 聊天機器人是一款基于開源硬件的智能對話設備,由開發(fā)者“蝦哥”以 ?MIT 許可證發(fā)布,旨在幫助用戶入門 AI 硬件開發(fā),將大語言模型(LLM)應用于實體設備中。小智 AI 聊天機器人
    的頭像 發(fā)表于 05-30 15:56 ?1.4w次閱讀
    小智 AI <b class='flag-5'>聊天機器人</b> (XiaoZhi AI Chatbot)

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    在人工智能快速發(fā)展的今天,語音機器人逐漸成為人們生活和工作中的得力助手。明遠智睿SSD2351開發(fā)板憑借強大性能與豐富功能,為語音機器人的發(fā)展注入新動力,成為該領域的變革力量。 SSD2351開發(fā)板
    發(fā)表于 05-28 11:36

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR260機器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    全球80多個國家和地區(qū)。 近日,大象機器人聯(lián)合進迭時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的機器人
    發(fā)表于 04-25 17:59

    開源鴻蒙助力人形機器人產(chǎn)業(yè)發(fā)展

    在近日舉辦的全球首個人形機器人半程馬拉松的賽場上,搭載開放原子開源基金會旗下開源鴻蒙操作系統(tǒng)的“夸父”人形機器人以矯健的身姿參賽引發(fā)廣泛關注。
    的頭像 發(fā)表于 04-23 17:35 ?1448次閱讀

    深開鴻推出全國首個基于開源鴻蒙的機器人操作系統(tǒng)

    在智能制造浪潮的推動下,機器人已成為工業(yè)升級的核心驅動力。然而,操作系統(tǒng)作為機器人產(chǎn)業(yè)的“魂”,直接決定了機器人的智能化水平、協(xié)同能力和生態(tài)擴展性。長期以來,
    的頭像 發(fā)表于 04-19 15:07 ?1501次閱讀

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發(fā)

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發(fā)
    的頭像 發(fā)表于 03-20 16:56 ?1710次閱讀