国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

悟道·天鷹 Aquila + 天秤 FlagEval,打造大模型能力與評測標(biāo)準(zhǔn)雙標(biāo)桿

硬科技星球 ? 來源:硬科技星球 ? 作者:硬科技星球 ? 2023-06-27 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為推動大模型在產(chǎn)業(yè)落地和技術(shù)創(chuàng)新,智源研究院發(fā)布“開源商用許可語言大模型系列+開放評測平臺” 2 大重磅成果,打造“大模型進(jìn)化流水線”,持續(xù)迭代、持續(xù)開源開放。

01

悟道·天鷹(Aquila)

開源商用許可語言大模型系列

悟道·天鷹(Aquila) 語言大模型是首個具備中英雙語知識、支持商用許可協(xié)議、國內(nèi)數(shù)據(jù)合規(guī)需求的開源語言大模型。

悟道·天鷹(Aquila)語言大模型在中英文高質(zhì)量語料基礎(chǔ)上從 0 開始訓(xùn)練,通過數(shù)據(jù)質(zhì)量的控制、多種訓(xùn)練的優(yōu)化方法,實(shí)現(xiàn)在更小的數(shù)據(jù)集、更短的訓(xùn)練時間,獲得比其它開源模型更優(yōu)的性能。系列模型包括 Aquila基礎(chǔ)模型(7B、33B),AquilaChat對話模型(7B、33B)以及 AquilaCode-7B “文本-代碼”生成模型,

后續(xù)將持續(xù)更新迭代并開源更新版本。

開源地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila

Aquila基礎(chǔ)模型(7B、33B)

在技術(shù)上繼承了 GPT-3、LLaMA 等的架構(gòu)設(shè)計優(yōu)點(diǎn),替換了一批更高效的底層算子實(shí)現(xiàn)、重新設(shè)計實(shí)現(xiàn)了中英雙語的 tokenizer,升級了 BMTrain 并行訓(xùn)練方法,實(shí)現(xiàn)了比 Magtron+DeepSpeed ZeRO-2

將近8倍的訓(xùn)練效率

AquilaChat 對話模型(7B、33B)

支持流暢的文本對話及多種語言類生成任務(wù),通過定義可擴(kuò)展的特殊指令規(guī)范,實(shí)現(xiàn) AquilaChat對其它模型和工具的調(diào)用,且易于擴(kuò)展。例如,調(diào)用智源開源的 AltDiffusion 多語言文圖生成模型,實(shí)現(xiàn)了流暢的文圖生成能力。配合智源 InstructFace 多步可控文生圖模型,輕松實(shí)現(xiàn)對人臉圖像的多步可控編輯。

AquilaChat 訓(xùn)練過程中,實(shí)現(xiàn)了模型能力與指令微調(diào)數(shù)據(jù)的循環(huán)迭代,包括數(shù)據(jù)集的高效篩選與優(yōu)化,充分挖掘基礎(chǔ)模型的潛力。

AquilaChat 支持可擴(kuò)展的特殊指令規(guī)范,令用戶可在AquilaChat中輕松實(shí)現(xiàn)多任務(wù)、工具的嵌入,如文圖生成,下圖示例為在對話中調(diào)用智源開源的多語言文圖生成模型 AltDiffusion。

AquilaChat 具備強(qiáng)大的指令分解能力,配合智源InstructFace多步可控文生圖模型,輕松實(shí)現(xiàn)對圖片的多步可控編輯。

AquilaCode-7B “文本-代碼”生成模型,

基于 Aquila-7B 強(qiáng)大的基礎(chǔ)模型能力,以小數(shù)據(jù)集、小參數(shù)量,實(shí)現(xiàn)高性能,是目前支持中英雙語的、性能最好的開源代碼模型,經(jīng)過了高質(zhì)量過濾、使用有合規(guī)開源許可的訓(xùn)練代碼數(shù)據(jù)進(jìn)行訓(xùn)練。

此外,AquilaCode-7B 分別在英偉達(dá)和***上完成了代碼模型的訓(xùn)練,并通過對多種架構(gòu)的代碼+模型開源,推動芯片創(chuàng)新和百花齊放。

02

天秤(FlagEval)

大模型評測體系及開放平臺

天秤(FlagEval)大模型評測體系及開放平臺,旨在建立科學(xué)、公正、開放的評測基準(zhǔn)、方法、工具集,協(xié)助研究人員全方位評估基礎(chǔ)模型及訓(xùn)練算法的性能,同時探索利用AI方法實(shí)現(xiàn)對主觀評測的輔助,大幅提升評測的效率和客觀性。

目前已推出語言大模型評測、多國語言文圖大模型評測及文圖生成評測等工具,并對各種語言基礎(chǔ)模型、跨模態(tài)基礎(chǔ)模型實(shí)現(xiàn)評測。后續(xù)將全面覆蓋基礎(chǔ)模型、預(yù)訓(xùn)練算法、微調(diào)算法等三大評測對象,包括自然語言處理(NLP)、計算機(jī)視覺(CV)、語音(Audio)及多模態(tài)(Multimodal)等四大評測場景和豐富的下游任務(wù)。

首期推出的 FlagEval 大語言模型評測體系,創(chuàng)新構(gòu)建了“能力-任務(wù)-指標(biāo)”三維評測框架,細(xì)粒度刻畫基礎(chǔ)模型的認(rèn)知能力邊界,可視化呈現(xiàn)評測結(jié)果,總計 600+ 評測維度,任務(wù)維度包括 22 個主觀&客觀評測數(shù)據(jù)集。除了知名的公開數(shù)據(jù)集 HellaSwag、MMLU、C-Eval等,F(xiàn)lagEval 還集成了包括智源自建的主觀評測數(shù)據(jù)集 Chinese Linguistics & Cognition Challenge (CLCC) ,北京大學(xué)與閩江學(xué)院共建的語義關(guān)系判斷、多義詞理解、修辭手法判斷評測數(shù)據(jù)集。更多維度的評測數(shù)據(jù)集也在陸續(xù)集成中。

FlagEval 評測榜單目前涵蓋了前面談到的22 個主觀和客觀評測集,84433 道題目,細(xì)粒度刻畫大模型的認(rèn)知能力。基于“悟道 · 天鷹”Aquila 基礎(chǔ)模型(7B)打造的 AquilaChat 對話模型,在 FlagEval 大語言模型評測榜單上,目前暫時在“主觀+客觀”的評測上領(lǐng)先其他同參數(shù)量級別的開源對話模型。

在我們當(dāng)前的最新評測結(jié)果中,AquilaChat 以大約相當(dāng)于其他模型 50% 的訓(xùn)練數(shù)據(jù)量(SFT 數(shù)據(jù)+預(yù)訓(xùn)練數(shù)據(jù)分別統(tǒng)計)達(dá)到了最優(yōu)性能。

但由于當(dāng)前的英文數(shù)據(jù)僅訓(xùn)練了相當(dāng)于Alpaca的40%,所以在英文的客觀評測上還暫時落后于基于 LLaMA 進(jìn)行指令微調(diào)的Alpaca。隨著后續(xù)訓(xùn)練的進(jìn)行,我們相信很快可以超越。

悟道·天鷹(Aquila)模型還在迭代進(jìn)步的過程中,天秤(FlagEval)評測能力也在不斷的擴(kuò)充中,因而此評測結(jié)果只是暫時的,新的評測結(jié)果還會不斷更新。此外,F(xiàn)lagEval的評測體系方法及相關(guān)研究還需要繼續(xù)深入,當(dāng)前對模型能力的覆蓋程度仍有很大的進(jìn)步空間,智源也期待與多方合作,共同打造全面、科學(xué)的評測方法體系。

天秤(FlagEval)開放評測平臺現(xiàn)已開放申請(flageval.baai.ac.cn),打造自動化評測與自適應(yīng)評測機(jī)制,可輔助模型研發(fā)團(tuán)隊(duì)利用評測結(jié)果指導(dǎo)模型訓(xùn)練,同時支持英偉達(dá)、昇騰(鵬城云腦)、寒武紀(jì)、昆侖芯等多種芯片架構(gòu)及 PyTorch、MindSpore 等多種深度學(xué)習(xí)框架。

作為“科技創(chuàng)新2030”旗艦項(xiàng)目重要課題,天秤(FlagEval)正與北京大學(xué)、北京航空航天大學(xué)、北京師范大學(xué)、北京郵電大學(xué)、閩江學(xué)院、南開大學(xué)、中國電子技術(shù)標(biāo)準(zhǔn)化研究院、中國科學(xué)院自動化研究所等合作單位共建(按首字母排序),定期發(fā)布權(quán)威評測榜單。

總的來說,智源此次發(fā)布的 2 大重磅成果僅僅是一個新的起點(diǎn):

一方面,悟道 · 天鷹 Aquila 語言大模型將不斷完善訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練方法、提升模型性能,在更優(yōu)秀的基礎(chǔ)模型基座上,培育枝繁葉茂的“模型樹”,持續(xù)開源開放。

另一方面,天秤 FlagEval 大模型評測體系及開放平臺將繼續(xù)拓展“大模型認(rèn)知能力”框架,集成豐富的數(shù)據(jù)集與評測指標(biāo),并探索與心理學(xué)、教育學(xué)、倫理學(xué)等社會學(xué)科的交叉研究,以期更加科學(xué)、全面地評價語言大模型。

「模型 + 評測」雙輪驅(qū)動,

加速大模型技術(shù)創(chuàng)新與產(chǎn)業(yè)落地。歡迎學(xué)界、產(chǎn)業(yè)界同仁提供建議。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5184
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    登臨科技與合作伙伴打造AI+油氣工程融合創(chuàng)新標(biāo)桿

    在油氣工程領(lǐng)域向深層、高難、智能轉(zhuǎn)型的關(guān)鍵階段,登臨科技以核心技術(shù)為支撐,與合作伙伴“強(qiáng)強(qiáng)聯(lián)合”,打造“AI+油氣工程”融合創(chuàng)新標(biāo)桿,推動鉆井、地質(zhì)、井控等關(guān)鍵環(huán)節(jié)從“經(jīng)驗(yàn)驅(qū)動”向“智能決策”躍遷,大力推進(jìn)工程數(shù)智化,力爭在行業(yè)新一輪變局中贏得先機(jī)。
    的頭像 發(fā)表于 03-02 14:36 ?286次閱讀

    云知聲山海醫(yī)療大模型問鼎MedBench4.0三項(xiàng)榜首

    12月16日,中文醫(yī)療大模型權(quán)威評測平臺MedBench4.0發(fā)布最新評測結(jié)果。云知聲自主研發(fā)的“山海醫(yī)療大模型(UniGPT?Med)”展現(xiàn)出全面領(lǐng)先的技術(shù)實(shí)力,一舉斬獲醫(yī)療智能體、
    的頭像 發(fā)表于 12-29 14:35 ?3206次閱讀
    云知聲山海醫(yī)療大<b class='flag-5'>模型</b>問鼎MedBench4.0三項(xiàng)榜首

    自動駕駛大模型中常提的泛化能力是指啥?

    ”這個詞看起來比較抽象,也更容易被模糊使用。 它沒有直觀的評價標(biāo)準(zhǔn),卻決定了模型能不能真正走出訓(xùn)練數(shù)據(jù)、應(yīng)對真實(shí)道路中的未知情況。理解清楚它到底指的是什么、為什么難、又該如何評估,是理解自動駕駛大模型
    的頭像 發(fā)表于 12-10 09:15 ?599次閱讀
    自動駕駛大<b class='flag-5'>模型</b>中常提的泛化<b class='flag-5'>能力</b>是指啥?

    華為如何通過大模型技術(shù)打造智能IP網(wǎng)絡(luò)

    2025年非洲通信展在南非開普敦召開,華為數(shù)據(jù)通信產(chǎn)品線NCE數(shù)據(jù)通信領(lǐng)域總裁王輝受邀參加“Telecoms For Tomorrow”論壇,發(fā)表題為“擁抱AI時代,打造面向未來的智能IP網(wǎng)絡(luò)”的演講,分享華為如何通過大模型技術(shù)打造
    的頭像 發(fā)表于 11-14 16:39 ?1466次閱讀

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的頭像 發(fā)表于 09-23 15:19 ?1277次閱讀

    軟通動力攜手金盤科技打造智能制造新標(biāo)桿

    ,軟通動力憑借在AI和智能制造領(lǐng)域的深厚積累,賦能金盤科技構(gòu)建AI平臺及相關(guān)智能體,助力其數(shù)字化工廠向智能制造全面轉(zhuǎn)型并打造智能制造標(biāo)桿企業(yè)。
    的頭像 發(fā)表于 09-09 09:41 ?814次閱讀

    華為攜手中國地質(zhì)大學(xué)武漢校區(qū)打造智慧校園新標(biāo)桿

    新學(xué)期伊始,中國地質(zhì)大學(xué)(武漢)校園內(nèi)洋溢著青春的活力與喜悅,數(shù)千名新生懷揣夢想在此開啟人生新篇章。與往年相比,今年的迎新現(xiàn)場不僅秩序井然,更透露出濃濃的“智慧”氣息——流暢高效的網(wǎng)絡(luò)體驗(yàn)、精準(zhǔn)智能的運(yùn)維保障。這成為學(xué)校積極響應(yīng)國家“人工智能+”行動與教育數(shù)字化戰(zhàn)略,打造智慧校園
    的頭像 發(fā)表于 09-05 11:07 ?1250次閱讀

    伺服電機(jī)驅(qū)動的鉆床齒隙模型仿真分析

    的電樞電壓,是大齒輪的角速度,是大齒輪的轉(zhuǎn)動慣量。 純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:伺服電機(jī)驅(qū)動的鉆床齒隙模型仿真分析.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 06-18 16:26

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享一個好消息,百度智能云已牽手65%的央企,共同推進(jìn)大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,百度聯(lián)合眾多央國企伙伴,針對各類不同業(yè)務(wù)場景,打造了一大批可推廣、可復(fù)制的標(biāo)桿
    的頭像 發(fā)表于 06-11 15:44 ?894次閱讀

    云知聲再度登頂MedBench榜單

    近日,中文醫(yī)療大模型權(quán)威評測平臺MedBench公布最新自測榜單結(jié)果,云知聲基于山海大模型打造的醫(yī)療行業(yè)專用大模型(UniGPT-Med-U
    的頭像 發(fā)表于 05-20 10:12 ?804次閱讀

    華為助力湖北移動打造“九州”算力互聯(lián)網(wǎng)區(qū)域標(biāo)桿

    地”的使命,基于AI集群路由器,成功打造“九州”算力互聯(lián)網(wǎng)區(qū)域標(biāo)桿,實(shí)現(xiàn)了網(wǎng)絡(luò)架構(gòu)的智能化升級,顯著提升算力連接、算力調(diào)度、算力保障等關(guān)鍵能力,為智能制造、智慧城市、智慧家庭等提供數(shù)智化支撐,推動實(shí)體經(jīng)濟(jì)和新質(zhì)生產(chǎn)力的發(fā)展,為湖
    的頭像 發(fā)表于 05-13 16:11 ?870次閱讀

    深蘭科技醫(yī)療大模型榮獲MedBench評測第一

    近日,國內(nèi)權(quán)威醫(yī)療大模型評測平臺MedBench在官網(wǎng)更新了榜單,多個知名醫(yī)療AI產(chǎn)品及研究團(tuán)隊(duì)入榜,其中深蘭DeepBlue-MR-v1醫(yī)療大模型以復(fù)雜醫(yī)學(xué)推理評測第一的成績領(lǐng)跑Me
    的頭像 發(fā)表于 04-30 16:08 ?897次閱讀

    芯盾時代助力打造智慧醫(yī)療安全新標(biāo)桿

    芯盾時代中標(biāo)?安徽醫(yī)科大學(xué)第二附屬醫(yī)院(以下簡稱“安醫(yī)二附院”)!芯盾時代基于零信任安全理念,融合動態(tài)身份驗(yàn)證、智能風(fēng)險感知與策略執(zhí)行能力,將為安醫(yī)二附院構(gòu)建動態(tài)化、智能化的零信任安全防護(hù)體系,助力其打造智慧醫(yī)療安全新標(biāo)桿。?
    的頭像 發(fā)表于 04-02 17:18 ?1139次閱讀

    云知聲深度參與三項(xiàng)大模型國家標(biāo)準(zhǔn)編寫

    》、20231746-T-469《人工智能 大模型第2部分:評測指標(biāo)與方法》以及20231741-T-469《人工智能大模型 第3部分:服務(wù)能力成熟度評估》正式批準(zhǔn)發(fā)布。
    的頭像 發(fā)表于 03-18 18:19 ?927次閱讀

    商湯“日日新”融合大模型登頂大語言與多模態(tài)榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結(jié)果顯示:在語言和多模態(tài)核心能力測評中,商湯“日日新”融合大模型
    的頭像 發(fā)表于 03-18 10:35 ?1144次閱讀