国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布源2.0基礎(chǔ)大模型,千億參數(shù)全面開源

全球TMT ? 來(lái)源:全球TMT ? 作者:全球TMT ? 2023-11-28 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

11月27日,浪潮信息發(fā)布"源2.0"基礎(chǔ)大模型,并宣布全面開源。源2.0基礎(chǔ)大模型包括1026億、518億、21億等三種參數(shù)規(guī)模的模型,在編程、推理、邏輯等方面展示出了先進(jìn)的能力。

當(dāng)前,大模型技術(shù)正在推動(dòng)生成式人工智能產(chǎn)業(yè)迅猛發(fā)展,而基礎(chǔ)大模型的關(guān)鍵能力則是大模型在行業(yè)和應(yīng)用落地能力表現(xiàn)的核心支撐,但基礎(chǔ)大模型的發(fā)展也面臨著在算法、數(shù)據(jù)和算力等方面的諸多挑戰(zhàn)。源2.0基礎(chǔ)大模型則針對(duì)性地提出了新的改進(jìn)方法并獲得了能力的提升。

算法方面,源2.0提出并采用了一種新型的注意力算法結(jié)構(gòu):局部注意力過(guò)濾增強(qiáng)機(jī)制(LFA:Localized Filtering-based Attention)。LFA通過(guò)先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性,然后再計(jì)算全局關(guān)聯(lián)性的方法,能夠更好地學(xué)習(xí)到自然語(yǔ)言的局部和全局的語(yǔ)言特征,對(duì)于自然語(yǔ)言的關(guān)聯(lián)語(yǔ)義理解更準(zhǔn)確、更人性,提升了模型的自然語(yǔ)言表達(dá)能力,進(jìn)而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


數(shù)據(jù)方面,源2.0通過(guò)使用中英文書籍、百科、論文等高質(zhì)量中英文資料,降低了互聯(lián)網(wǎng)語(yǔ)料內(nèi)容占比,結(jié)合高效的數(shù)據(jù)清洗流程,為大模型訓(xùn)練提供了高質(zhì)量的專業(yè)數(shù)據(jù)集和邏輯推理數(shù)據(jù)集。為了獲取中文數(shù)學(xué)數(shù)據(jù),我們清洗了從2018年至今約12PB的互聯(lián)網(wǎng)數(shù)據(jù),但僅獲取到了約10GB的數(shù)學(xué)數(shù)據(jù),投入巨大,收益較小。為了更高效地獲得相對(duì)匱乏的高質(zhì)量中文數(shù)學(xué)及代碼數(shù)據(jù)集,源2.0采用了基于大模型的數(shù)據(jù)生產(chǎn)及過(guò)濾方法,在保證數(shù)據(jù)的多樣性的同時(shí)也在每一個(gè)類別上提升數(shù)據(jù)質(zhì)量,獲取了一批高質(zhì)量的數(shù)學(xué)與代碼預(yù)訓(xùn)練數(shù)據(jù)。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均勻流水并行的方法,綜合運(yùn)用流水線并行+優(yōu)化器參數(shù)并行+數(shù)據(jù)并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現(xiàn)顯存瓶頸導(dǎo)致的訓(xùn)練效率降低的問(wèn)題,該方法顯著降低了大模型對(duì)芯片間P2P帶寬的需求,為硬件差異較大訓(xùn)練環(huán)境提供了一種高性能的訓(xùn)練方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作為千億級(jí)基礎(chǔ)大模型,在業(yè)界公開的評(píng)測(cè)上進(jìn)行了代碼生成、數(shù)學(xué)問(wèn)題求解、事實(shí)問(wèn)答方面的能力測(cè)試,測(cè)試結(jié)果顯示,源2.0在多項(xiàng)模型評(píng)測(cè)中,展示出了較為先進(jìn)的能力表現(xiàn)。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面開源策略,全系列模型參數(shù)和代碼均可免費(fèi)下載使用。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    339

    文章

    30774

    瀏覽量

    264460
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    476

    瀏覽量

    25427
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3659

    瀏覽量

    5196
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度正式發(fā)布開源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文
    的頭像 發(fā)表于 01-30 10:03 ?628次閱讀
    百度正式<b class='flag-5'>發(fā)布</b>并<b class='flag-5'>開源</b>新一代文檔解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    今日看點(diǎn):小米正式發(fā)布開源模型 MiMo-V2-Flash;磷酸鐵鋰開啟漲價(jià)潮

    小米正式發(fā)布開源模型 MiMo-V2-Flash 近日小米正式發(fā)布開源模型 MiMo-V
    的頭像 發(fā)表于 12-17 09:42 ?4295次閱讀

    商湯科技正式發(fā)布開源全新多模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布開源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新多模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova 多模態(tài)模型奠定了新一代架構(gòu)的基石。
    的頭像 發(fā)表于 12-08 11:19 ?1027次閱讀
    商湯科技正式<b class='flag-5'>發(fā)布</b>并<b class='flag-5'>開源</b>全新多模態(tài)<b class='flag-5'>模型</b>架構(gòu)NEO

    成都匯陽(yáng)投資關(guān)于大模型白熱化,應(yīng)用加速分化

    Gemini 2.5 Flash Image登頂 多主流圖像榜,Meta 也從 Midjourney 授權(quán) AI 圖像模型;視頻領(lǐng)域,阿里字節(jié)等刷新能力高度 ,谷歌將視頻模型推進(jìn)至實(shí)時(shí)交互通用世界模型階段。 ? ? ? ?De
    的頭像 發(fā)表于 09-09 09:30 ?933次閱讀

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬(wàn)億參數(shù)模型創(chuàng)新設(shè)計(jì)

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬(wàn)億參數(shù)模型的超節(jié)點(diǎn)AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)
    的頭像 發(fā)表于 08-08 22:17 ?690次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬(wàn)億<b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權(quán)重語(yǔ)言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了一個(gè)開放模型
    的頭像 發(fā)表于 08-06 14:25 ?1035次閱讀

    萬(wàn)億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布元腦企智一體機(jī)已率先完成對(duì)Kimi K2 萬(wàn)億參數(shù)模型的適配支持,并實(shí)現(xiàn)單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署
    的頭像 發(fā)表于 07-22 09:27 ?568次閱讀
    萬(wàn)億<b class='flag-5'>參數(shù)</b>!元腦企智一體機(jī)率先支持Kimi K2大<b class='flag-5'>模型</b>

    【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語(yǔ)言模型部署

    , Gemma等開源模型。當(dāng)然,一些閉的(類似chatgpt, gemini)是不支持部署的。如下圖: 在端側(cè)部署大模型,個(gè)人認(rèn)為最大的好處:是可以避免因文本或圖片上傳而造成的
    發(fā)表于 07-19 15:45

    飛利信與浪潮信息達(dá)成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達(dá)成簽約,其中將面向北京人工智能應(yīng)用大市場(chǎng),在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場(chǎng)景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?1117次閱讀

    上新:小米首個(gè)推理大模型開源 馬斯克:下周推出Grok 3.5

    開源新一代通義千問(wèn)模型Qwen3。據(jù)悉,Qwen3模型參數(shù)量?jī)H為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、
    的頭像 發(fā)表于 04-30 16:08 ?1347次閱讀

    ShiMeta信息發(fā)布軟件接入DeepSeek大模型,AI助理正式上線——您的智能信發(fā)顧問(wèn)!

    在數(shù)字化轉(zhuǎn)型浪潮中,企業(yè)信息發(fā)布的高效性、精準(zhǔn)性與智能化已成為提升競(jìng)爭(zhēng)力的核心要素。為滿足用戶對(duì)智能化內(nèi)容管理的迫切需求,ShiMeta信息發(fā)布
    的頭像 發(fā)表于 04-15 17:11 ?2182次閱讀
    ShiMeta<b class='flag-5'>信息</b><b class='flag-5'>發(fā)布</b>軟件接入DeepSeek大<b class='flag-5'>模型</b>,AI助理正式上線——您的智能信發(fā)顧問(wèn)!

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    時(shí)間。 這不僅僅是工具的升級(jí),更是邁向智能體化用戶體驗(yàn)的關(guān)鍵基礎(chǔ)設(shè)施。 天璣AI開發(fā)套件 2.0全面釋放天璣端側(cè)AI能力 去年,天璣AI開發(fā)套件一經(jīng)發(fā)布就廣受開發(fā)者好評(píng)和推薦。在MDDC 2025上
    發(fā)表于 04-13 19:52

    筑基&quot;AI+人才&quot;培養(yǎng),浪潮信息攜手元腦伙伴拓爾思推出智慧教育新平臺(tái)

    北京2025年3月22日?/美通社/ -- 近期,元腦生態(tài)伙伴拓爾思信息技術(shù)股份有限公司(以下簡(jiǎn)稱:拓爾思)攜手浪潮信息,聯(lián)合為高校AI人才培養(yǎng)推出"AI創(chuàng)新培養(yǎng)綜合服務(wù)平臺(tái)",基于該平臺(tái)實(shí)現(xiàn)實(shí)訓(xùn)
    的頭像 發(fā)表于 03-27 16:56 ?832次閱讀
    筑基&quot;AI+人才&quot;培養(yǎng),<b class='flag-5'>浪潮信息</b>攜手元腦伙伴拓爾思推出智慧教育新平臺(tái)

    天瞳威視與浪潮信息達(dá)成戰(zhàn)略合作,推進(jìn)高階智駕車載計(jì)算系統(tǒng)創(chuàng)新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達(dá)成戰(zhàn)略合作協(xié)議。此次合作依托浪潮信息提供的車載算力平臺(tái)硬件系統(tǒng)、底層軟件環(huán)境
    的頭像 發(fā)表于 03-27 16:55 ?648次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達(dá)成戰(zhàn)略合作,推進(jìn)高階智駕車載計(jì)算系統(tǒng)創(chuàng)新

    浪潮軟件率先推出政務(wù)服務(wù)大模型,重塑全場(chǎng)景應(yīng)用

    濟(jì)南2025年3月12日?/美通社/ -- DeepSeek爆火加速了政務(wù)服務(wù)行業(yè)全面擁抱AI的步伐,全國(guó)各地紛紛加速推進(jìn)大模型在政務(wù)服務(wù)領(lǐng)域的探索與創(chuàng)新。作為數(shù)字政府領(lǐng)域的領(lǐng)導(dǎo)者企業(yè),浪潮軟件憑借
    的頭像 發(fā)表于 03-14 18:18 ?866次閱讀
    <b class='flag-5'>浪潮</b>軟件率先推出政務(wù)服務(wù)大<b class='flag-5'>模型</b>,重塑全場(chǎng)景應(yīng)用