国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為云刷新深度學(xué)習(xí)加速紀(jì)錄

jmiy_worldofai ? 來源:未知 ? 作者:胡薇 ? 2018-12-03 10:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

華為云ModelArts在國際權(quán)威的深度學(xué)習(xí)模型基準(zhǔn)測試平臺斯坦福DAWNBenchmark上取得了當(dāng)前圖像識別訓(xùn)練時間最佳成績,ResNet-50在ImageNet數(shù)據(jù)集上收斂僅用10分28秒,比第二名成績提升近44%。華為自研了分布式通用加速框架MoXing,在應(yīng)用層和TensorFlow、MXNet、PyTorch等框架之間實(shí)現(xiàn)再優(yōu)化。

日前,斯坦福大學(xué)發(fā)布了DAWNBenchmark最新成績,在圖像識別(ResNet50-on-ImageNet,93%以上精度)的總訓(xùn)練時間上,華為云ModelArts排名第一,僅需10分28秒,比第二名提升近44%。

斯坦福大學(xué)DAWNBenchmark圖像識別訓(xùn)練時間最新成績,華為云ModelArts以10分28秒排名第一,超越了fast.ai、谷歌等勁敵。

作為人工智能最重要的基礎(chǔ)技術(shù)之一,近年來深度學(xué)習(xí)逐步延伸到更多的應(yīng)用場景。除了精度,訓(xùn)練時間和成本也是構(gòu)建深度學(xué)習(xí)模型時需要考慮的核心要素。然而,當(dāng)前的深度學(xué)習(xí)基準(zhǔn)往往以衡量精度為主,斯坦福大學(xué)DAWNBench正是在此背景下提出。

斯坦福DAWNBench是衡量端到端深度學(xué)習(xí)模型訓(xùn)練和推理性能的國際權(quán)威基準(zhǔn)測試平臺,提供了一套通用的深度學(xué)習(xí)評價指標(biāo),用于評估不同優(yōu)化策略、模型架構(gòu)、軟件框架、云和硬件上的訓(xùn)練時間、訓(xùn)練成本、推理延遲以及推理成本,吸引了谷歌、亞馬遜AWS、fast.ai等高水平隊(duì)伍參與,相應(yīng)的排名反映了當(dāng)前全球業(yè)界深度學(xué)習(xí)平臺技術(shù)的領(lǐng)先性。

正是在這樣高手云集的基準(zhǔn)測試中,華為云ModelArts第一次參加國際排名,便實(shí)現(xiàn)了更低成本、更快速度的體驗(yàn)。

華為云創(chuàng)造端到端全棧優(yōu)化新紀(jì)錄:128塊GPU,10分鐘訓(xùn)練完ImageNet

為了達(dá)到更高的精度,通常深度學(xué)習(xí)所需數(shù)據(jù)量和模型都很大,訓(xùn)練非常耗時。例如,在計(jì)算機(jī)視覺領(lǐng)域常用的經(jīng)典ImageNet數(shù)據(jù)集(1000個類別,共128萬張圖片)上,用1塊P100 GPU訓(xùn)練一個ResNet-50模型, 耗時需要將近1周。這嚴(yán)重阻礙了深度學(xué)習(xí)應(yīng)用的開發(fā)進(jìn)度。因此,深度學(xué)習(xí)訓(xùn)練加速一直是學(xué)術(shù)界和工業(yè)界所關(guān)注的重要問題,也是深度學(xué)習(xí)應(yīng)用的主要痛點(diǎn)。

曾任Kaggle總裁和首席科學(xué)家的澳大利亞數(shù)據(jù)科學(xué)家和企業(yè)家Jeremy Howard,與其他幾位教授共同組建了AI初創(chuàng)公司fast.ai,專注于深度學(xué)習(xí)加速。他們用128塊V100 GPU,在上述ImageNet數(shù)據(jù)集上訓(xùn)練ResNet-50模型,最短時間為18分鐘。

最近BigGAN、NASNet、BERT等模型的出現(xiàn),預(yù)示著訓(xùn)練更好精度的模型需要更強(qiáng)大的計(jì)算資源。可以預(yù)見,在未來隨著模型的增大、數(shù)據(jù)量的增加,深度學(xué)習(xí)訓(xùn)練加速將變得會更加重要。

只有擁有端到端全棧的優(yōu)化能力,才能使得深度學(xué)習(xí)的訓(xùn)練性能做到極致。

華為云ModelArts功能視圖

華為云ModelArts是一站式的AI開發(fā)平臺,已經(jīng)服務(wù)于華為公司內(nèi)部各大產(chǎn)品線的AI模型開發(fā),幾年下來已經(jīng)積累了跨場景、軟硬協(xié)同、端云一體等多方位的優(yōu)化經(jīng)驗(yàn)。

ModelArts提供了自動學(xué)習(xí)、數(shù)據(jù)管理、開發(fā)管理、訓(xùn)練管理、模型管理、推理服務(wù)管理、市場等多個模塊化的服務(wù),使得不同層級的用戶都能夠很快地開發(fā)出自己的AI模型。

自研分布式通用加速框架MoXing,性能再加速

為什么ModelArts能在圖像識別的訓(xùn)練時間上取得如此優(yōu)異的成績?

答案是“MoXing”。

在模型訓(xùn)練部分,ModelArts通過硬件、軟件和算法協(xié)同優(yōu)化來實(shí)現(xiàn)訓(xùn)練加速。尤其在深度學(xué)習(xí)模型訓(xùn)練方面,華為將分布式加速層抽象出來,形成一套通用框架——MoXing(“模型”的拼音,意味著一切優(yōu)化都圍繞模型展開)。

采用與fast.ai一樣的硬件、模型和訓(xùn)練數(shù)據(jù),ModelArts可將訓(xùn)練時長可縮短到10分鐘,創(chuàng)造了新的紀(jì)錄,為用戶節(jié)省44%的時間

MoXing是華為云ModelArts團(tuán)隊(duì)自研的分布式訓(xùn)練加速框架,它構(gòu)建于開源的深度學(xué)習(xí)引擎TensorFlow、MXNet、PyTorch、Keras之上,使得這些計(jì)算引擎分布式性能更高,同時易用性更好。

華為云MoXing架構(gòu)圖

MoXing內(nèi)置了多種模型參數(shù)切分和聚合策略、分布式SGD優(yōu)化算法、級聯(lián)式混合并行技術(shù)、超參數(shù)自動調(diào)優(yōu)算法,并且在分布式訓(xùn)練數(shù)據(jù)切分策略、數(shù)據(jù)讀取和預(yù)處理、分布式通信等多個方面做了優(yōu)化,結(jié)合華為云Atlas高性能服務(wù)器,實(shí)現(xiàn)了硬件、軟件和算法協(xié)同優(yōu)化的分布式深度學(xué)習(xí)加速。

有了MoXing后,上層開發(fā)者可以聚焦業(yè)務(wù)模型,無需關(guān)注下層分布式相關(guān)的API,只用根據(jù)實(shí)際業(yè)務(wù)定義輸入數(shù)據(jù)、模型以及相應(yīng)的優(yōu)化器即可,訓(xùn)練腳本與運(yùn)行環(huán)境(單機(jī)或者分布式)無關(guān),上層業(yè)務(wù)代碼和分布式訓(xùn)練引擎可以做到完全解耦。

用數(shù)據(jù)說話:從吞吐量和收斂時間看加速性能

深度學(xué)習(xí)加速屬于一個從底層硬件到上層計(jì)算引擎、再到更上層的分布式訓(xùn)練框架及其優(yōu)化算法多方面協(xié)同優(yōu)化的結(jié)果,具備全棧優(yōu)化能力才能將用戶訓(xùn)練成本降到最低。

在模型訓(xùn)練這方面,華為云ModelArts內(nèi)置的MoXing框架使得深度學(xué)習(xí)模型訓(xùn)練速度有了很大的提升。

下圖是華為云團(tuán)隊(duì)測試的模型收斂曲線(128塊V100 GPU,完成ResNet50-on-ImageNet)。一般在ImageNet數(shù)據(jù)集上訓(xùn)練ResNet-50模型,當(dāng)Top-5精度≥93%或者Top-1 精度≥75%時,即可認(rèn)為模型收斂。

ResNet50-on-ImageNet訓(xùn)練收斂曲線(曲線上的精度為訓(xùn)練集上的精度):(a)所對應(yīng)的模型在驗(yàn)證集上Top-1 精度≥75%,訓(xùn)練耗時為10分06秒;(b) 所對應(yīng)的模型在驗(yàn)證集上Top-5精度≥93%,訓(xùn)練耗時為10分28秒。

Top-1和Top-5精度為訓(xùn)練集上的精度,為了達(dá)到極致的訓(xùn)練速度,訓(xùn)練過程中采用了額外進(jìn)程對模型進(jìn)行驗(yàn)證,最終驗(yàn)證精度如下表所示(包含與fast.ai的對比)。

MoXing與fast.ai的訓(xùn)練結(jié)果對比

華為云團(tuán)隊(duì)介紹,衡量分布式深度學(xué)習(xí)框架加速性能時,主要看吞吐量和收斂時間。在與吞吐量和收斂時間相關(guān)的幾個關(guān)鍵指標(biāo)上,團(tuán)隊(duì)都做了精心處理:

在數(shù)據(jù)讀取和預(yù)處理方面,MoXing通過利用多級并發(fā)輸入流水線使得數(shù)據(jù)IO不會成為瓶頸;

在模型計(jì)算方面,MoXing對上層模型提供半精度和單精度組成的混合精度計(jì)算,通過自適應(yīng)的尺度縮放減小由于精度計(jì)算帶來的損失;

在超參調(diào)優(yōu)方面,采用動態(tài)超參策略(如momentum、batch size等)使得模型收斂所需epoch個數(shù)降到最低;

在底層優(yōu)化方面,MoXing與底層華為自研服務(wù)器和通信計(jì)算庫相結(jié)合,使得分布式加速進(jìn)一步提升

后續(xù),華為云ModelArts將進(jìn)一步整合軟硬一體化的優(yōu)勢,提供從芯片(Ascend)、服務(wù)器(Atlas Server)、計(jì)算通信庫(CANN)到深度學(xué)習(xí)引擎(MindSpore)和分布式優(yōu)化框架(MoXing)全棧優(yōu)化的深度學(xué)習(xí)訓(xùn)練平臺。

ModelArts會逐步集成更多的數(shù)據(jù)標(biāo)注工具,擴(kuò)大應(yīng)用范圍,將繼續(xù)服務(wù)于智慧城市、智能制造、自動駕駛及其它新興業(yè)務(wù)場景,在公有云上為用戶提供更普惠的AI服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    218

    文章

    36003

    瀏覽量

    262084
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124396

原文標(biāo)題:華為云刷新深度學(xué)習(xí)加速紀(jì)錄:128塊GPU,10分鐘訓(xùn)練完ImageNet

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    中軟國際攜手華為加速企業(yè)落地智能體實(shí)踐

    在第四屆北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會 “伙伴共成長” 分論壇上,中軟國際 AI JointForce工程院副院長韓鵬發(fā)表《攜手華為加速企業(yè)落地智能體實(shí)踐》主題分享,深度剖析企業(yè)智能體
    的頭像 發(fā)表于 03-04 16:14 ?324次閱讀

    天合光能再次刷新大面積鈣鈦礦晶體硅疊層組件功率世界紀(jì)錄

    今日,天合光能(688599.SH)光伏科學(xué)與技術(shù)全國重點(diǎn)實(shí)驗(yàn)室宣布,錨定太空光伏,光伏技術(shù)再次實(shí)現(xiàn)關(guān)鍵性跨越:實(shí)驗(yàn)室以886W的成績刷新了3.1 ㎡大面積鈣鈦礦/晶體硅疊層組件功率世界紀(jì)錄,同時在
    的頭像 發(fā)表于 01-15 10:07 ?578次閱讀

    穿孔機(jī)頂頭檢測儀 機(jī)器視覺深度學(xué)習(xí)

    LX01Z-DG626穿孔機(jī)頂頭檢測儀采用深度學(xué)習(xí)技術(shù),能夠?qū)崿F(xiàn)頂頭狀態(tài)的在線實(shí)時檢測,頂頭丟失報(bào)警,頂頭異常狀態(tài)報(bào)警等功能,響應(yīng)迅速,異常狀態(tài)視頻回溯,檢測頂頭溫度,配備吹掃清潔系統(tǒng),維護(hù)周期長
    發(fā)表于 12-22 14:33

    豬事都上?溫氏+華為,把AI送進(jìn)養(yǎng)殖場

    華為
    腦極體
    發(fā)布于 :2025年11月14日 15:20:35

    軟通動力攜手華為加速行業(yè)應(yīng)用智能進(jìn)化

    華為全聯(lián)接大會2025期間,華為聯(lián)合應(yīng)用現(xiàn)代化產(chǎn)業(yè)聯(lián)盟舉辦“應(yīng)用現(xiàn)代化,加速行業(yè)應(yīng)用智能進(jìn)化”論壇,并攜手中國軟件行業(yè)協(xié)會、中國信息通信研究院、馬來西亞國家信息與通信協(xié)會(PIKOM
    的頭像 發(fā)表于 09-28 17:46 ?1161次閱讀

    什么是加速加速的重點(diǎn)選購指標(biāo)是哪些?

    加速是提升網(wǎng)站、APP訪問速度的關(guān)鍵工具,很多人卻搞不清它的作用和選購要點(diǎn)。本文 華納 會先用通俗語言解釋加速是什么,再拆解選購時必看
    的頭像 發(fā)表于 09-12 16:29 ?1474次閱讀

    廣汽本田雅閣刷新吉尼斯世界紀(jì)錄

    近期,在吉尼斯官方認(rèn)證官的見證下,廣汽本田雅閣憑借加速持久、轉(zhuǎn)向靈活、車身穩(wěn)重的駕控性能,以29.196秒內(nèi)繞17個移動樁的成績,成功打破此前由某新能源車型創(chuàng)造的30秒繞16個移動樁的紀(jì)錄,創(chuàng)造新的全球汽車挑戰(zhàn)“30秒內(nèi)駕車?yán)@移動樁最多”的吉尼斯世界
    的頭像 發(fā)表于 08-27 10:12 ?1083次閱讀

    Andes晶心科技推出新一代深度學(xué)習(xí)加速

    高效能、低功耗 32/64 位 RISC-V 處理器核與 AI 加速解決方案的領(lǐng)導(dǎo)供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學(xué)習(xí)加速器 Ande
    的頭像 發(fā)表于 08-20 17:43 ?2330次閱讀

    天合光能再度刷新疊層組件功率世界紀(jì)錄

    繼6月9日宣布鈣鈦礦/晶體硅30.6%疊層組件效率及829W疊層組件功率雙世界紀(jì)錄后,天合光能今日再傳喜訊——疊層組件功率提升至841W,再次打破世界紀(jì)錄。短短一周內(nèi)三次刷新世界紀(jì)錄,充分彰顯了“天合速度”在前沿創(chuàng)新技術(shù)上的強(qiáng)大
    的頭像 發(fā)表于 06-13 15:58 ?962次閱讀

    廣汽集團(tuán)與阿里華為展開深度合作

    “AI+”技術(shù)正快速向汽車產(chǎn)業(yè)滲透,廣汽集團(tuán)通過與阿里華為等優(yōu)秀科技企業(yè)展開深度合作,持續(xù)構(gòu)建“廣汽AI智能生態(tài)鏈Golink”,全面推進(jìn)數(shù)字化、智能化變革,加速向“數(shù)據(jù)+AI”雙
    的頭像 發(fā)表于 05-28 15:33 ?1083次閱讀

    博泰車聯(lián)網(wǎng)斬獲華為“2024年上海創(chuàng)新標(biāo)桿獎”

    近日,在華為生態(tài)大會上,博泰車聯(lián)網(wǎng)憑借與華為合作的車聯(lián)網(wǎng)平臺項(xiàng)目,成功斬獲“上海創(chuàng)新標(biāo)桿
    的頭像 發(fā)表于 05-08 10:17 ?927次閱讀

    拓維信息榮膺華為生態(tài)大會2025「突出貢獻(xiàn)獎」,以“AI+鴻蒙”加速行業(yè)智能躍遷

    4月10日-11日,以“聚力共創(chuàng),加速行業(yè)智能躍遷”為主題的華為生態(tài)大會2025在安徽蕪湖舉行。拓維信息作為華為核心合作伙伴受邀參加大會
    的頭像 發(fā)表于 04-18 18:21 ?1440次閱讀
    拓維信息榮膺<b class='flag-5'>華為</b><b class='flag-5'>云</b>生態(tài)大會2025「突出貢獻(xiàn)獎」,以“AI+鴻蒙”<b class='flag-5'>加速</b>行業(yè)智能躍遷

    軟通動力榮膺“2024華為卓越解決方案提供商”和“上海銷售伙伴核心貢獻(xiàn)獎”

    4月10日-11日,以“聚力共創(chuàng),加速行業(yè)智能躍遷”為主題的華為生態(tài)大會2025在安徽蕪湖盛大舉行。今年華為生態(tài)大會與云云協(xié)同大會合并舉
    的頭像 發(fā)表于 04-12 16:00 ?1672次閱讀

    潤和的Hi3861開發(fā)版如何連接華為

    剛?cè)胧至艘惶诐櫤偷腍i3861開發(fā)套件,下載的是3.2Release版本的源碼,想連接華為但是潤和那邊的代碼倉中沒有相關(guān)的demo,,求大佬指點(diǎn)
    發(fā)表于 04-11 20:32

    潤和的Hi3861開發(fā)板如何連接華為

    剛?cè)胧至艘惶诐櫤偷腍i3861開發(fā)套件,想連接華為但是潤和那邊的代碼倉中沒有相關(guān)的demo,求大佬指點(diǎn)
    發(fā)表于 04-11 20:30