国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

EasyDL上線百度超大規模預訓練模型,模型效果顯著提升

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 22:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學習領域,有一個名詞正在被越來越地關注:遷移學習。它相比效果表現好的監督學習來說,可以減去大量的枯燥標注過程,簡單來說就是在大數據集訓練的預訓練模型上進行小數據集的遷移,以獲得對新數據較好的識別效果,因其能夠大量節約新模型開發的成本,在實際應用中被更廣泛地關注。EasyDL 專業版在最新上線的版本中,就引入了百度超大規模視覺預訓練模型,結合遷移學習工具,幫助開發者使用少量數據,快速定制高精度 AI 模型。

在訓練一個深度學習模型時,通常需要大量的數據,但數據的采集、標注等數據準備過程會耗費大量的人力、金錢和時間成本。為解決此問題,我們可以使用預訓練模型。以預訓練模型 A 作為起點,在此基礎上進行重新調優,利用預訓練模型及它學習的知識來提高其執行另一項任務 B 的能力,簡單來說就是在大數據集訓練的預訓練模型上進行小數據集的遷移,以獲得對新數據較好的識別效果,這就是遷移學習(Transfer Learning)。

遷移學習作為一種機器學習方法,廣泛應用于各類深度學習任務中。在具體實現遷移學習時,有多種深度網絡遷移方法,其中的 Fine-tune(微調)是最簡單的一種深度網絡遷移方法,它主要是將已訓練好的模型參數遷移到新的模型來幫助新模型訓練。

針對一個具體的模型開發任務,我們通常會選擇在公開的大數據集上訓練收斂、且效果較好的模型,作為預訓練權重,在此基礎上使用業務數據對模型進行 Fine-tune。在 Fine-tune 時,默認源域(預訓練模型)、目標域數據集(用戶業務數據集)需要具有較強相關性,即數據同分布,這樣我們才能利用預訓練模型的大量知識儲備,快速高效地訓練出針對特定業務場景并具有優秀效果的模型。

但在實際應用場景中,很多用戶會面臨數據集與源數據集分布不同的問題。比如,預訓練模型的數據都是自然風景,但用戶的數據集都是動漫人物。類似這種源數據集和目標數據差別較大的問題,在具體應用中較易導致負向遷移,具體表現為訓練收斂慢,模型效果差等。

因此,一個包含各類場景、覆蓋用戶各類需求的超大規模數據集就十分重要,通過這個包羅萬象的超大規模數據集訓練所得的模型,才能夠更好地適應來自各行各業用戶的需求,更好地 Fine-tune 用戶的業務數據集,幫助用戶在自己的數據集上得到效果更好的模型。

百度超大規模預訓練模型便在此背景下產生,覆蓋自然語言處理和視覺兩大方向。

在自然語言處理方向,百度自研了業界效果最好的預訓練模型 ERNIE,開創性地將大數據預訓練與多源豐富知識相結合,持續學習海量數據中的知識,將機器語義理解水平提升到一個新的高度。ERNIE 在中英文的16個任務上已經超越了業界最好模型,全面適用于各類 NLP 應用場景。目前,EasyDL 專業版已預置了領先的預訓練模型 ERNIE2.0,并配套了多種 NLP 經典算法網絡,支持了文本分類、短文本匹配和序列標注等典型文本處理任務。
視覺方向,百度自研超大規模視覺預訓練模型覆蓋圖像分類與物體檢測兩個方向。圖像分類的預訓練模型,用海量互聯網數據,包括10萬+的物體類別,6500萬的超大規模圖像數量,進行大規模訓練所得,適應于各類圖像分類場景;物體檢測的預訓練模型,用800+的類別,170萬張圖片以及1000萬+物體框的數據集,進行大規模訓練所得,適應于各類物體檢測應用場景。相對于普通使用公開數據集訓練的預訓練模型,在各類數據集上都有不同程度效果提升,模型效果和泛化性都有顯著提升。

  • 以下實驗數據集均來自不同行業

圖像分類

在圖像分類模型中,使用百度超大規模預訓練模型的 Resnet50_vd 相比普通模型在各類數據集上平均提升12.76%,使用百度超大規模預訓練模型的 Resnet101_vd,相比于普通預訓練模型,平均提升13.03%,使用百度超大規模預訓練模型的 MobilenetV3_large_1x,相比于普通預訓練模型,平均提升8.04%。

并且,在圖像分類方向,還新增了11個模型,包括:EffcientNetB0_small,EfficientNetB4,MobileNetV3_large_x1_0,ResNet18_vd, ResNeXt101_32x16d_wsl, Res2Net101_vd_26w_4s, SE_ResNet18_vd, Xception71,還有基于百度超大規模預訓練模型訓練出來的 ResNet50_vd,ResNet101_vd 和 MobileNetV3_large_x1_0,其中比較特殊的幾個模型,EffcientNetB0_small 是去掉 SE 模塊的 EffcientNetB0,在保證精度變化不大的同時,大幅提升訓練和推理速度,ResNeXt101_32x16d_wsl 是基于超大量圖片的弱監督預訓練模型,準確率高,但預測時間相對增加,Res2Net101_vd_26w_4s 則是在單個殘差塊內進一步構造了分層的殘差類連接,比 ResNet101 準確度更高。

新增的分類模型的推理時間、效果,以及支持的部署方式如下表所示:

注:以上模型均基于 ImageNet1k 分類數據集訓練和測試
更多預置模型,參見 EasyDL 官網
https://ai.baidu.com/ai-doc/E...
更多模型效果,參見 PaddleClas
https://paddleclas.readthedoc...
并且,為了進一步提升圖像分類模型的模型效果,在訓練層面,圖像分類新增了 mix_up 和 label_smoothing 功能,可以在單標簽分類任務中,根據模型的訓練情況選擇開啟或者關閉。

mix_up 是一種數據增強方式,它從訓練樣本中隨機抽取了兩個樣本進行簡單的隨機加權求和,并保存這個權重,同時樣本的標簽也對應地用相同的權重加權求和,然后預測結果與加權求和之后的標簽求損失,通過混合不同樣本的特征,能夠減少模型對錯誤標簽的記憶力,增強模型的泛化能力。

Label_smoothing 是一種正則化的方法,增加了類間的距離,減少了類內的距離,避免模型對預測結果過于 confident 而導致對真實情況的預測偏移,一定程度上緩解由于 label 不夠 soft 導致過擬合的問題。

物體檢測

在物體檢測模型中,使用百度超大規模預訓練模型的 YOLOv3_DarkNet 相比普通模型在各類數據集上平均提升4.53%,使用百度超大規模預訓練模型的 Faster_RCNN,相比于普通預訓練模型,平均提升1.39%。

并且,在物體檢測方向,新增了 Cascade_Rcnn_ResNet50_FPN、YOLOv3_ResNet50vd_DCN、YOLOv3_MobileNetv1 網絡,以及基于百度超大規模預訓練模型訓練出來的 YOLOv3_Darknet、Faster_R-CNN_ResNet50_FPN,其中,Cascade_Rcnn_ResNet50_FPN 通過級聯多個檢測器以及設置不同 IOU 的重采樣機制,使得檢測器的精度、和定位的準確度進一步提升。

此外,針對用戶的需求,新增兩種 YOLOv3 的變種模型,其中,YOLOv3_MobileNetv1 是將原來的 YOLOv3 骨架網絡替換為 MobileNetV1,相比 YOLOv3_DarkNet,新模型在 GPU 上的推理速度提升約73%。而 YOLOv3_ResNet50vd_DCN 是將骨架網絡更換為 ResNet50-VD,相比原生的 DarkNet53 網絡在速度和精度上都有一定的優勢,在保證 GPU 推理速度基本不變的情況下,提升了1%的模型效果,同時,因增加了可形變卷積,對不規則物體的檢測效果也有一定的正向提升。

各檢測模型的效果,以及支持的部署方式如下表所示:

注:以上模型均基于 COCO17 數據集訓練和測試
更多預置模型,參見 EasyDL 官網
https://ai.baidu.com/ai-doc/E...
更多模型效果,參見 PaddleDetection
https://github.com/PaddlePadd...
各模型的推理時間如下表所示:

注:以上模型均基于 coco17 訓練所得
更多模型速度詳情,參見 PaddleDetection
https://github.com/PaddlePadd...
百度超大規模視覺預訓練模型對比公開數據集訓練的預訓練模型,效果提升明顯,目前這些模型已經預置在 EasyDL 專業版中正式發布。EasyDL 專業版是面向專業算法工程師群體專門推出的 AI 模型開發與服務平臺。支持視覺及自然語言處理兩大技術方向,可靈活支持腳本調參及 Notebook 兩類開發方式,預置了幾十種經典網絡和百度海量數據訓練的預訓練模型,模型效果在業界保持領先,同時支持公有云/私有化/設備端等靈活的部署方案,開發效率高、訓練速度快,同時設備端輕量級部署和加速方案使得顯存占用更少,預測速度更快。

開發者可以搜索進入 EasyDL 平臺,選擇專業版,選擇【新建任務】-【配置任務】-【選擇預訓練模型】處選擇【百度超大規模數據集 通用分類預訓練模型】

零門檻 AI 開發平臺 EasyDL,面向 AI 開發全流程提供靈活易用的一站式平臺方案。包含了 AI 開發過程中的三大流程:數據服務、訓練與開發、模型部署。

在數據服務上,剛剛上線的 EasyData 智能數據服務平臺覆蓋了數據采集、管理、清洗、標注、安全,并支持接入 EasyDL 進行訓練,在模型訓練部署之后,在云服務授權的前提下完成數據回流,針對性地進行難例挖掘,獲得更有助于模型效果提升的高質量數據。

EasyData 是業內首家推出了軟硬一體、端云協同自動數據采集方案的平臺,有離線視頻數據采集的用戶,可以下載 EasyData 的數據采集 SDK,通過定時拍照、視頻抽幀等方式,實時統計到云端進行處理。

在訓練與開發上,除了剛剛提到的大規模預訓練模型來提升模型性能,EasyDL 還采用了 AutoDL 自動搜索最優網絡及超參數,以及自動數據增強、自動超參搜索來增加數據量和多樣性、分布式訓練加速等豐富的訓練機制提升模型的訓練速度。

在模型部署上,EasyDL 提供端云協同的多種靈活部署方式,包括公有云 API、設備端 SDK、本地服務器部署、軟硬一體產品。值得關注的是,在 EasyDL 軟硬一體產品矩陣方案中,提供了六款軟硬一體方案,覆蓋超高性能,高性能和低成本小功耗三種不同形態,滿足開發者的各類業務需求,已經在幾十個行業上百個場景中落地應用。

點擊鏈接進入 EasyDL 專業版,感受預訓練模型的強大效果吧!

審核編輯:符乾江

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39878

    瀏覽量

    301530
  • 人工智能
    +關注

    關注

    1817

    文章

    50106

    瀏覽量

    265561
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科曙光scaleX萬卡超集群重塑超大規模算力基礎設施

    在“人工智能+”行動深入推進的當下,算力基礎設施已成為國家戰略競爭力的核心,而超大規模集群的運維管控難題卻日益凸顯。中科曙光scaleX萬卡超集群打造的智能管理體系,正以“能管住-管得穩-用得好”的進階邏輯,重塑超大規模算力基礎設施的運行范式,讓萬級節點協同從行業痛點變為
    的頭像 發表于 01-30 15:43 ?762次閱讀

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會現場,文心大模型5.0正式版上線
    的頭像 發表于 01-23 16:48 ?1320次閱讀

    大規模專家并行模型在TensorRT-LLM的設計

    DeepSeek-V3 / R1 等模型采用大規模細粒度混合專家模型 (MoE) 架構,大幅提升了開源模型的質量。Llama 4 和 Qwe
    的頭像 發表于 09-06 15:21 ?1238次閱讀
    <b class='flag-5'>大規模</b>專家并行<b class='flag-5'>模型</b>在TensorRT-LLM的設計

    基于大規模人類操作數據訓練的VLA模型H-RDT

    近年來,機器人操作領域的VLA模型普遍基于跨本體機器人數據集訓練,這類方法存在兩大局限:不同機器人本體和動作空間的差異導致統一訓練困難;現有大規模
    的頭像 發表于 08-21 09:56 ?1106次閱讀
    基于<b class='flag-5'>大規模</b>人類操作數據<b class='flag-5'>預</b><b class='flag-5'>訓練</b>的VLA<b class='flag-5'>模型</b>H-RDT

    寧暢與與百度文心大模型展開深度技術合作

    近日,百度正式開源文心大模型4.5系列模型。作為文心開源合作伙伴,寧暢在模型開源首日即實現即刻部署,做到“開源即接入、發布即可用”。據悉,文心4.5開源系列全部基于飛槳深度學習框架進行
    的頭像 發表于 07-07 16:26 ?883次閱讀

    偉創力高效電源模塊在超大規模數據中心的應用

    受云端存儲和數據處理需求持續增長的推動,數據中心正以前所未有的速度擴張。當前全球超大規模數據中心,即規模最大的那些數據中心,總容量在過去四年內翻了一番,并仍在不斷增長。
    的頭像 發表于 07-07 15:41 ?1272次閱讀

    華為正式開源盤古7B稠密和72B混合專家模型

    關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智能在千行業的應用與價值創造。 盤古Pro MoE 72B模型權重、基礎推理代碼,已正式上線開源平臺。 基于昇騰的
    的頭像 發表于 06-30 11:19 ?1343次閱讀

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享一個好消息,百度智能云已牽手65%的央企,共同推進大模型產業落地。得益于全棧的AI能力,百度聯合眾多央國企伙伴,針對各類不同業務場景,打造了一大批可推廣、可復制的標桿案例。
    的頭像 發表于 06-11 15:44 ?909次閱讀

    CMOS超大規模集成電路制造工藝流程的基礎知識

    本節將介紹 CMOS 超大規模集成電路制造工藝流程的基礎知識,重點將放在工藝流程的概要和不同工藝步驟對器件及電路性能的影響上。
    的頭像 發表于 06-04 15:01 ?2623次閱讀
    CMOS<b class='flag-5'>超大規模</b>集成電路制造工藝流程的基礎知識

    納微半導體推出12kW超大規模AI數據中心電源

    近日,納微半導體宣布推出專為超大規模AI數據中心設計的最新12kW量產電源參考設計,可適配功率密度達120kW的高功率服務器機架。
    的頭像 發表于 05-27 16:35 ?1576次閱讀

    百度文心大模型X1 Turbo獲得信通院當前大模型最高評級證書

    ,16項達5分,綜合評級獲當前最高級“4+級”, 成為國內首款通過該測評的大模型 。文心X1 Turbo邏輯推理、代碼推理、推理效果優化等技術能力及工具支持、安全可靠等應用能力均獲
    的頭像 發表于 05-21 18:19 ?1288次閱讀
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通院當前大<b class='flag-5'>模型</b>最高評級證書

    AI原生架構升級:RAKsmart服務器在超大規模模型訓練中的算力突破

    近年來,隨著千億級參數模型的崛起,AI訓練對算力的需求呈現指數級增長。傳統服務器架構在應對分布式訓練、高并發計算和顯存優化等場景時逐漸顯露瓶頸。而RAKsmart為超大規模
    的頭像 發表于 04-24 09:27 ?800次閱讀

    百度飛槳框架3.0正式版發布

    模型訓練成本高?推理效率低?硬件適配難? 4月1日,百度發布 飛槳框架3.0正式版 !五大特性專為大模型設計。 作為大模型時代的Infra
    的頭像 發表于 04-02 19:03 ?1202次閱讀
    <b class='flag-5'>百度</b>飛槳框架3.0正式版發布

    用PaddleNLP為GPT-2模型制作FineWeb二進制訓練數據集

    ,使用PaddleNLP將FineWeb數據集中文本形式的數據,經過分詞化(Tokenize),轉換為大語言模型能直接使用的二進制數據,以便提升訓練效果。 ChatGPT發布后,當代大
    的頭像 發表于 03-21 18:24 ?4333次閱讀
    用PaddleNLP為GPT-2<b class='flag-5'>模型</b>制作FineWeb二進制<b class='flag-5'>預</b><b class='flag-5'>訓練</b>數據集

    百度發布文心大模型4.5和文心大模型X1

    文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,通過多個模態聯合建模實現協同優化,多模態理解能力優秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯
    的頭像 發表于 03-18 16:29 ?933次閱讀