国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI模型是如何訓練的?訓練一個模型花費多大?

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2022-10-23 00:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)在深度學習中,經常聽到一個詞“模型訓練”,但是模型是什么?又是怎么訓練的?在人工智能中,面對大量的數據,要在雜亂無章的內容中,準確、容易地識別,輸出需要的圖像/語音,并不容易。因此算法顯得尤為重要。算法也就是模型。
算法的內容,除了核心識別引擎,也包括各種配置參數,如:語音智能識別的比特率、采樣率、音色、音調、音高、音頻、抑揚頓挫、方言、噪音等。成熟的識別引擎,核心內容一般不會經常變化。為實現“識別成功”這一目標,就只能對配置參數做調整。
對不同輸入,我們會配置不同參數值,最后在結果統計取一個各方比較均衡、識別率較高的一組參數值,這組參數值,就是訓練后得到的結果,這就是訓練的過程,也叫模型訓練。
如何訓練一個AI模型?
訓練模型需要用到AI框架,比如MindSpore。具體如何訓練一個AI模型呢?昇思MindSpore
此前發布一個詳細的案例,訓練的模型是用來對手寫數字圖片進行分類的LeNet5模型。MindSpore是華為推出全場景AI計算框架,2020年3月28日宣布MindSpore正式開源。
首先是安裝MindSpore,MindSpore提供給用戶使用的是Python接口。安裝的時候,選擇合適的版本、硬件平臺、操作系統編程語言、安裝方式。其次是定義模型,安裝好之后,就可以導入MindSpore提供的算子(卷積、全連接、池化等函數)來構建模型了。構建一個AI模型就像建一個房子,MindSpore提供的算子就像是磚塊、窗戶、地板等基本組件。
接下來是導入訓練數據集,什么是訓練數據集呢,剛剛定義好的模型是不能對圖片進行正確分類的,要通過訓練過程來調整模型的參數矩陣的值。訓練過程就需要用到訓練樣本,也就是打上了正確標簽的圖片。這就好比教小孩兒認識動物,需要拿幾張圖片給他們看,告訴他們這是什么,教了幾遍之后,小孩兒就能認識了。
那么這里訓練LeNet5模型就需要用到MNIST數據集。這個數據集由兩部分組成:訓練集(6萬張圖片)和測試集(1萬張圖片),都是0~9的黑白手寫數字圖片。訓練集是用來訓練AI模型的,測試集是用來測試訓練后的模型分類準確率的。
再接下來就是訓練模型,訓練數據集和模型定義完成后,就可以開始訓練模型了。在訓練之前,還需要從MindSpore導入兩個函數:損失函數,就是衡量預測結果和真實標簽之間的差距的函數;優化器,用來求解損失函數關于模型參數的更新梯度的。準備好之后,開始訓練,把前面定義好的模型、損失函數、優化器封裝成一個Model,使用model.train接口就可以訓練LeNet5模型了。最后就是測試訓練后的模型準確率。
訓練AI模型花費大
當然,模型訓練需要強大的算力支撐,尤其是參數量大的模型,花費極大。
比如OpenAI的語言模型GPT-3,這是一個大型的、數學模擬神經網絡,從網絡上抓取大量文本進行訓練后,GPT-3可以以驚人的連貫性預測哪些詞應該填在其他詞前后,生成流暢的文本。據估計,訓練GPT-3的成本接近500萬美元。
一些小企業想要訓練一個參數較大的算法,往往比較苦難。健康IT公司Optum的一位領導此前表示,他們團隊使用語言模型來分析通話記錄,識別哪些患者風險較高,哪些應該及早推薦轉診。只是訓練一個GPT-3大小千分之一的語言模型,也會很快耗盡團隊的預算。
另外一家從事搜索業務的創業公司Glean,一直很想使用最新的AI算法來改進公司的產品。
Glean提供Gmail、Slack和Salesforce等應用程序進行搜索的工具,用于解析語言的新AI技術,可以幫助公司的客戶更快地發掘正確的文件或對話。
但是訓練這樣一個尖端的人工智能算法需要花費數百萬美元。Glean只好使用更小、能力更弱的AI模型,然而這些模型無法從文本中提取出盡可能多的含義。
小結
過去十幾年,AI取得了一些列舉世矚目的成績,包括在游戲中擊敗人類,讓汽車可以行駛在城市的街道上,AI自己編寫連貫的文字,做出可以媲美畫家的畫作。這都得益于數據量的不斷積累,算法的不斷優化,以及可以支撐算法訓練的算力的不斷強化。
然而,在發展的過程中同樣還存在一些問題。比如對于小企業來說,訓練高級AI算法成本高,這就會使得AI的全面應用受到阻礙等問題。當然AI整體呈現出快速發展的趨勢,業界也在不斷探索有利于AI發展的方式,比如大模型的出現,本身也是為了解決通用性的問題,比如說模型簡化,減少模型訓練所需要算力等。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301356
  • 訓練模型
    +關注

    關注

    1

    文章

    37

    瀏覽量

    4071
  • 算力
    +關注

    關注

    2

    文章

    1528

    瀏覽量

    16740
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    訓練到推理:大模型算力需求的新拐點已至

    在大模型產業發展的早期階段,行業焦點主要集中在大模型訓練所需的算力投入。萬億參數大模型
    的頭像 發表于 02-05 16:07 ?794次閱讀
    從<b class='flag-5'>訓練</b>到推理:大<b class='flag-5'>模型</b>算力需求的新拐點已至

    RA8P1部署ai模型指南:從訓練模型到部署?|?本周六

    在嵌入式邊緣AI中,如何把“訓練好的模型”穩定地“跑在板子上”,決定了項目能否落地。我們帶你基于RA8P1平臺,跑通從數據準備、模型訓練、量
    的頭像 發表于 11-20 18:06 ?2076次閱讀
    RA8P1部署<b class='flag-5'>ai</b><b class='flag-5'>模型</b>指南:從<b class='flag-5'>訓練</b><b class='flag-5'>模型</b>到部署?|?本周六

    在Ubuntu20.04系統中訓練神經網絡模型些經驗

    本帖欲分享在Ubuntu20.04系統中訓練神經網絡模型些經驗。我們采用jupyter notebook作為開發IDE,以TensorFlow2為訓練框架,目標是
    發表于 10-22 07:03

    文看懂AI訓練、推理與訓推體的底層關系

    我們正在參加全球電子成就獎的評選,歡迎大家幫我們投票~~~謝謝支持很多人聽過“大模型”,但沒搞懂兩件事。我們總說AI有多強,但真正決定AI能否落地的,是它的兩階段:
    的頭像 發表于 09-19 11:58 ?2405次閱讀
    <b class='flag-5'>一</b>文看懂<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>、推理與訓推<b class='flag-5'>一</b>體的底層關系

    模板驅動 無需訓練數據 SmartDP解決小樣本AI算法模型開發難題

    。但是這個平臺不適用于小樣本AI模型開發,特別是些特殊行業,數據本來就不多,但又有著需求,因此陷于兩難。面臨這種市場困境,慧視光電推出了
    的頭像 發表于 09-09 17:57 ?1397次閱讀
    模板驅動  無需<b class='flag-5'>訓練</b>數據  SmartDP解決小樣本<b class='flag-5'>AI</b>算法<b class='flag-5'>模型</b>開發難題

    ai_cube訓練模型最后部署失敗是什么原因?

    ai_cube訓練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發表于 07-30 08:15

    摩爾線程“AI工廠”:五大核心技術支撐,打造大模型訓練超級工廠

    演講中表示,為應對生成式AI爆發式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統級工程創新,構建新AI
    的頭像 發表于 07-28 11:28 ?4532次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:五大核心技術支撐,打造大<b class='flag-5'>模型</b><b class='flag-5'>訓練</b>超級工廠

    make sence成的XML文件能上傳到自助訓練模型上嗎?

    make sence成的XML文件能上傳到自助訓練模型上嗎
    發表于 06-23 07:38

    海思SD3403邊緣計算AI數據訓練概述

    模型,將模型轉化為嵌入式AI模型模型升級AI攝像機,進行
    發表于 04-28 11:11

    AI原生架構升級:RAKsmart服務器在超大規模模型訓練中的算力突破

    近年來,隨著千億級參數模型的崛起,AI訓練對算力的需求呈現指數級增長。傳統服務器架構在應對分布式訓練、高并發計算和顯存優化等場景時逐漸顯露瓶頸。而RAKsmart為超大規模
    的頭像 發表于 04-24 09:27 ?789次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    模型全鏈路分析功能,針對AI應用開發的三大痛點逐個擊破。 當前AI應用開發者在使用開發工具時會面臨很頭疼的問題,種類多、功能不聚合、過
    發表于 04-13 19:52

    請問如何在imx8mplus上部署和運行YOLOv5訓練模型

    我正在從事 imx8mplus yocto 項目。我已經在自定義數據集上的 YOLOv5 上訓練了對象檢測模型。它在 ubuntu 電腦上運行良好。現在我想在我的 imx8mplus 板上運行該模型
    發表于 03-25 07:23

    利用RAKsmart服務器托管AI模型訓練的優勢

    AI模型訓練需要強大的計算資源、高效的存儲和穩定的網絡支持,這對服務器的性能提出了較高要求。而RAKsmart服務器憑借其核心優勢,成為托管AI模型
    的頭像 發表于 03-18 10:08 ?687次閱讀

    憶聯PCIe 5.0 SSD支撐大模型全流程訓練

    到高頻參數迭代,從模型微調到實時推理,大模型運行的每一個環節都需存儲設備在“硬指標”與“軟實力”間達成平衡。從產品可靠性視角出發,憶聯新代PCIe Gen5 ESSD UH812a/
    的頭像 發表于 03-11 10:26 ?1138次閱讀
    憶聯PCIe 5.0 SSD支撐大<b class='flag-5'>模型</b>全流程<b class='flag-5'>訓練</b>

    訓練好的ai模型導入cubemx不成功怎么處理?

    訓練好的ai模型導入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案?
    發表于 03-11 07:18