国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT“狂飆”之路背后的存儲挑戰

UnionMemory憶聯 ? 來源:UnionMemory憶聯 ? 2023-02-27 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT從2022年11月問世至今,憑借著“上知天文,下知地理”的智能表現火速出圈,在內容生成、搜索引擎優化、編程協助、智能客服等領域展現出的巨大潛力,甚至引發了AI領域的新一輪技術升級與產業重構,國內外科技企業也紛紛加入這場人工智能的競賽。

就在不久前,北京市經濟和信息化局發布的《2022年北京人工智能產業發展白皮書》中明確提出“支持頭部企業打造對標ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。加強人工智能算力基礎設施布局。加速人工智能基礎數據供給。”

一場全球化、全領域的AI新浪潮已經來臨。

ChatGPT“狂飆”之路背后的存儲挑戰

ChatGPT是由美國人工智能研究實驗室OpenAI發布的一款生成式人工智能聊天機器人,是由人工智能技術驅動的自然語言處理工具,它能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務。

80b5c70c-b371-11ed-bfe3-dac502259ad0.jpg

ChatGPT使用的是GPT-3技術,即第三代生成式預訓練Transformer (Generative Pretrained Transformer 3),這是一種自回歸語言模型,所采用的數據量多達上萬億,主要使用的是公共爬蟲數據集和有著超過萬億單詞的人類語言數據集,對應的模型參數量也達到1,750億。

GPT-3.5則是GPT-3微調優化后的版本,比后者更強大。ChatGPT正是由GPT-3.5架構的大型語言模型(LLM)所支持的,使ChatGPT能夠響應用戶的請求,做出“類似人類的反應”。在此背后是參數量和訓練樣本量的增加,據了解,GPT-3.5包含超過1746億個參數,預估訓練一次ChatGPT至少需要約3640 PFlop/s-day的算力(即1PetaFLOP/s效率跑3640天)。

ChatGPT“無所不知”的背后除了考驗算力成本外,對數據存儲在速度、功耗、容量、可靠性等層面也提出了更高要求。

ChatGPT每個訓練步驟對存儲都有著嚴苛的要求:

80dc9cba-b371-11ed-bfe3-dac502259ad0.jpg

①數據獲取…

因為ChatGPT的訓練需要大量的文本數據,所以需要先準備一個大規模的語料庫。語料庫可以來自各種渠道,例如維基百科、新聞網站、社交媒體等,并進行一定的預處理,例如去除特殊字符、分詞、轉換成小寫等。為了縮短收集數據進行分析所需的時間,需要同時從各渠道進行采集,該階段的重點在持續寫入,定期進行容量存儲的非易失性寫入,AI獲取的I/O配置文件通常是100%的順序寫入。

②數據整理…

由于從各種渠道收集到的數據結構多種多樣,因此需要對獲取的數據進行整理后再進行訓練,例如對不完整的數據進行修復。針對不同屬性的數據,例如用于面部識別的圖像,必須進行歸一化;非結構化數據需要進行標記和注釋,便于深度學習算法的訓練,進而增強算法。最后將來源于不同渠道的數據進行合并,并轉換為目標格式。

這是一個不斷迭代的過程,也是具有高度并發性的混合工作負載過程,因為需要讀寫不同數量的數據,包括隨機和順序讀寫。讀寫比將根據攝入數據的準確性和達到目標格式所需的轉換程度而變化,極端情況下的工作負載可以接近50%的寫入,擁有高吞吐量、低延遲以及高QoS的存儲設備是減少數據整理時間的關鍵。

③訓練…

ChatGPT的訓練使用了自監督學習(Self-supervised learning)的方法,即根據文本數據中的上下文關系來預測下一個單詞或字符。在訓練過程中,ChatGPT 使用了基于梯度下降的優化算法來調整模型參數,使得模型的預測結果更加接近實際結果。

這個階段非常耗費資源,因為涉及到從基于數據的預測到強化學習,再到神經網絡和基于運動模型的預測一系列重復的步驟,并不斷調節超參數與優化模型性能。大多使用的是隨機讀取和一些寫入用于檢查點設置,因此維持超快、高帶寬隨機讀取的存儲設備更有利于訓練,更快的讀取可以使有價值的訓練資源得到快速利用,而隨機性有助于提高模型的準確性。在此階段,減少I/O等待時間至關重要。

④推理…

訓練結束后,將訓練好的模型執行推理,觀察并使用新的數據驗證推理結果是否符合預期。在推理階段同樣也需要大量讀取和具有極低響應時間的高性能存儲。推理可以部署在數據中心或邊緣設備中,實時邊緣部署不僅需要快速將已訓練好的模型讀入推理,還需要快速寫入攝取的數據以進行實時決策。隨著更多邊緣部署采用強化學習,對存儲設備性能的要求將更高。

AI浪潮之下,憶聯SSD能做什么

面對AI應用更嚴苛的存儲要求,憶聯UH711a作為一款數據中心級SSD,憑借在各方面出色的性能表現可應用在AI業務中的各個階段。

80ec3526-b371-11ed-bfe3-dac502259ad0.jpg

全場景調優,助推AI應用落地…

UH711a面向數據中心級的讀密集場景、混合場景、寫密集場景等業務場景和各類IO pattern,可提供全面的性能、功耗調優。尤其在數據庫、塊存儲、對象存儲、海量存儲等對隨機IOPS性能高要求場景下UH711a的性能顯著。在與國內某互聯網客戶數據中心的合作中,通過使用憶聯UH711a,在混合讀寫滿負載業務場景下,存儲集群能耗比提升了12.5%。

8102e08c-b371-11ed-bfe3-dac502259ad0.jpg

尤其在隨機讀寫4K性能指標上,可提供更優的SSD能耗比,能滿足AI業務中高吞吐量的需求,使其可以更快地收集更多的數據,縮短從數據中獲取反饋的時間。如下圖所示,UH711a在數據中心業務隨機4K場景下IOPS per Watt 相比友商可提升42%。在數據中心級應用場景中可獲得12.5%的IOPS per Watt收益。

811c42b6-b371-11ed-bfe3-dac502259ad0.jpg

各類場景下的IOPS per Watt測試對比

SR-IOV技術加持,降本增效顯著…

因SR-IOV技術可提供更好的密度性能、隔離性和安全性,目前已被數據中心廣泛采用。在面向AI應用進行部署與邏輯較為復雜的場景時,SR-IOV可為用戶提供安全、優質的AI計算資源。UH711a 通過使能SR-IOV技術優化云業務虛擬機場景,相比SPDK方案優勢顯著。憶聯采用的SR-IOV 2.0優化了各VF的性能隔離調度邏輯,使各VF間的性能隔離度更好,在純讀純寫場景下從原來的5%波動降低到3%;混合場景業務的波動從部分場景10%的波動優化到5%以內。

812c4dd2-b371-11ed-bfe3-dac502259ad0.jpg

此外,UH711a基于QOS保障的SR-IOV特性,在虛擬化AI場景,配合NVIDIA GPU Directed Storage場景下提供高達7GBps、170M IOPS訪問能力,同時節約CPU算力10%,可減輕AI業務因數據持續增長的算力壓力。

例:

一臺12盤位服務器(128vCPU Core)使用憶聯SR-IOV特性,每片盤可節省2個vCPU Core(累計節省24vCPU Core);CPU價格按40$來計算,單臺服務器可節約CPU算力18.5%,釋放的CPU算力可額外提供存儲租用服務12個(24vCPU core / 2個vcpu綁定一個虛擬盤 )。

支持DIF特性,保障數據的可靠性…

機器學習中,若數據發生錯誤,研發人員可能花費大量時間進行查錯,拉高時間成本的同時也會影響數據集的質量,更有可能出現模型精度降低的風險。憶聯UH711a可支持DIF特性,能提升全鏈路數據保護能力。不僅與系統配合,實現端到端的保護,更能夠在盤內實現獨立的端到端保護機制,確保盤內整個通路的數據安全,從而為AI業務中多種極端場景下的正常運維提供雙重保護。

813fedce-b371-11ed-bfe3-dac502259ad0.jpg

憶聯UH711a還支持多種DIF配置,512+8、4K+8、4K+64,支持從應用到Flash的端到端數據保護,并能有效杜絕data replacement故障發生的可能,保障數據的完整性,助力AI模型的訓練與推理能順利完成。

優異的QoS,提升用戶體驗…

憶聯UH711a采用了One Time Read技術,即結合介質分組管理、最優讀電壓實時追蹤技術,對每個IO進行最優應答策略設計。可增強盤片的QoS競爭力,99.9% IO讀一次成功,延時小于350us,能縮短在AI訓練與推理時的實時決策時間,并提升盤片QoS能力與延長End of Life。

8155e642-b371-11ed-bfe3-dac502259ad0.png

在前臺最優響應用戶IO:

·以IO PPN信息,查詢最優電壓分組管理表;

·同時獲取介質狀態信息(Open Close Affected WL等);

·根據介質狀態和分組表記錄最優電壓,采用預先設計的最優應答策略讀取數據,最大程度縮短每個IO的響應延時。

在后臺進行智能維護:

·依據大數據分析,對介質進行智能分組管理;

·關鍵事件觸發,對介質狀態進行更新維護;

·根據介質狀態、實時巡檢,依托最優電壓跟蹤IP,對電壓分組管理表進行更新,保障電壓準確度。

面向未來,憶聯推動數據存儲再進化

據報道,OpenAI已建立了一個比ChatGPT更先進的大型語言模型GPT-4,更有傳聞稱其可以通過圖靈測試,這意味人工智能將再次邁向新的臺階。憶聯作為科技浪潮中的一員將堅持以創新為驅動,為人工智能的部署與優化提速。

產品層面:針對AI業務場景及IO pattern,對SSD的高穩態性能、虛擬化與高能耗提出的更高需求,憶聯將積極研發更具創新力與更高性能的存儲產品,從產品形態、性能、深度定制化特性等多維度豐富產品矩陣。

解決方案層面:聯合上下游伙伴探索先進技術,面向云計算、數據中心、服務器、運營商等關鍵行業打造場景化的存儲解決方案,并積極推動產品與基礎軟硬件的兼容適配,加快人工智能部署升級。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301349
  • 語言模型
    +關注

    關注

    0

    文章

    571

    瀏覽量

    11310
  • ChatGPT
    +關注

    關注

    31

    文章

    1598

    瀏覽量

    10264

原文標題:ChatGPT掀起AI熱潮,憶聯SSD提供全方位存儲方案

文章出處:【微信號:UnionMemory憶聯,微信公眾號:UnionMemory憶聯】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一文了解數據存儲演變之路

    開工大吉,啟新賦能!數據存儲格局正持續快速迭代發展,這背后離不開企業與個人不斷增長的數據量驅動。其演變核心在于,從傳統存儲模式逐步迭代升級,轉向更先進、靈活且可擴展的存儲解決方案,精準
    的頭像 發表于 02-27 13:51 ?268次閱讀
    一文了解數據<b class='flag-5'>存儲</b>演變<b class='flag-5'>之路</b>

    泰克專家探討類腦計算背后的器件邏輯與現實挑戰

    當AI算力競賽愈演愈烈,一條源于生物大腦的技術路徑,正在悄然重塑半導體器件與系統架構。近日,泰克專家在展臺與類腦器件領域資深研究者萬老師展開深度交流,圍繞“器件如何賦能系統、打通從生物大腦到新型半導體應用的工程路徑”這一核心議題,探討類腦計算背后的器件邏輯與現實挑戰
    的頭像 發表于 01-20 10:15 ?554次閱讀

    2025 企業 IT 成本翻倍?華為云對象存儲讓數據存儲成本直降 20%

    2025 年,全球存儲硬件市場的價格狂飆讓企業 IT 部門陷入兩難境地。作為固態硬盤核心組件的 NAND Flash,自 2025 年第一季以來價格累計上漲高達 246%,其中 70% 的漲幅集中在
    的頭像 發表于 12-31 12:57 ?316次閱讀

    SD NAND:工業 AI 巡檢的存儲硬核

    工業巡檢 AI?化的「存儲攔路虎」與 SD NAND?的破局之路 在鋼鐵廠的高溫車間、油氣管道的偏遠沿線、電力基站的高空平臺,工業巡檢 AI?設備正逐步取代人工 ——?通過 AI?視覺識別焊縫缺陷
    的頭像 發表于 12-26 09:42 ?239次閱讀
    SD NAND:工業 AI 巡檢的<b class='flag-5'>存儲</b>硬核

    HBM量價齊飛,UFS加速普及:存儲狂飆下的“最后質檢”攻堅戰

    HBM 量價齊飛、UFS 4.1 普及推動存儲技術狂飆,卻凸顯燒錄與測試這一 “最后質檢” 難題。高端存儲性能競賽(HBM4 帶寬 2TB/s、UFS 4.1 讀寫 4.2GB/s)與產能成本博弈
    的頭像 發表于 12-18 11:15 ?428次閱讀

    CoWoS產能狂飆背后:異質集成芯片的“最終測試”新范式

    CoWoS 產能狂飆背后,異質集成技術推動芯片測試從 “芯片測試” 轉向 “微系統認證”,系統級測試(SLT)成為強制性關卡。其面臨三維互連隱匿缺陷篩查、功耗 - 熱 - 性能協同驗證、異構單元協同
    的頭像 發表于 12-11 16:06 ?419次閱讀

    巧用拼多多API,精準定位下沉市場,銷量一路狂飆

    ,如何精準觸達并服務好這部分用戶群體,是提升銷量的關鍵。本文將探討如何利用拼多多開放平臺提供的API,實現數據的精準獲取與分析,從而制定更有效的營銷策略,助力銷量“狂飆”。 一、 下沉市場的潛力與挑戰 下沉市場用戶規模龐大
    的頭像 發表于 12-11 14:48 ?262次閱讀
    巧用拼多多API,精準定位下沉市場,銷量一路<b class='flag-5'>狂飆</b>!

    2025玄奘之路戈20挑戰賽,神眸AI智能影像實現全賽道守護實時直播

    玄奘之路戈20戈壁挑戰賽2025年9月28日-10月4日在甘肅敦煌圓滿完賽。5500余名來自全球近百所商學院、知名品牌企業的參賽者齊聚瓜洲。作為戈2AI智能影像戰略合作伙伴,在茫茫戈壁無人區,200
    的頭像 發表于 10-15 09:16 ?871次閱讀
    2025玄奘<b class='flag-5'>之路</b>戈20<b class='flag-5'>挑戰</b>賽,神眸AI智能影像實現全賽道守護實時直播

    讓太陽能逆變器“狂飆”的秘訣-耐達訊CAN轉EtherCAT網關

    導入ESI文件,組態比搭樂高還簡單;未來兼容:支持TSN(時間敏感網絡),無縫對接智能電網。 總結:耐達訊通信技術CAN轉EtherCAT網關,堪稱新能源界的“協議外交官”。它用技術魔法打破壁壘,讓老設備煥發青春,新系統如虎添翼。若想光伏電站“發電如狂飆”,這位“破壁人”絕對是你的工具箱MVP!
    發表于 07-18 15:22

    有源銅纜:大模型背后的隱形英雄

    現在大家都在關注大模型,像ChatGPT,xAI等,尤其是Deepseek,最近都火出圈了!
    的頭像 發表于 07-11 14:16 ?1239次閱讀
    有源銅纜:大模型<b class='flag-5'>背后</b>的隱形英雄

    馬斯克回歸“7×24硬核模式”,FSD與Optimus雙線狂飆

    這場 "馬斯克式狂飆" 能否沖破技術瓶頸與市場質疑?2025 年的得州街頭,或許會給出第一個答案。
    的頭像 發表于 05-27 16:18 ?621次閱讀

    拆解小米 CyberGear 微電機!ams AS5047P 磁編憑何讓性能狂飆

    《拆解小米 CyberGear 微電機!ams AS5047P 磁編憑何讓性能狂飆?》
    的頭像 發表于 05-14 10:45 ?1212次閱讀
    拆解小米 CyberGear 微電機!ams AS5047P 磁編憑何讓性能<b class='flag-5'>狂飆</b>?

    充電樁狂飆時代:跳出價格戰泥潭的突圍路徑

    這場狂飆,或許才剛剛進入彎道。這個行業的真正價值,從來不在槍頭接觸的瞬間,而在電流涌動時激發的無限可能。
    的頭像 發表于 04-11 17:01 ?1675次閱讀
    充電樁<b class='flag-5'>狂飆</b>時代:跳出價格戰泥潭的突圍路徑

    算力革命背后的隱形力量:仁懋MOSFET如何讓服務器電源效率狂飆

    算力時代的高壓挑戰隨著AI大模型訓練集群規模突破10萬卡,單機柜功率密度已飆升至30kW,傳統服務器電源的MOSFET面臨極限考驗——1%的效率差距意味著單數據中心年損耗超5000萬度電。仁懋電子
    的頭像 發表于 03-21 17:35 ?1036次閱讀
    算力革命<b class='flag-5'>背后</b>的隱形力量:仁懋MOSFET如何讓服務器電源效率<b class='flag-5'>狂飆</b>?

    和安信可Ai-M61模組對話?手搓一個ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發布于 :2025年03月12日 15:56:59