国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產大模型第一梯隊玩家,為什么pick了CPU?

愛云資訊 ? 2024-07-10 20:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI一天,人間一年。

現(xiàn)在不論是大模型本身,亦或是AI應用的更新速度簡直令人直呼跟不上——

Sora、Suno、Udio、Luma……重磅應用一個接一個問世。

也正如來自InfoQ的調查數(shù)據(jù)顯示的那般,雖然AIGC目前還處于起步階段,但市場規(guī)模已初具雛形:

wKgaomaOetyAeV8HAAAoBgr9XkQ206.png

行業(yè)整體迅速發(fā)展固然是好事,但具體到每個的應用或者大模型的落地來說,面臨的競爭也越發(fā)激烈了

例如前不久各個大模型廠商之間展開的非常激烈的“價格戰(zhàn)”,主打一個比誰更便宜,甚至直接把大模型價格推向“厘時代”

加上最近OpenAI的“斷供”事件,更是讓國內廠商們在打出“輕松搬家”計劃的同時,再加碼Tokens送送送的力度。

究其原因,也是與當下應用為王,尤其是以盡量低的成本把業(yè)務快速落地的這一大趨勢緊密相關。

那么問題來了,大模型玩家們何以在又快又好又省之間做到平衡?

這就回到了那個避不開,同時又是成本里占絕對大頭的因素——算力。

現(xiàn)在提及大模型的訓練和推理,很多人的第一反應或許就是想到了GPU

誠然GPU在高性能上占據(jù)著一定的優(yōu)勢,但它所存在“硬傷”也是比較明顯,那便是供應不足價格昂貴

何以破局?國產大模型第一梯隊玩家百度智能云千帆大模型平臺,就給出了自己的一個更具“效價比”的解法:

wKgaomaOetyAeVxqAAA8o1p1P2A252.png

具體到算力的部署上,百度智能云AI與大模型平臺總經(jīng)理忻舟認為:

wKgZomaOetyAPoYgAABkHtq09dU344.png

一言蔽之,在大模型時代,CPU甚至比以往更加重要了,而且是能讓大模型和應用做到“快好省”落地的關鍵因素之一。

那么具體“上崗”效果又是如何,我們繼續(xù)往下看。

國產頭部大模型玩家,pick了CPU

國內AIGC應用爆發(fā),這其中,百度智能云千帆大模型平臺功不可沒。

作為企業(yè)使用大模型的”一站式”服務平臺,千帆大模型平臺自去年3月發(fā)布以來已有超12萬客戶使用,累計調優(yōu)模型2萬個,孵化應用4.2萬個。

這些應用覆蓋教育、金融、辦公、醫(yī)療等眾多場景,為行業(yè)數(shù)字化轉型提供了有力支撐。

教育領域,千帆大模型平臺賦能了試題生成、在線批改、題目解析等應用,大大提升了教學和備考效率。

例如用戶可以提供參考材料,設定題型和難度,平臺就能自動生成高質量的試題。而交互式的題目解析,則可以針對每位學生的薄弱環(huán)節(jié),提供個性化的學習指導。

辦公場景,千帆大模型平臺與業(yè)內頭部企業(yè)合作,共同打造了智能寫作助手等創(chuàng)新應用,能夠根據(jù)用戶輸入的關鍵詞,快速生成招聘文案、營銷方案、數(shù)據(jù)報告等專業(yè)文檔。

還可以專注于各類寫作場景,可以智能生成論文大綱、項目匯報、品牌宣傳稿等,大大提升了行政和營銷人員的工作效率。

醫(yī)療健康是千帆大模型平臺的另一大應用賽道。基于醫(yī)療知識庫訓練的模型,可以自動生成體檢報告解讀,用通俗易懂的語言向用戶解釋各項指標,并給出個性化的健康指導。

這讓普通大眾也能更好地了解自己的身體狀況,實現(xiàn)”健康自主管理”。

可以看到,千帆大模型平臺在多個領域實現(xiàn)了AI模型的”最后一公里”落地。

那么千帆大模型平臺是怎么支撐如此多AI應用的呢?

答案是:讓CPU成為客戶的選擇之一,讓“效價比”的紅利普惠千行百業(yè)

wKgZomaOetyAKr_mAAL_mTnK4f0136.png

之所以如此,百度智能云所給出的解釋是:

wKgZomaOetyAYFp9AACKmCKKcxQ895.pngwKgaomaOet2AHDKAAARNlio5lno465.png

至于效果,以Llama-2-7B為例,在第四代英特爾? 至強? 可擴展處理器上輸出 Token 吞吐可達 100 TPS 以上,相比第三代提升了60%。

wKgZomaOet2ANHptAACDwqnjnlU607.png

Llama-2-7b模型輸出Token吞吐

在低延遲的場景,同等并發(fā)下,第四代至強? 可擴展處理器的首Token時延比第三代至強? 可降低50%以上。

在將處理器升級為第五代至強? 可擴展處理器之后,較上代的吞吐可提升45%左右,首 Token 時延下降50%左右。

wKgaomaOet2AStaMAACIYlSalt0058.png

Llama-2-7b模型首Token時延

并且千帆大模型平臺團隊根據(jù)實踐經(jīng)驗還表示:

wKgaomaOet2ACnd_AAAmm9ePFBs706.png

不僅如此,利用充足的CPU資源,降低對于AI加速卡的需求,從而降低 LLM 推理服務的總體擁有成本 (TCO),特別是在離線的 LLM 推理場景中表現(xiàn)出色。

而且在千帆大模型平臺上,可不止是有自家的ERNIE,還有很多主流的大模型都集成于此。

這也在一定程度上從側面印證了第五代英特爾? 至強? 可擴展處理器在性能上的過關。

wKgZomaOet2AUsiIAACusZarcTE137.png

英特爾第五代至強,如何讓性能和效率變得Pro Max?

百度智能云千帆大模型平臺,不止需要大模型推理一種工作負載,它其實是一個覆蓋大模型全生命周期的平臺。

具體來說,千帆大模型平臺提供數(shù)據(jù)標注,模型訓練與評估,推理服務與應用集成的全面功能服務,以及快速應用編排與插件集成,助力大模型多場景落地應用。這樣一來,比起專為大模型推理部署專用加速器,充分利用平臺已廣泛部署的CPU資源,就是更劃算的選擇了。

對于千帆大模型平臺上存在的大量離線大模型應用需求來說,如生成文章總結、摘要、評估多個模型的效果等,這類需求對推理的時延要求其實不高,但內存容易成為瓶頸。

采用CPU來做,擴展內存更方便,還可以利用起平臺閑時的算力資源,進一步提高資源利用率,起到降低總擁有成本的作用。

在這個大背景下,第五代英特爾? 至強? 可擴展處理器中的性能密集型通用計算應用負載(類似P Core性能核)的設計就尤為關鍵了。

與E Core(能效核)相比,P Core采用了追求性能最大化的設計,能承載非常重的負載,同時還兼顧了AI推理加速。

采用此設計的第五代至強? 可擴展處理器,在兼顧AI推理加速這一點上可不是說說而已,而是軟硬件協(xié)同優(yōu)化,各方面都考慮到位了。

硬件方面,英特爾? AMX(高級矩陣擴展)技術,正是為大模型推理重深度學習中大量的矩陣乘法運算專門優(yōu)化的,可以理解成”CPU 里的 Tensor Core”。

有了英特爾? AMX,處理器每個時鐘周期可完成高達2048個INT8運算,比上一代AVX512_VNNI指令提升8倍之多。

更重要的是,英特爾? AMX加速器是內置在CPU核心里的,讓矩陣存儲和運算更近,這一特性應用在大模型推理上,能夠降低處理下一個Token的時延,讓終端用戶的體驗更好。

wKgaomaOet2AetpmAAJlylTyJ58844.png

英特爾? AMX 可以更高效的實現(xiàn) AI 加速

軟件方面,百度智能云千帆大模型平臺已經(jīng)引入了針對英特爾? 至強? 可擴展平臺深度優(yōu)化的大模型推理軟件解決方案xFasterTransformer (xFT),并將其作為后端推理引擎。主要優(yōu)化策略如下:

  • 充分利用 AMX/AVX512 等指令集,高效實現(xiàn)核心算子如 Flash Attention 等
  • 采用低精度量化,降低數(shù)據(jù)訪存量,發(fā)揮 INT8/BF16 運算的優(yōu)勢
  • 支持超大規(guī)模模型的多機多卡并行推理
wKgZomaOet2ABPkEAAHM8sJbXQU525.png

英特爾? 至強? 可擴展處理器 LLM 推理軟件解決方案

最后還要補充的一點是,要知道選擇一種硬件平臺,不止關乎于設備本身的采購價格,還會影響到后續(xù)的維護成本,甚至人才儲備成本。

所以正如百度智能云所言,高性價比的算力基礎設施,與先進的大模型算法和平臺軟件相輔相成,讓上層的開發(fā)者們能夠更加平滑地應用,構建他們的業(yè)務,才能最大化云計算平臺的商業(yè)價值。

大模型時代,CPU大有可為

縱觀當下,大模型正從實驗室走向產業(yè),從少數(shù)人的“玩具”變?yōu)榇蟊娍捎玫摹肮ぞ摺薄?/p>

這意味著,大模型服務不僅要有優(yōu)秀的性能表現(xiàn),還要做到價格親民、部署便捷。一言以蔽之,“快好省”成了大模型商業(yè)化的關鍵一環(huán)。

而要實現(xiàn)“快好省”,算力基礎設施的選擇至關重要

傳統(tǒng)觀點認為,專用加速器才是AI的“標配”。但在供應緊張、成本高企的背景下,專用加速器的優(yōu)勢正在減弱。

相比之下,優(yōu)化良好的高端 CPU 不僅能提供足夠應對大模型推理的算力,而且具有更廣泛的部署基礎和更成熟的軟件生態(tài)、以及更好的安全保障,開始受到越來越多業(yè)界玩家的青睞。

以英特爾? 至強? 系列為代表的x86架構CPU,擁有成熟完善的軟件生態(tài)和廣泛的應用基礎。數(shù)以百萬計的開發(fā)者可以利用現(xiàn)有工具和框架,快速構建和優(yōu)化AI應用,而無需額外學習專門的加速器軟件棧,大大降低了開發(fā)難度和遷移成本。

同時,企業(yè)級用戶還可以利用CPU內置的多層次安全技術,實現(xiàn)從硬件到軟件的全棧保護,充分保障數(shù)據(jù)安全和隱私。這些優(yōu)勢,是當前專用加速器難以比擬的。

由此可見,充分利用CPU進行推理,讓AI從“燒錢游戲”變?yōu)椤捌栈菘萍肌?/strong>,正是AIGC產業(yè)應對算力門檻,推動規(guī)模化應用落地的關鍵一招。未來,隨著技術創(chuàng)新和生態(tài)完善,這一模式還將為更多企業(yè)創(chuàng)造價值,為產業(yè)發(fā)展注入新的動力。

除了直接加速推理任務外,CPU在完整的端到端AI管線中還能高效完成數(shù)據(jù)預處理、特征工程等AI全流程中的關鍵步驟。而支持機器學習和圖分析的各類數(shù)據(jù)庫,也主要是構建在CPU之上的。以至強? 可擴展處理器為例,除了英特爾? AMX之外,還有諸如英特爾? 數(shù)據(jù)保護與壓縮加速技術(英特爾? QAT)、英特爾? 存內分析加速器(英特爾? IAA)等一系列數(shù)據(jù)分析引擎內置于處理器中,通過卸載特定任務使CPU得到更好的利用,從而提升工作負載整體性能,實現(xiàn)數(shù)據(jù)分析加速。

由此可見,構建“快、準、穩(wěn)”的 AI 應用,既要靠專用加速器強大的算力,也離不開CPU超強的通用計算能力去釋放整個系統(tǒng)的潛力

為了科普CPU在AI推理新時代的玩法,量子位開設了《最“in”AI》專欄,將從技術科普、行業(yè)案例、實戰(zhàn)優(yōu)化等多個角度全面解讀。

我們希望通過這個專欄,讓更多的人了解CPU在AI推理加速,甚至是整個AI平臺或全流程加速上的實踐成果,重點就是如何更好地利用CPU來提升大模型應用的性能和效率。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11279

    瀏覽量

    224995
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301414
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5183
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    地平線HSD賦能iCAR V27:超強算力+真段式端到端,定義硬派SUV智駕標桿

    事業(yè)部總經(jīng)理蘇峻博士、地平線創(chuàng)始人兼CEO余凱博士亮相發(fā)布會,共同解讀這款家庭硬派SUV在多城市復雜場景下的路測實況,擬人絲滑的駕駛表現(xiàn)彰顯"第一梯隊"的領先水準。
    的頭像 發(fā)表于 03-03 16:03 ?3619次閱讀
    地平線HSD賦能iCAR V27:超強算力+真<b class='flag-5'>一</b>段式端到端,定義硬派SUV智駕標桿

    知行科技如何用小算力躋身第一梯隊

    當時當刻,量產Deadline、模型算法高上限低下限的特性,還有全行業(yè)追高階、追標配的焦灼氣氛都沉沉地壓在知行科技泊車團隊每個同學心頭,天還沒亮,每個人都在咬牙堅持。
    的頭像 發(fā)表于 12-25 09:21 ?472次閱讀

    融資超20億,這家“非GPU”芯片公司躋身國產AI算力第一梯隊

    電子發(fā)燒友報道(文/黃晶晶)谷歌 TPU 對英偉達 GPU 的直接競爭,引發(fā)市場廣泛關注。而如今,中國 AI 芯片領域也正加速布局,發(fā)力非GPU芯片突破。 ? 12月2日,非GPU賽道的核心AI芯片公司清微智能宣布完成超20億元人民幣 C 輪融資。 ? 本輪融資由北京市屬國企京能集團領投,北創(chuàng)投、建投投資、武岳峰科創(chuàng)、成都科創(chuàng)投、華泰紫金、智路資本、中南泊富、凱聯(lián)資本、圖靈資產、硬核堅果資本、拓鋒投資、米聚資本、允泰資本、和而泰、中科元創(chuàng)跟投,老
    的頭像 發(fā)表于 12-04 09:17 ?1.1w次閱讀
    融資超20億,這家“非GPU”芯片公司躋身<b class='flag-5'>國產</b>AI算力<b class='flag-5'>第一梯隊</b>

    重磅獎項!清微智能斬獲2025安博會大獎,夯實國產AI算力第一梯隊

    “這個裝置太酷!” “這才是科技之光!” “大家快來打卡!” 10月28日-31日,2025第二十屆中國國際社會公共安全博覽會(簡稱:CPSE安博會)在深圳舉行,現(xiàn)場包括合作伙伴和觀眾等數(shù)萬人都在
    的頭像 發(fā)表于 10-31 14:10 ?612次閱讀
    重磅獎項!清微智能斬獲2025安博會大獎,夯實<b class='flag-5'>國產</b>AI算力<b class='flag-5'>第一梯隊</b>

    廣汽集團榮獲第五屆中國質量獎提名獎

    近日,在中國質量(南京)大會上,第五屆中國質量獎評選結果正式揭曉。廣汽集團榮獲中國質量獎提名獎,彰顯中國質量第一梯隊實力。
    的頭像 發(fā)表于 09-18 11:01 ?924次閱讀

    2025年中國工業(yè)機器人產業(yè)區(qū)域競爭梯隊分析(圖)

    中國工業(yè)機器人區(qū)域競爭分三大梯隊第一梯隊長三角地區(qū)、珠三角地區(qū),憑借全產業(yè)鏈集群、技術人才密集、應用場景牽引及政策資本協(xié)同,領跑“產業(yè)規(guī)模與創(chuàng)新驅動”;第二梯隊京津冀地區(qū)、中西部地區(qū),依托科研資源
    的頭像 發(fā)表于 08-26 17:48 ?980次閱讀
    2025年中國工業(yè)機器人產業(yè)區(qū)域競爭<b class='flag-5'>梯隊</b>分析(圖)

    商湯大裝置躋身中國大模型推理算力廠商第一梯隊

    近日,IDC發(fā)布首個《2025中國大模型推理算力市場分析報告》。
    的頭像 發(fā)表于 08-14 09:29 ?4920次閱讀

    魔視智能入選世界經(jīng)濟論壇“全球創(chuàng)新者”

    魔視智能的技術創(chuàng)新能力成功躍升至代表全球前沿創(chuàng)新力量的第一梯隊,成為本年度中國唯入選的智能駕駛領域企業(yè)。
    的頭像 發(fā)表于 07-17 16:11 ?760次閱讀

    寶馬攜手Momenta共研中國專屬智能駕駛輔助系統(tǒng) 躋身智能駕駛體驗第一梯隊

    更貼近中國用戶:專為中國深度定制的智能駕駛輔助系統(tǒng),功能覆蓋高速及城區(qū)道路,全場景、點到點,AI大模型賦能,體化感知決策與自進化升級 安全機制完備:新代系統(tǒng)在設計上融入了寶馬20余年來在駕駛輔助
    的頭像 發(fā)表于 07-15 14:28 ?393次閱讀
    寶馬攜手Momenta共研中國專屬智能駕駛輔助系統(tǒng) 躋身智能駕駛體驗<b class='flag-5'>第一梯隊</b>

    破局時刻:大陸首款55A/-200V/50mΩ高壓MOSFET問世-VBP2205N

    半導體正式邁入“高壓低損”技術第一梯隊。 技術硬實力:為何VBP2205N是行業(yè)里程碑? 1. 參數(shù)對標國際巨頭,國產
    的頭像 發(fā)表于 05-29 17:44 ?968次閱讀
    破局時刻:大陸首款55A/-200V/50mΩ高壓MOSFET問世-VBP2205N

    鍵對焦+鍵調平,測量效率提升7倍 | 優(yōu)可測全新旗艦白光干涉儀發(fā)布

    測量精度小于1納米,性能進入全球一梯隊,優(yōu)可測旗艦白光干涉儀發(fā)布
    的頭像 發(fā)表于 03-27 11:03 ?1162次閱讀
    <b class='flag-5'>一</b>鍵對焦+<b class='flag-5'>一</b>鍵調平,測量效率提升7倍 | 優(yōu)可測全新旗艦白光干涉儀發(fā)布

    魔視智能攜手奇瑞汽車共筑智能駕駛新生態(tài)

    的先行者,奇瑞宣布將通過“全域智能”布局,加速向“全球信賴的智能出行生態(tài)引領者”轉型,推動中國智能汽車產業(yè)邁入全球第一梯隊
    的頭像 發(fā)表于 03-20 16:44 ?1015次閱讀

    商湯科技位列中國大模型應用市場領域第一梯隊

    國際權威咨詢機構IDC最新發(fā)布的《中國大模型應用市場份額,2024:格局巨變》報告顯示,2024年中國大模型應用市場規(guī)模達47.9億元人民幣,行業(yè)競爭格局經(jīng)歷重大變革。在眾多技術企業(yè)的激烈競爭中,商湯科技占據(jù)13.8%的市場份額進入前三,位列中國大
    的頭像 發(fā)表于 03-19 15:00 ?1587次閱讀

    商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結果顯示:在語言和多模態(tài)核心能力測評中,商湯“日日新”融合大模型斬獲國內第一梯隊成績。
    的頭像 發(fā)表于 03-18 10:35 ?1144次閱讀