国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾AMX助華棲云多場景AI推理性能大幅提升多達96倍

英特爾中國 ? 來源:英特爾中國 ? 2024-01-13 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI技術應用已經深入到各行各業,特別是云服務提供商將AI能力集成到云服務中,能夠更好地滿足用戶對性能、效率和體驗的需求。而在主流媒體全面進入互聯網陣地的大趨勢下,媒體行業面臨融合、高效、智能化的挑戰。成都華棲云科技有限公司(簡稱:華棲云)正是這樣一家面向蓬勃興起的泛媒體、大視頻時代的企業用戶市場,為用戶提供媒體云服務的提供商。

為了給用戶帶來更加智慧的應用體驗,大幅提升內容來源的寬度,內容生產的速度、內容發布的廣度,華棲云媒體云平臺正在集成廣泛的AI技術,推動光學字符識別(OCR) 識別、圖像超分修復、人體姿態識別、大型語言模型 (LLM) 等應用的落地。

對于最終用戶而言,這些 AI 技術對于媒體云基礎設施帶來了 AI 推理等方面的算力挑戰,用戶需要通過高性能、低成本、高靈活度的算力方案,來滿足實際應用的嚴苛需求。于是,華棲云與英特爾合作,在媒體云平臺上驗證了第四代英特爾至強可擴展處理器及其內置的英特爾高級矩陣擴展(英特爾AMX)加速器。驗證結果顯示,在英特爾AMX 的加持下,第四代英特爾至強可擴展處理器可顯著提升大型語言模型、人體姿態識別、CLIP 圖像文本分類處理模型、OCR 識別、圖像超分修復等模型的推理能力,提供了高性價比、高靈活性的 AI 基礎設施構建選項。

英特爾AMX及CPU大模型推理與主流GPU性能一致

華棲云之所以選擇基于英特爾 CPU 的 AI 推理方案,是因為該方案能夠充分利用媒體云已有的服務器資源,在架構上無需進行大幅變動,性價比較高,且在性能上足以滿足智能資源管理、智能審核、智能生產等場景所需。

現在,AIGC技術得到越來越多應用。華棲云同樣采用了基于大語言模型的 AIGC 技術,使智能媒體云平臺能夠自動進行要點歸納及內容創作、改寫,做到一課一虛擬助教,提高師生教學互動能力。此外,AIGC 技術還能用于課程內容識別理解等更多場景,帶來智慧教育新體驗。所以,大語言模型的推理能力對于華棲云至關重要。

華棲云采用內置AI加速器英特爾AMX的第四代英特爾至強可擴展處理器,在大語言模型推理性能上表現出強勁實力。在華棲云的測試中,對比了某主流 GPU 與第四代英特爾至強可擴展處理器的大語言模型推理性能,測試數據如圖1 所示,兩者性能基本保持在同一層面。這得益于英特爾AMX 針對廣泛的硬件和軟件優化,通過提供矩陣類型的運算,顯著增加了人工智能應用程序的每時鐘指令數 (IPC),可為 AI 工作負載中的訓練和推理上提供顯著的性能提升。從而使華棲云使用CPU不額外增加成本的情況下,獲得了同樣的AI推理性能。

70fe09d6-b1b9-11ee-8b88-92fbcf53809c.png

圖1:大語言模型推理性能測試1

英特爾助華棲云多個AI推理場景性能大幅提升

除了大語言模型推理之外,華棲云多項AI推理性能均在英特爾至強可擴展處理器和英特爾AMX的加持下得到顯著提升。

第一,對比語言圖像預訓練 (CLIP)是一種在各種(圖像、文本)對上訓練的神經網絡,可以用自然語言指示它在給定圖像的情況下推理最相關的文本片段,而無需直接針對任務進行優化。在媒體云平臺場景中,CLIP 不僅提供了先進的圖像分類結果,而且還提供了對象分類、視頻中的動作識別和 OCR 等其他視覺任務。CLIP 有助于媒體云平臺在不構建巨大數據集的前提下,訓練高質量的模型,同時降低計算成本。

華棲云 CLIP 算法推理性能測試數據如圖 2 所示,在將模型轉化為BF16 后,第四代英特爾至強可擴展處理器的 CLIP 推理性能相較第二代英特爾至強可擴展處理器最高提升了 95.63 倍2。

711d3d2e-b1b9-11ee-8b88-92fbcf53809c.png

圖2:華棲云 CLIP 算法推理性能測試3

第二,OCR 識別在媒體云平臺中,常用于圖像中的信息提取,如課件識別、版面識別、試卷識別等。華棲云在測試中,對比了第二代英特爾至強可擴展處理器與第四代英特爾至強可擴展處理器的單線程吞吐性能差異。測試數據如圖 3 所示,對比第二代英特爾至強可擴展處理器,第四代英特爾至強可擴展處理器的性能最高可提升約 6.41 倍4。

7131926a-b1b9-11ee-8b88-92fbcf53809c.png

圖3:OCR 單線程吞吐測試5

第三,超分辨率 (Super-Resolution) 是指通過硬件或軟件的方法提高原有圖像的分辨率,超分辨率算法有效提高放大后圖像的質量,同時節約帶寬、存儲等方面的資源。ESRGAN 是一種基于生成對抗網絡 (GAN) 的圖像超分辨率算法,其主要思想是通過學習低分辨率 (LR) 圖像與其高分辨率 (HR) 對應物之間的映射,來實現從 LR 圖像到 HR 圖像的映射過程,從而實現圖像的超分辨率。SwinIR 則是一種基于 Swin Transformer 的圖像超分辨率重建算法,相對于傳統的 Transformer 模型,在處理圖像等二維數據時,具有更好的并行性和更高的計算效率。

華棲云測試了第二代/第四代英特爾至強可擴展處理器在ESRGAN 算法推理中的性能表現,測試數據如圖 4 所示,在將模型轉化為 BF16 后,第四代英特爾至強可擴展處理器的ESRGAN 推理性能相較第二代英特爾至強可擴展處理器最高提升了 3 倍6。

7147808e-b1b9-11ee-8b88-92fbcf53809c.png

圖4:ESRGAN 算法吞吐性能測試7

SwinIR 模型推理性能測試數據如圖 5 所示,在將模型轉化為BF16 后,第四代英特爾至強可擴展處理器的 SwinIR 推理性能相較第二代英特爾至強可擴展處理器最高提升了 7.4 倍8。

7156acda-b1b9-11ee-8b88-92fbcf53809c.png

圖5:SwinIR 模型推理性能測試9

第四,人體姿態識別算法能夠通過圖像獲取并識別人體骨架信息,通過算法判斷動作類別和姿態,從而實現動作識別。華棲云在智能媒體云平臺中采用了基于 OpenPose 方法與 EfficientHRNet 方法的多人 2D 姿勢估計網絡,針對圖像中的每個人,網絡都會檢測到一個人體姿勢:一個由關鍵點和關鍵點之間的連接組成的身體骨架。

華棲云基于 OpenPose 方法的人體姿態識別算法推理性能測試數據如圖 6 所示,在將模型轉化為 BF16 后,第四代英特爾至強可擴展處理器的 OpenPose 推理性能相較第二代英特爾至強可擴展處理器最高提升了 64.82 倍10。

7170307e-b1b9-11ee-8b88-92fbcf53809c.png

圖6:基于 OpenPose 方法的人體姿態識別推理性能測試11

基于CPU的AI推理方案為華棲云降低TCO并增加靈活性

在采用內置了英特爾AMX 的第四代英特爾至強可擴展處理器之后,華棲云提升了多種典型算法的推理性能,滿足了教育、廣電等客戶對于智能媒體云平臺的性能要求,為客戶帶來以下價值:

在保證模型精度的前提下,顯著提升多個 AI 模型的性能表現,有助于提供更加高效的智能媒體云服務; 通過軟件優化充分釋放了硬件潛力,支持有效利用服務器資源,無需獨立、專用的 AI 加速器,有助于降低媒體云平臺構建的 TCO; 通用的 CPU 平臺不僅能夠高效支撐 AI 推理,而且能夠靈活應對編解碼、轉碼等負載,更具可擴展性。

AIGC 等AI技術的應用正在為媒體行業注入充沛的活力,推動媒體行業的智能化轉型。華棲云以超高清智能媒體處理云平臺為驅動引擎,在泛媒體、大教育、政企等行業形成了成熟的云服務及云解決方案。通過與英特爾合作,并利用英特爾AMX 等創新技術,華棲云正在推動新一代智能融媒體平臺覆蓋媒體內容生產、管理、發布、運營和數據化管理全流程應用。

英特爾AMX及英特爾至強可擴展處理器以不遜于GPU的AI推理性能,為華棲云降低了云平臺TCO的同時,提供了更大的靈活性和擴展性,支持華棲云智能媒體云平臺以新思維、新技術重塑媒體全鏈路生產與運營模型,建立集內容、產品、用戶、數據一體的全媒體融合運營體系,實現媒體基于內容的價值再造。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252322
  • 英特爾
    +關注

    關注

    61

    文章

    10301

    瀏覽量

    180465
  • OCR
    OCR
    +關注

    關注

    0

    文章

    175

    瀏覽量

    17203
  • ai技術
    +關注

    關注

    1

    文章

    1313

    瀏覽量

    25749
  • AI加速器
    +關注

    關注

    1

    文章

    73

    瀏覽量

    9488

原文標題:英特爾? AMX 助華棲云多場景 AI 推理性能大幅提升,最多達 96 倍

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英特爾創新引領AI NAS:軟硬結合引領本地數據智慧管理與場景創新應用

    展示面向中小企業、消費者和專業用戶,賦能新場景、加速產品落地的最新技術方案。會上,綠聯、極空間、鐵威馬、暢網、飛牛等AI NAS 廠商,發布和展示了一系列基于英特爾? 酷睿? Ultra處理器和
    的頭像 發表于 12-12 15:45 ?489次閱讀
    <b class='flag-5'>英特爾</b>創新引領<b class='flag-5'>AI</b> NAS:軟硬結合引領本地數據智慧管理與<b class='flag-5'>多</b><b class='flag-5'>場景</b>創新應用

    發力AI超節點和AI推理服務器,勤技術重磅亮相英特爾大會

    電子發燒友原創 章鷹 近日,在2025英特爾技術創新大會上,勤技術數據事業部總經理程勵之指出,AI算力需求激增,萬億級模型參數需要GPU高帶寬互聯,超節點已經成為產業共識,但是落地
    的頭像 發表于 12-07 05:59 ?1.1w次閱讀
    發力<b class='flag-5'>AI</b>超節點和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務器,<b class='flag-5'>華</b>勤技術重磅亮相<b class='flag-5'>英特爾</b>大會

    發力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展

    英特爾發布了面向專業的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優勢?在支持AI推理工作站和大模型部署上,B60有哪些獨到之處?10月16日
    的頭像 發表于 10-22 13:40 ?1.1w次閱讀
    發力圖形工作站和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市場,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    到端:英特爾展示全棧AI能力,覆蓋、邊、PC場景

    2025年9月25日,杭州——今日,在2025云棲大會上,英特爾與阿里帶來了多項基礎設施創新成果,包括兼容代際服務器(支持第五代英特爾
    的頭像 發表于 09-26 17:27 ?1544次閱讀
    從<b class='flag-5'>云</b>到端:<b class='flag-5'>英特爾</b>展示全棧<b class='flag-5'>AI</b>能力,覆蓋<b class='flag-5'>云</b>、邊、PC<b class='flag-5'>多</b><b class='flag-5'>場景</b>

    華為亮相2025金融AI推理應用落地與發展論壇

    創新技術——UCM推理記憶數據管理器,旨在推動AI推理體驗升級,提升推理性價比,加速AI商業正循
    的頭像 發表于 08-15 09:45 ?1228次閱讀

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    、資源分配的最優策略建議,減少資源浪費,提升整體網絡效率。 客戶實證:AI推理引擎的精準力量某大型政務平臺遭遇核心業務運行緩慢問題,初步懷疑網絡帶寬不足。在利用信而泰xnSight
    發表于 07-16 15:29

    英特爾發布邊緣AI控制器與邊緣智算一體機,創造“AI新視界”

    處理器的邊緣 AI 控制器 和 基于英特爾銳炫 ? 顯卡的邊緣智算一體機 ,為工業AI的規模化落地注入強勁動力。 英特爾與諾達佳聯合發布邊緣AI
    發表于 06-24 17:50 ?1517次閱讀
    <b class='flag-5'>英特爾</b>發布邊緣<b class='flag-5'>AI</b>控制器與邊緣智算一體機,創造“<b class='flag-5'>AI</b>新視界”

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    CTO、高級首席AI工程師張宇博士 英特爾客戶端計算事業部邊緣計算CTO、高級首席AI工程師張宇博士在MWC AI終端峰會上指出,邊緣將崛起為AI
    的頭像 發表于 06-20 17:32 ?896次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發布新一代GPU,圖形和AI性能躍升3.4

    電子發燒友原創? 章鷹 5月19日,在Computex 2025上,英特爾發布了最新全新圖形處理器(GPU)和AI加速器產品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾
    的頭像 發表于 05-21 00:57 ?7478次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4<b class='flag-5'>倍</b>

    直擊Computex2025:英特爾重磅發布新一代GPU,圖形和AI性能躍升3.4

    5月19日,在Computex 2025上,英特爾發布了最新全新圖形處理器(GPU)和AI加速器產品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發表于 05-20 12:27 ?5452次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4<b class='flag-5'>倍</b>

    英特爾發布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業工作站量身定制的配置,擴展了英特爾銳炫Pro產品系列。 英特爾 ? Gaudi 3 AI 加速
    發表于 05-20 11:03 ?1845次閱讀

    1.9性能提升英特爾至強6在MLPerf基準測試中表現卓越

    關鍵項目中,性能表現卓越。測試結果顯示,相較于上一代產品,該處理器的AI性能實現了高達1.9的顯著提升,這也充分顯示了至強6處理器作為現代
    的頭像 發表于 04-07 10:58 ?677次閱讀

    英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理器對比上代Meteor Lake,升級了模塊化結構、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調度器、Xe2微架構銳炫GPU、第四代NPU等,由此也帶來了CPU
    的頭像 發表于 04-02 15:47 ?1486次閱讀
    在<b class='flag-5'>英特爾</b>酷睿Ultra <b class='flag-5'>AI</b> PC上部署多種圖像生成模型

    英特爾發布最強大的商用AI PC產品陣容

    處理器。在臺式機和移動設備形態中,該產品組合為全球企業提供包含計算性能、能效、連接性、安全性和可管理性的全面解決方案。 如今是PC更新換代的關鍵節點,憑借英特爾?酷睿?Ultra處理器(第二代),我們為客戶帶來了
    的頭像 發表于 03-08 09:28 ?1186次閱讀

    英特爾展示基于至強6處理器的基礎網絡設施

    ? 集成AI功能的英特爾至強6系統級芯片,與前幾代產品相比,可帶來高達2.4的無線接入網(RAN)容量提升1,和70%的每瓦性能
    的頭像 發表于 03-08 09:24 ?1054次閱讀