国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

攜程攜手英特爾優化AI推理性能,提升性能的同時降低TCO

英特爾中國 ? 來源:未知 ? 2023-06-09 20:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據文化和旅游部數據中心測算,2023年“五一”假期全國國內旅游出游合計2.74億人次,同比增長70.83%,按可比口徑恢復至2019年同期的119.09%1。后疫情時代,旅游人數的激增與旅游場景的多元化,給人工智能AI)技術在旅游行業的應用帶來更多機遇和挑戰。例如自然語言處理(NLP)、機器翻譯、計算機視覺、搜索排序等 AI 技術的快速發展和日臻成熟,可以為游客提供更便捷的服務和更精準的內容。

作為一站式旅行平臺,攜程旅行已經將諸多AI 技術應用于酒店、機票、自由行、跟團游、簽證、玩樂、租車等旅游度假的多個業務線,為全球用戶提供一套完整的旅行產品、服務及差異化的旅行內容等。為了在滿足業務需求的同時降低成本壓力,攜程構建了基于英特爾至強 可擴展處理器的 AI 推理算力平臺,并通過高性能算子庫、計算圖優化、模型壓縮等方式提升 AI 推理性能。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

采用英特爾 至強解決方案

實現性能與經濟性的更佳平衡

隨著 AI 應用的不斷擴展和深入,大型旅行服務平臺面臨的算力挑戰主要存在于兩個方面:

一方面,AI 技術正在日趨多樣化與復雜化,為了適應不同的業務場景需求,企業常常需要融合使用傳統機器學習、卷積神經網絡、Transformer 等深度學習模型結構,以及知識圖譜、圖神經網絡等技術。同時,AI模型的深度、寬度以及結構復雜度也在不斷提升,增加了企業的開發門檻,也使得 AI算力調度、AI 性能優化更具挑戰。

另一方面,智能化應用正在迅速擴張,需要由 AI 模型處理的數據也在不斷增長。例如內容與廣告個性化推薦、實時風控、機器翻譯、智能客服、圖像處理等領域正在越來越多地使用 AI 技術,以從海量的數據中生成高價值的商業洞察,從而帶來了較高的算力基礎設施建設成本。與此同時,上層應用對于 AI 模型推理也有著特定的服務級別協議 (SLA) 要求。企業需要在滿足 SLA 要求的前提下,通過模型優化等方式,更好地發揮硬件的性能潛力,降低算力基礎設施的總體擁有成本(TCO)。

面對上述挑戰,企業首先要面臨硬件平臺的選擇問題:雖然基于獨立 GPU 的推理方案能夠提供強大的算力,但未必是一個經濟的選擇。這是因為獨立 GPU 不僅采購或租用成本相對較高,而且通常是以專用服務器的模式進行部署和運維,帶來了較高的綜合成本。考慮到旅行服務中大量的 AI 推理場景所需要的性能經過優化能夠得到滿足,采用 CPU 的方案將更具成本效益。因此,攜程采用基于英特爾至強 可擴展處理器的 AI 推理算力平臺,旨在為算法模型提供更全面易用、穩定性更好、使用和維護成本更低的優化解決方案。 英特爾至強 可擴展處理器內置人工智能加速功能,已針對工作負載進行優化,能夠為各種AI 應用以及高密度基礎設施帶來一流的性能和內存帶寬。同時,采用矢量神經網絡指令(VNNI) 的英特爾 深度學習加速(英特爾DL Boost),能夠有效提高 AI 推理的表現,使其成為深度學習應用的卓越基礎設施。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

構建并優化AI推理算力平臺

Bert-base推理時間由15毫秒降至6毫秒

在基于英特爾 至強 可擴展處理器的硬件平臺層基礎上,攜程構建了 AI 推理算力平臺,該平臺還包括引擎框架層、推理優化層、算法模型、應用場景。同時,為了盡可能地提升 AI 推理性能,釋放硬件潛力,攜程進行了推理優化。主要的優化思路為兩點:一是通過調整/簡化模型結構,或改進算法以降低算法復雜度;二是優化軟件執行效率,使用硬件優勢特征,提升硬件執行效率。 2d17463e-06be-11ee-962d-dac502259ad0.png

攜程基于英特爾 至強 可擴展處理器的硬件平臺層基礎上

構建 AI 推理算力平臺

攜程以機器翻譯應用的 Transformer模型來測試其性能表現。在該測試中,攜程除了使用上述的優化方法,還分割模型并使用 jit 跟蹤方法來提高性能。同時,在batchsize 超過 16 個的情況下,使用 mm op 進行優化。攜程使用固定算例的平均響應時延作為測試數據,tokens 為 10,batchsize=1,Bert-base模型推理時間由優化前的15.05毫秒降至優化后的6.44毫秒2 2d238bec-06be-11ee-962d-dac502259ad0.png

Bert-base 模型優化前后的性能對比2

基于英特爾 至強 可擴展平臺的基礎算力和深度的 AI 模型推理性能優化,用戶將獲得的收益包括:在特定的 SLA 要求下,降低 AI 推理應用的 TCO

在通過本輪優化之后,攜程的 CPU 服務器 AI 推理性能得到提升,能夠滿足大量 AI 推理場景對于時延等 SLA 指標的要求,避免了在昂貴的專用 AI 加速器方面的支出。

提升基礎設施的敏捷性與靈活性

通過本輪優化,攜程能夠高效利用現有的 CPU 服務器,根據實際負載需求進行靈活調度,而無需為 AI 推理新增需求部署專用服務器。

為 AI 推理性能優化提供了標準的參考流程

本方案提供了一套標準、可自動完成的參考模型優化流程,能夠賦能更多的 AI 應用。

攜程與英特爾的合作,驗證了 AI 模型推理方案在英特爾 至強 可擴展處理器上的應用潛力,在成本、性能方面實現了平衡。同時,隨著推理性能優化技術的逐步提高,將極大地降低人工智能應用的部署成本,加快AI應用的落地速度并擴充應用場景,推動人工智能行業的整體發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10301

    瀏覽量

    180455
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11279

    瀏覽量

    225000

原文標題:攜程攜手英特爾優化AI推理性能,提升性能的同時降低TCO

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    打造智算基石:英特爾攜手本土生態發布全域液冷服務器

    路冷板式全域液冷服務器。該創新方案由全本地生態賦能,實現了關鍵熱源的高比例液冷覆蓋,在提升可靠性與能效的同時,顯著降低能耗與運維成本,為數據中心散熱與能效樹立全新標桿。 英特爾數據中心
    的頭像 發表于 11-20 14:31 ?426次閱讀
    打造智算基石:<b class='flag-5'>英特爾</b><b class='flag-5'>攜手</b>本土生態發布全域液冷服務器

    英特爾本地生態伙伴發布雙路冷板式全域液冷服務器,引領數據中心散熱與能效革新

    1月19日,在重慶舉辦的2025英特爾技術創新與產業生態大會上,英特爾攜手本地生態伙伴——新華三、英維克、憶聯及國內領先內存廠商,發布了基于英特爾?至強?6900系列
    發表于 11-19 21:21 ?1570次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>攜</b>本地生態伙伴發布雙路冷板式全域液冷服務器,引領數據中心散熱與能效革新

    通過NVIDIA Jetson AGX Thor實現7倍生成式AI性能

    Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構的新 NVFP4 格式,有助于進一步優化推理性能。該平臺同時支持推測解碼等新技術,為在邊緣端加速生成式
    的頭像 發表于 10-29 16:53 ?1431次閱讀

    發力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展

    英特爾發布了面向專業的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優勢?在支持AI推理工作站和大模型部署上,B60有哪些獨到之處?10月16日
    的頭像 發表于 10-22 13:40 ?1.1w次閱讀
    發力圖形工作站和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市場,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    使用NVIDIA NVLink Fusion技術提升AI推理性能

    本文詳細闡述了 NVIDIA NVLink Fusion 如何借助高效可擴展的 NVIDIA NVLink scale-up 架構技術,滿足日益復雜的 AI 模型不斷增長的需求。
    的頭像 發表于 09-23 14:45 ?927次閱讀
    使用NVIDIA NVLink Fusion技術<b class='flag-5'>提升</b><b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現已為DeepSeek-V3.1提供深度優化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實現從模型訓練的深度突破
    的頭像 發表于 08-26 19:18 ?3027次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E <b class='flag-5'>AI</b>加速器為DeepSeek-V3.1提供加速支持

    華為亮相2025金融AI推理應用落地與發展論壇

    創新技術——UCM推理記憶數據管理器,旨在推動AI推理體驗升級,提升推理性價比,加速AI商業正循
    的頭像 發表于 08-15 09:45 ?1224次閱讀

    直擊Computex 2025:英特爾重磅發布新一代GPU,圖形和AI性能躍升3.4倍

    電子發燒友原創? 章鷹 5月19日,在Computex 2025上,英特爾發布了最新全新圖形處理器(GPU)和AI加速器產品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾
    的頭像 發表于 05-21 00:57 ?7477次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    直擊Computex2025:英特爾重磅發布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發布了最新全新圖形處理器(GPU)和AI加速器產品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發表于 05-20 12:27 ?5447次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    英特爾發布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業工作站量身定制的配置,擴展了英特爾銳炫Pro產品系列。 英特爾 ? Gaudi 3 AI 加速
    發表于 05-20 11:03 ?1845次閱讀

    Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代

    與戰略調整收購背景:2015年,英特爾斥資167億美元收購Altera,意圖通過FPGA技術強化AI、邊緣計算等新興領域布局,但收購后未能實現預期協同效應。戰略調整:2025年,英特爾宣布以87.5億
    發表于 04-25 10:19

    1.9倍性能提升英特爾至強6在MLPerf基準測試中表現卓越

    關鍵項目中,性能表現卓越。測試結果顯示,相較于上一代產品,該處理器的AI性能實現了高達1.9倍的顯著提升,這也充分顯示了至強6處理器作為現代AI
    的頭像 發表于 04-07 10:58 ?676次閱讀

    英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理器對比上代Meteor Lake,升級了模塊化結構、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調度器、Xe2微架構銳炫GPU、第四代NPU等,由此也帶來了CPU
    的頭像 發表于 04-02 15:47 ?1486次閱讀
    在<b class='flag-5'>英特爾</b>酷睿Ultra <b class='flag-5'>AI</b> PC上部署多種圖像生成模型

    微星英特爾為玩家打造非凡游戲體驗,兩款泰坦家族新品均搭載全新英特爾酷睿Ultra HX處理器

    3月29日,在英特爾酷睿Ultra 200HX新品分享會上,搭載該處理器的高性能筆記本齊聚一堂,英特爾攜手生態合作伙伴致力于以創新技術滿足用戶的多樣需求,并加速
    的頭像 發表于 04-02 09:37 ?1326次閱讀

    英特爾展示基于至強6處理器的基礎網絡設施

    ; 與5G核心網解決方案合作伙伴的深度合作,加快了英特爾至強6能效核處理器在整個生態系統中的應用; 基于5G核心網工作負載的獨立驗證確認了英特爾至強6能效核處理器機架性能的提高、能耗的降低
    的頭像 發表于 03-08 09:24 ?1053次閱讀