国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GAITC2025|張科:端云一體大模型推理應用實戰

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2025-06-26 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,2025全球人工智能技術大會(GAITC2025)于杭州盛大開幕,匯聚全球頂尖科學家、技術領袖及行業先鋒,共同探討人工智能技術產業化新趨勢。京東零售AI Infra &大數據計算負責人張科受邀出席并在《行業大模型應用與發展》論壇發表演講,首次深入介紹京東零售在端云一體大模型推理架構的實戰經驗與技術探索,并分享AI推理方向的未來發展思考。以下為張科分享實錄,內容經編輯略有刪減:

電商場景AI推理的挑戰

大模型技術突飛猛進,大模型不僅是算法和算力的集合體,更是產業智能化的新底座,正在推動AI從“可用”向“好用、可控、可信”邁進。電商場景作為AI技術的應用場,逐步形成了三個主要的需求方向:

Generative AI

(如AI生成商品圖、短視頻、AI營銷內容生成、AI數字人)、

Agentic AI

(如AI客服與售后管理、AI經營托管、AI倉配優化 、AI交互式推薦)、

Physical AI

(如自動分揀機器人、智能空間、自動駕駛)。在復雜場景與多元需求的驅動下,AI推理正面臨一系列技術挑戰,包括輸入類型多樣、用戶需求優先級不同;端(如手機)和云(服務器)之間任務分配難、協同優化難;模型壓縮和性能優化等問題。

京東零售聯合清華大學推出 xLLM 端云一體大模型推理架構

2022年起,京東與清華大學開啟深度合作,在計算機視覺機器學習、推薦系統、大數據等領域聯合開展了十余項課題研究。今年雙方進一步拓展合作邊界,新增

大模型推理引擎國產化、多模態推薦大模型

等前沿方向,聚焦整合技術資源與學術優勢,共同探索前沿技術創新,推動科研成果向實際生產力轉化。自今年初大模型推理引擎國產化合作開展以來,京東零售和清華大學一起在大模型量化壓縮、端-云協同推理引擎等方向聯合攻堅,并提出“xLLM 端云一體大模型推理架構”,以解決推理引擎的性能優化問題、助力大模型技術在復雜電商環境的規模化落地。通過端云聯合部署,實現高效協同推理。利用終端用戶數據和反饋,云端模型持續優化并實時更新終端輕量化模型,形成閉環進化系統,提高模型在實際場景中的性能。該架構還可適應不同終端設備資源限制,實現大模型更廣泛復用。

xLLM端云一體大模型推理架構中的技術探索還表現在以下4個方面:

1.自適應調度優化:

動態調整Prefill與Decode節點比例,實現動態的自適應彈性PD能力。

2.在離線統一調度:

根據負載實時調度在離線請求,實現請求級別的在離線混部的能力。

3.多層流水線執行:

最大化資源利用率,通過調度和模型執行異步流水線、不同Layer的計算和通信異步流水線、不同計算單元、訪存并行流水線的多層流水線執行。

4.端云Agent協同:

端Agent處理簡單任務與隱私數據,云 Agent 不斷反饋優化,提升端 Agent 能力,并基于高效 Agent 協議協同。目前該推理架構已經在內部多個場景應用,在可交互式導購、商品對比、商品總結、購物建議等環節,大幅提升了響應速度,節省了計算成本,同時還有效助力了用戶的活躍度。在核心的商品理解環節,也有效提升了大模型的理解能力和信息處理能力,模型推理成本最高可節省70%。

AI推理方向的未來思考

在現有技術探索的基礎上,未來京東還將持續加大對國產 AI 基礎設施的投入力度,著力構筑自主可控的技術生態體系。京東將重點聚焦三大前沿方向展開深入研究:

破解規模、效率、成本的 “不可能三角”、推進(端云)多智能體異步自進化、端云分布式推理的可解釋和可調試

。通過上述布局,京東希望逐步實現主流國產芯片的深度適配優化,并基于自主研發的大模型推理框架,推動技術效率達到國際先進水平。也希望和業界同行共探技術邊界、一起前行。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301350
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265263
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5177
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科創達攜手亞馬遜科技推出一體化邊緣AI解決方案

    作為全球領先的智能操作系統和側智能技術提供商,中科創達始終致力于通過技術創新賦能產業升級。2026年1月8日, 中科創達(ThunderSoft)在拉斯維加斯CES現場發表演講,并攜手亞馬遜科技聯合發布
    的頭像 發表于 01-14 10:00 ?2019次閱讀

    華為舉辦數字政府應急行業小安大模型一體機推介會

    2025年9月18日,以“躍升行業智能化”為主題的華為全聯接大會2025在上海舉辦。期間,華為公司舉辦了數字政府應急行業“小安大模型一體機”推介會,北京安信創業信息科技發展有限公司總工
    的頭像 發表于 09-20 14:49 ?1432次閱讀

    解決方案 | 一體化OTA HIL測試解決方案

    TOSUN一體化OTAHIL測試解決方案隨著智能網聯汽車的快速發展,OTA(Over-the-Air)技術已成為車輛軟件升級的核心手段。為滿足日益嚴格的法規要求和技術挑戰,同星智能(TOSUN
    的頭像 發表于 09-19 20:03 ?970次閱讀
    解決方案 | <b class='flag-5'>云</b>管<b class='flag-5'>端</b><b class='flag-5'>一體</b>化OTA HIL測試解決方案

    迅為RK3568開發板模型推理測試實戰LPRNet?車牌識別

    迅為RK3568開發板模型推理測試實戰LPRNet 車牌識別
    的頭像 發表于 08-25 14:55 ?1309次閱讀
    迅為RK3568開發板<b class='flag-5'>模型</b><b class='flag-5'>推理</b>測試<b class='flag-5'>實戰</b>LPRNet?車牌識別

    華為亮相2025金融AI推理應用落地與發展論壇

    近日,2025金融AI推理應用落地與發展論壇在上海舉行。中國銀聯執行副總裁涂曉軍、華為數字金融軍團CEO曹沖出席本次論壇并發表致辭。論壇上,華為公司副總裁、數據存儲產品線總裁周躍峰博士發布AI推理
    的頭像 發表于 08-15 09:45 ?1218次閱讀

    利用NVIDIA推理模型構建AI智能

    開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務、網絡安全、制造、物流和機器人等領域的 AI 智能生成更明智的結果。
    的頭像 發表于 08-13 14:32 ?1584次閱讀
    利用NVIDIA<b class='flag-5'>推理模型</b>構建AI智能<b class='flag-5'>體</b>

    中國信通院發布“2025計算十大關鍵詞”

    、大模型工程化交付、大模型一體機、終端、智能混合卓越架構、央國企“
    的頭像 發表于 07-30 10:53 ?3162次閱讀
    中國信通院發布“<b class='flag-5'>2025</b><b class='flag-5'>云</b>計算十大關鍵詞”

    螞蟻數正式發布金融推理模型

    7月26日,以“智能時代,同球共濟”為主題的2025世界人工智能大會在上海開幕;亮點很多。我們看到在世界人工智能大會論壇上,螞蟻數正式發布了金融推理模型Agentar-Fin-R1
    的頭像 發表于 07-28 16:36 ?647次閱讀

    開普「開悟智核」:極致性價比的智能一體機,破局大模型應用難題

    當下,AI一體機憑借開箱即用、數據可控等優勢,成為行業大模型落地的重要載體之。然而實際應用時,用戶卻面臨諸多問題:算力成本與性能難以平衡;非滿血版模型存在“幻覺”、精度低等問題;由于
    的頭像 發表于 06-09 10:34 ?1097次閱讀
    開普<b class='flag-5'>云</b>「開悟智核」:極致性價比的智能<b class='flag-5'>體</b><b class='flag-5'>一體</b>機,破局大<b class='flag-5'>模型</b>應用難題

    DeepSeek賦能,大模型一體機破解企業AI落地難題

    數據訓練、模型部署等任務,確保敏感數據不外泄。 ? 其核心價值在于簡化部署流程、降低算力使用門檻,提升AI訓練與推理效率。據IDC報告,2025年中國AI大模型
    的頭像 發表于 06-09 07:13 ?6647次閱讀
    DeepSeek賦能,大<b class='flag-5'>模型</b><b class='flag-5'>一體</b>機破解企業AI落地難題

    首創開源架構,天璣AI開發套件讓側AI模型接入得心應手

    AI巨頭強強聯手,勢必為智能化AI體驗時代按下超級加速鍵。 AI終端的下步是“普適智能”,而不是“極限性能”。聯發憑借天璣9400+強悍的側AI能力,加上從
    發表于 04-13 19:52

    硅基覺醒已至前夜,聯發攜手生態加速智能化用戶體驗時代到來

    ,芯片能力的躍遷都是切的起點。從率先落地側AI大模型,到打造天璣AI智能化引擎,聯發
    發表于 04-13 19:51

    華為發布一體化網絡安全解決方案

    3月20日至21日,以“因聚而生 眾智有為”為主題的華為中國合作伙伴大會2025在深圳舉行。期間,華為數據通信產品線安全分銷領域總監峰在“華為坤靈直播間”面向中小企業發布
    的頭像 發表于 03-21 17:28 ?1988次閱讀

    中科曙光助力天翼打造“翼政通”大模型一體

    近來,DeepSeek系列模型在政務領域展現出強大的賦能潛力。天翼選擇曙光AI解決方案,憑借內置的DeepAI深算智能引擎,完成軟硬件適配與深度調優,聯合打造出“翼政通”大模型一體
    的頭像 發表于 03-13 11:35 ?1609次閱讀

    壁仞科技推出阿里QWQ-32B大模型一體

    能力等關鍵測試中展現出卓越性能。 作為國產AI算力重要推動力量,壁仞科技不斷測試與更新適配最先進大模型,聯合生態合作伙伴共同推出QWQ-32B大模型一體機。 在模型發布后數小時內,壁仞
    的頭像 發表于 03-10 09:05 ?1860次閱讀
    壁仞科技推出阿里QWQ-32B大<b class='flag-5'>模型</b><b class='flag-5'>一體</b>機