国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

積算科技上線赤兔推理引擎服務,創新解鎖FP8大模型算力

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-07-30 21:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


北京2025年7月30日 /美通社/ -- 近日,北京積算科技有限公司(以下簡稱"積算科技")宣布其算力服務平臺上線赤兔推理引擎。積算科技PowerFul-AI應用開發平臺與赤兔合作,打造高性價比的模型輕量化部署方案。用戶通過遠程算力平臺預置的模型鏡像與AI工具,僅需50%的GPU算力即可解鎖大模型推理、企業知識庫搭建、智能體開發,加速大模型在智能問答、報告生成、客服助手、智能體等典型行業場景的落地。


赤兔推理引擎由北京清程極智科技有限公司(以下簡稱"清程極智")開發,并聯合清華大學團隊發布開源版本。其核心價值在于,打破了FP8模型原生部署時GPU必須支持FP8精度的要求。通過底層算子優化(如GeMM、MoE的指令級重構)和編譯技術創新,赤兔早在今年三月即首次實現在非FP8精度卡上原生運行FP8高精度模型,并確保推理過程幾乎零精度損失。

積算科技聯合清程極智,完成了赤兔推理引擎在積算科技PowerFul-AI應用開發平臺上的驗證測試。測試結果表明,赤兔推理引擎在積算科技PowerFul-AI平臺上運行穩定、性能表現優異,滿足雙方兼容性認證的各項標準,能夠快速完成DeepSeek、Qwen等大模型推理部署,并支持基于非FP8精度GPU卡實現FP8模型部署,相比于使用BF16精度部署,GPU算力需求減半。以部署DeepSeek-R1-671B為例,原需4臺8卡機2560GB顯存,現僅需2臺8卡機1280GB顯存即可滿足要求。

積算科技PowerFul-AI平臺攜手赤兔推理引擎,將為AI大模型應用開發打造"成本減半、零性能損耗"的解決方案,提供構建企業知識庫開發、智能體搭建等功能,助力企業用戶靈活快速構建大模型通用應用及個性化端到端解決方案。

PowerFul-AI是積算科技的大模型應用落地解決方案,能夠為AI大模型落地應用提供高效、易用、安全的端到端開發平臺,幫助企業及科研機構高效開發部署AI大模型應用。目前,PowerFul-AI已經全面適配DeepSeek R1、DeepSeek V3等模型。用戶只需選擇鏡像和模型文件,并配置模型所需的算力資源,即可快速完成模型部署,實現DeepSeek的"分鐘級"上線。

積算科技誕生于全球生成式AI浪潮,專注于智能算力服務市場,致力于成為中國最具價值的智能算力服務商,聚焦互聯網、運營商、高校、新能源汽車等領域的多家頭部客戶提供算力服務。公司擁有萬卡級先進智能算力資源池,提供裸金屬、智能算力系統、專屬智能算力系統等算力服務產品,適用于大模型訓練與推理、算法研究、大數據分析、自動駕駛、智能科學計算等多元場景。其運維和服務團隊具備大規模智能算力系統設計建設、大模型開發應用及性能優化能力,可提供全棧大模型應用開發服務支持,并根據客戶需求提供靈活服務模式。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39490

    瀏覽量

    300931
  • 大模型
    +關注

    關注

    2

    文章

    3621

    瀏覽量

    5141
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從訓練到推理:大模型需求的新拐點已至

    在大模型產業發展的早期階段,行業焦點主要集中在大模型訓練所需的投入。一個萬億參數大模型的訓練可能需要數千張GPU芯片連續運行數月,成本高
    的頭像 發表于 02-05 16:07 ?673次閱讀
    從訓練到<b class='flag-5'>推理</b>:大<b class='flag-5'>模型</b><b class='flag-5'>算</b><b class='flag-5'>力</b>需求的新拐點已至

    進迭時空發布新一代RISC-V AI CPU芯片,滿足端側大模型需求

    FP8數據精度原生AI推理,還是首顆完整支持芯片級虛擬化的RISC-V產品。 ? 硬件配置上,K3配備8顆高性能X100大核,主頻2.4GHz,單核性能與ARM A76相當,60TOPS的AI
    的頭像 發表于 01-30 14:06 ?8195次閱讀

    華為榮獲服務商互聯能力成熟度模型參編證書

    在2025互聯網大會期間,互聯網服務論壇在成都成功舉辦。論壇現場舉行了《
    的頭像 發表于 12-31 11:50 ?627次閱讀

    積木+3D堆疊!GPNPU架構創新,應對AI推理需求

    電子發燒友網報道(文/李彎彎)2025年,人工智能正式邁入應用推理時代。大模型從實驗室走向千行百業,推理需求呈指數級爆發。然而,高昂的推理成本與有限的
    的頭像 發表于 12-11 08:57 ?7794次閱讀

    湘軍,讓變成生產

    腦極體
    發布于 :2025年11月25日 22:56:58

    國產AI芯片真能扛住“內卷”?海思昇騰的這波操作藏了多少細節?

    反而壓到了310W。更有意思的是它的異構架構:NPU+CPU+DVPP的組合,居然能同時扛住訓練和推理場景,之前做自動駕駛算法時,用它跑模型時延直接降了20%。 但疑惑也有:這種
    發表于 10-27 13:12

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓練與推理所需的服務、數據服務和算法服務。AIDC采用異構計算架構,結
    的頭像 發表于 09-22 02:43 ?8295次閱讀

    杭州靈汐類腦智集群實現大模型快速推理

    據悉,“杭州靈汐類腦智集群”已于7月底實現了大模型快速推理API的企業服務試運行。該集群由杭州靈汐類腦科技有限公司牽頭搭建運營,中國電信、中國電子科技南湖研究院以及腦啟社區作為合作方
    的頭像 發表于 08-18 16:06 ?937次閱讀

    超低延時重構AI推理體驗!白山云發布“大模型API”產品

    優勢,打造超低延時、超穩定、簡單易用的API接口服務,降低大模型應用成本和開發門檻,助力企業和個人用戶快速開啟AI創新之旅。專注邊緣推理,構建“云邊端”
    的頭像 發表于 07-02 17:26 ?1124次閱讀
    超低延時重構AI<b class='flag-5'>推理</b>體驗!白山云發布“大<b class='flag-5'>模型</b>API”產品

    芯片的生態突圍與革命

    據的爆發式增長,大芯片已成為科技競爭的核心領域之一。 ? 大芯片的核心應用場景豐富多樣。在人工智能訓練與推理方面,大
    的頭像 發表于 04-13 00:02 ?3173次閱讀

    智能最具潛力的行業領域

    ?; 數據治理與聯合創新?:民生銀行與華為、阿里云等共建AI實驗室,通過“數據湖+模型體系”提升服務精準度?; 需求驅動?:金融大
    的頭像 發表于 04-11 08:20 ?1343次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業領域

    RAKsmart服務器如何重塑AI高并發格局

    在AI大模型參數量突破萬億級、實時推理需求激增的當下,傳統服務器架構的并發處理能力已逼近物理極限。RAKsmart通過“硬件重構+軟件定義”的雙引擎
    的頭像 發表于 04-03 10:37 ?882次閱讀

    摩爾線程GPU原生FP8計算助力AI訓練

    并行訓練和推理,顯著提升了訓練效率與穩定性。摩爾線程是國內率先原生支持FP8計算精度的國產GPU企業,此次開源不僅為AI訓練和推理提供了全新的國產化解決方案,更對推動國產GPU在AI大模型
    的頭像 發表于 03-17 17:05 ?1489次閱讀
    摩爾線程GPU原生<b class='flag-5'>FP8</b>計算助力AI訓練

    阿里最新消息:國家超互聯網平臺、廣州中心、多所高校接入通義千問大模型

    QwQ-32B是阿里通義團隊最新開源的推理模型。千問QwQ-32B發布后穩居全球最大AI開源社區HuggingFace趨勢榜榜首,成為當下最受歡迎的開源大模型。 廣州中心 接入阿里
    的頭像 發表于 03-14 11:54 ?1379次閱讀

    信而泰CCL仿真:解鎖AI極限,智中心網絡性能躍升之道

    引言 隨著AI大模型訓練和推理需求的爆發式增長,智中心網絡的高效性與穩定性成為決定AI產業發展的核心要素。信而泰憑借自主研發的 CCL(集合通信庫)評估工具 與 DarYu-X系列測試儀 ,為智
    的頭像 發表于 02-24 17:34 ?1279次閱讀
    信而泰CCL仿真:<b class='flag-5'>解鎖</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b>極限,智<b class='flag-5'>算</b>中心網絡性能躍升之道