国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-04-28 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言模型推理。

Phi-3 Mini 與 10 倍之于其大小的模型能力不相上下。不同于僅用于研究的 Phi-2,Phi-3 Mini 不僅可以用于研究,同時還可以用于多種商業用途。搭載 NVIDIA RTX GPU 的工作站或搭載 GeForce RTX GPU 的 PC 可以使用 Windows DirectML 或 TensorRT-LLM 在本地運行該模型。

該模型有 38 億個參數,在 512 個 NVIDIA Tensor Core GPU 上使用 3.3 萬億個 token 訓練而成,僅耗時七天時間。

Phi-3 Mini 有兩個版本,一個版本支持 4K token,另一個版本支持 128K token,是同類模型中第一個支持超長上下文的模型。因此,開發者在向該模型提問時,可以使用 128,000 個 token(模型能夠處理的最小語言單位),使模型能夠做出更加符合現實的回答。

開發者可以在 ai.nvidia.com上試用帶有 128K 上下文窗口的 Phi-3 Mini。該模型被打包成 NVIDIA NIM,這是一項帶有標準應用編程接口的微服務,可以部署在任何位置。

在邊緣高效運行

自主機器人和嵌入式設備開發者可以通過社區教程(如 Jetson AI Lab)學習創建和部署生成式 AI,并在 NVIDIA Jetson 上部署 Phi-3。

Phi-3 Mini 模型只有 38 億個參數,非常小巧緊湊,可以在邊緣設備上高效運行。參數就像內存中的旋鈕,可在模型訓練過程中進行精確的調整,使模型能夠對輸入的提示做出高度準確的響應。

Phi-3 可以在成本和資源受限的用例中提供幫助,尤其是較簡單的任務。該模型在關鍵語言基準測試中的表現優于一些較大的模型,同時在滿足延遲要求的情況下給出結果。

TensorRT-LLM 將支持 Phi-3 Mini 的長上下文窗口,并使用 LongRoPE、FP8/飛行批處理等眾多優化措施和內核來提高推理吞吐量,減少延遲。TensorRT-LLM 的應用很快將在 GitHub 上的示例文件夾中提供。

開發者可以轉換為 TensorRT-LLM 檢查點格式,該格式針對推理進行了優化,可以輕松地與 NVIDIA Triton 推理服務器一起部署。

開發開放式系統

NVIDIA 是開源生態系統的積極貢獻者,已經發布了 500 多個帶有開源許可證的項目。

NVIDIA 為 JAX、Kubernetes、OpenUSD、PyTorch 和 Linux 內核等眾多外部項目做出了貢獻,還為各種開源基金會和標準機構提供支持。

此次發布建立在 NVIDIA 與微軟深厚的合作基礎上,雙方的合作為加速 DirectML、Azure 云、生成式 AI 研究以及醫療和生命科學等領域的創新鋪平了道路。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31074

    瀏覽量

    222189
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109721
  • 嵌入式設備
    +關注

    關注

    0

    文章

    121

    瀏覽量

    17714
  • GPU芯片
    +關注

    關注

    1

    文章

    307

    瀏覽量

    6516
  • 大模型
    +關注

    關注

    2

    文章

    3649

    瀏覽量

    5179

原文標題:小巧而強大:NVIDIA 加速微軟 Phi-3 開源“小語言模型”

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發

    新聞摘要 : l NVIDIA 率先發布為應對輔助駕駛長尾場景挑戰而設計的開源視覺-語言-動作推理模型(Reasoning VLA);NVIDIA
    的頭像 發表于 01-06 09:40 ?379次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列<b class='flag-5'>開源</b> AI <b class='flag-5'>模型</b>與工具,<b class='flag-5'>加速</b>安全可靠的推理型輔助駕駛汽車開發

    NVIDIA推動面向數字與物理AI的開源模型發展

    NVIDIA 發布一系列涵蓋語音、安全與輔助駕駛領域的全新 AI 工具,其中包括面向移動出行領域的行業級開源視覺-語言-動作推理模型(Reasoning VLA)
    的頭像 發表于 12-13 09:50 ?1331次閱讀

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助
    的頭像 發表于 12-01 09:25 ?1131次閱讀

    NVIDIA推出面向語言、機器人和生物學的全新開源AI技術

    NVIDIA 秉持對開源的長期承諾,推出了面向語言、機器人和生物學的全新開源 AI 技術,為構建開源生態系統做出貢獻,擴展 AI 的普及并推
    的頭像 發表于 11-06 11:49 ?1064次閱讀

    NVIDIA宣布開源Aerial軟件

    NVIDIA 開源其 Aerial 軟件,并將 NVIDIA Sionna 研究套件和 Aerial 測試平臺引入 NVIDIA DGX Spark 平臺,為研究人員提供強大的工具和便
    的頭像 發表于 11-03 15:14 ?909次閱讀

    NVIDIA ACE現已支持開源Qwen3-8B小語言模型

    為助力打造實時、動態的 NPC 游戲角色,NVIDIA ACE 現已支持開源 Qwen3-8B 小語言模型(SLM),可實現 PC 游戲中的
    的頭像 發表于 10-29 16:59 ?1223次閱讀

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應用開發者都可以構建并部署帶有先進動畫的高精度角色。NVIDIA
    的頭像 發表于 10-21 11:11 ?817次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>開源</b>Audio2Face<b class='flag-5'>模型</b>及SDK

    NVIDIA 利用全新開源模型與仿真庫加速機器人研發進程

    科研人員及開發者打造功能更強大、適應性更強的機器人。 ? 全新的 NVIDIA Isaac GR00T 開源基礎模型將為機器人賦予接近人類的推理能力,使其能夠拆解復雜指令,并借助已有知識與常識執行任務
    的頭像 發表于 09-30 09:52 ?3069次閱讀
    <b class='flag-5'>NVIDIA</b> 利用全新<b class='flag-5'>開源</b><b class='flag-5'>模型</b>與仿真庫<b class='flag-5'>加速</b>機器人研發進程

    NVIDIA RTX AI加速FLUX.1 Kontext現已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma
    的頭像 發表于 07-16 09:16 ?2046次閱讀

    歐洲借助NVIDIA Nemotron優化主權大語言模型

    NVIDIA 正攜手歐洲和中東的模型構建商與云提供商,共同優化主權大語言模型 (LLM),加速該地區各行業采用企業級 AI。
    的頭像 發表于 06-12 15:42 ?1178次閱讀

    NVIDIA攜手微軟加速代理式AI發展

    代理式 AI 正在重新定義科學探索,推動各行各業的研究突破和創新發展。NVIDIA微軟正通過深化合作提供先進的技術,從云到 PC 加速代理式 AI 應用的發展。
    的頭像 發表于 05-27 14:03 ?1033次閱讀

    NVIDIA使用Qwen3系列模型的最佳實踐

    阿里巴巴近期發布了其開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源
    的頭像 發表于 05-08 11:45 ?2987次閱讀
    <b class='flag-5'>NVIDIA</b>使用Qwen<b class='flag-5'>3</b>系列<b class='flag-5'>模型</b>的最佳實踐

    Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用

    -Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業級AI智能體、定制化行業大型語言模型及搭載
    的頭像 發表于 03-26 14:42 ?739次閱讀
    Cognizant將與<b class='flag-5'>NVIDIA</b>合作部署神經人工智能平臺,<b class='flag-5'>加速</b>企業人工智能應用

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發
    的頭像 發表于 03-20 16:56 ?1710次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理
    的頭像 發表于 03-20 15:03 ?1231次閱讀