伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于NVIDIA GPU加速端點(diǎn)使用千問(wèn)3.5 VLM開(kāi)發(fā)原生多模態(tài)智能體

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2026-03-04 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里巴巴推出了全新開(kāi)源千問(wèn)3.5系列,專為構(gòu)建原生多模態(tài)智能體而設(shè)計(jì)。該系列的首個(gè)模型是一款總參數(shù)為397B、具備推理能力的原生視覺(jué)語(yǔ)言模型(VLM),基于由混合專家模型(MoE)和門控Delta網(wǎng)絡(luò)(Gated Delta Networks)組成的混合架構(gòu)構(gòu)建。千問(wèn)3.5能夠理解和導(dǎo)航用戶界面,相較上一代VLM有了顯著提升。

千問(wèn)3.5適用于各種用例,包括:

編碼任務(wù),包括Web開(kāi)發(fā)

視覺(jué)推理任務(wù),包括移動(dòng)端和Web界面

聊天應(yīng)用

復(fù)雜搜索

千問(wèn)3.5
模態(tài) 視覺(jué)、語(yǔ)言
總參數(shù) 397B
激活參數(shù) 17B
激活率 4.28%
輸入上下文長(zhǎng)度 256K token,可擴(kuò)展至1M token
支持的語(yǔ)言 200+
其他配置信息
專家 512
共享專家 1
每個(gè)token使用的專家數(shù)量 11(10個(gè)路由專家+ 1個(gè)共享專家)
層數(shù) 60
詞表大小 248,320

表1. 千問(wèn)3.5模型的規(guī)格和配置詳情

使用NVIDIA端點(diǎn)進(jìn)行構(gòu)建

您可以在NVIDIA官網(wǎng)上免費(fèi)使用由NVIDIA GPU驅(qū)動(dòng)的GPU加速端點(diǎn)使用千問(wèn)3.5進(jìn)行構(gòu)建。作為NVIDIA開(kāi)發(fā)者計(jì)劃的一部分,您可以在瀏覽器中快速體驗(yàn)、試驗(yàn)不同的提示詞,并使用自己的數(shù)據(jù)測(cè)試模型,以評(píng)估其在實(shí)際場(chǎng)景中的性能。

視頻1.了解如何在NVIDIA GPU加速端點(diǎn)上測(cè)試千問(wèn)3.5

您還可以通過(guò)API來(lái)調(diào)用NVIDIA托管的模型,注冊(cè)NVIDIA開(kāi)發(fā)者計(jì)劃即可免費(fèi)使用。

import requests 
   
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions" 
   
headers = { 
    "Authorization": "Bearer $NVIDIA_API_KEY", 
    "Accept": "application/json", 
} 
   
payload = { 
  "messages": [ 
    { 
    "role": "user", 
    "content": "" 
    } 
  ], 
  "model": "qwen/qwen3.5-397b-a17b", 
  "chat_template_kwargs": { 
    "thinking": True 
  }, 
  "frequency_penalty": 0, 
  "max_tokens": 16384, 
  "presence_penalty": 0, 
  "stream": True, 
  "temperature": 1, 
  "top_p": 1 
} 
   
# re-use connections 
session = requests.Session() 
   
response = session.post(invoke_url, headers=headers, json=payload) 
   
response.raise_for_status() 
response_body = response.json() 
print(response_body)

要使用工具調(diào)用功能,只需定義一個(gè)由OpenAI兼容工具組成的數(shù)組,并將其添加到聊天補(bǔ)全接口的tools參數(shù)中。

NVIDIA NIM可以輕松將千問(wèn)3.5從開(kāi)發(fā)階段遷移到生產(chǎn)環(huán)境。NIM提供經(jīng)過(guò)優(yōu)化的容器化推理微服務(wù),將模型與性能調(diào)優(yōu)、標(biāo)準(zhǔn)化API和企業(yè)所需的部署靈活性打包集成。您可以在各類環(huán)境中下載并運(yùn)行,無(wú)論是本地、云上或混合環(huán)境。

使用NVIDIANeMo自定義模型

千問(wèn)3.5已具備出色的“開(kāi)箱即用”多模態(tài)功能,NVIDIA NeMo框架仍提供了關(guān)鍵的工具集,使其進(jìn)一步適配特定領(lǐng)域的需求。開(kāi)發(fā)者可以使用NeMo Automodel庫(kù)微調(diào)千問(wèn)3.5 397B參數(shù)架構(gòu),實(shí)現(xiàn)高吞吐效率。

NeMoAutomodel是一個(gè)原生PyTorch訓(xùn)練庫(kù),提供Day 0 Hugging Face支持,無(wú)需繁瑣的模型轉(zhuǎn)換,即可在現(xiàn)有檢查點(diǎn)上直接進(jìn)行訓(xùn)練。無(wú)論是執(zhí)行全量監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT),還是使用LoRA等內(nèi)存高效方法,都有助于快速開(kāi)展實(shí)驗(yàn)。

作為參考實(shí)現(xiàn)指南,開(kāi)發(fā)者可以利用醫(yī)學(xué)視覺(jué)問(wèn)答技術(shù)教程,該教程詳細(xì)說(shuō)明了如何在放射學(xué)數(shù)據(jù)集上微調(diào)千問(wèn)3.5。在大規(guī)模場(chǎng)景下,NeMo支持多節(jié)點(diǎn)Slurm和Kubernetes部署,從而確保即使是最大的MoE模型,也能在特定領(lǐng)域的推理和復(fù)雜智能體工作流中實(shí)現(xiàn)低延遲的優(yōu)化,并將延遲降至最低。

開(kāi)始使用千問(wèn)3.5

從數(shù)據(jù)中心部署到可隨時(shí)隨地進(jìn)行容器化部署的NVIDIA NIM,NVIDIA提供了千問(wèn)3.5的集成解決方案。訪問(wèn)Hugging Face上的千問(wèn)3.5模型頁(yè)面,并前往NVIDIA官網(wǎng)體驗(yàn)千問(wèn)3.5的功能。

關(guān)于作者

Anu Srivastava 是高級(jí)技術(shù)營(yíng)銷經(jīng)理,專注于開(kāi)放 AI 模型。她與主要合作伙伴和基金會(huì)合作,為開(kāi)源開(kāi)發(fā)者生態(tài)系統(tǒng)提供 NVIDIA 加速平臺(tái)支持。加入 NVIDIA 之前,她曾在 Google 擔(dān)任各種工程職務(wù)超過(guò) 10 年,并擁有德克薩斯大學(xué)奧斯汀分校計(jì)算機(jī)科學(xué)學(xué)位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5674

    瀏覽量

    110028
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5235

    瀏覽量

    135912
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1648

    瀏覽量

    49286

原文標(biāo)題:基于 NVIDIA GPU 加速端點(diǎn),使用千問(wèn)3.5 VLM 開(kāi)發(fā)原生多模態(tài)智能體

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    監(jiān)控/利用率、選擇可用GPU卡子集等內(nèi)容。 6. 故障排除:針對(duì)NVIDIA驅(qū)動(dòng)安裝、GPU設(shè)置、GPU模式、硬件識(shí)別、CUDA錯(cuò)誤、TC
    發(fā)表于 12-16 14:25

    NVIDIA火熱招聘GPU高性能計(jì)算架構(gòu)師

    這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計(jì)算架構(gòu)師(功能驗(yàn)證)的崗位,有意向的朋友歡迎發(fā)送簡(jiǎn)歷到 allelin@nvidia
    發(fā)表于 09-01 17:22

    AI開(kāi)發(fā)者福音!阿里云推出國(guó)內(nèi)首個(gè)基于英偉達(dá)NGC的GPU優(yōu)化容器

    云計(jì)算服務(wù)異構(gòu)加速平臺(tái),為人工智能產(chǎn)業(yè)提供場(chǎng)景化的全球加速能力。2017年11月,阿里云發(fā)布了國(guó)內(nèi)首個(gè)支持 NVIDIA ?Tesla ?
    發(fā)表于 04-04 14:39

    Nvidia GPU風(fēng)扇和電源顯示ERR怎么解決

    問(wèn)題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時(shí)候,如果機(jī)器鎖屏一段時(shí)間再打開(kāi)的時(shí)候鼠標(biāo)非常卡頓,或者說(shuō)顯示界面非常卡頓,使用nvidia-smi查看發(fā)現(xiàn),訓(xùn)練模型的GPU
    發(fā)表于 12-30 06:44

    在Ubuntu上使用Nvidia GPU訓(xùn)練模型

    問(wèn)題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時(shí)候,沒(méi)有問(wèn)題,過(guò)一會(huì)再訓(xùn)練出現(xiàn)非常卡頓,使用nvidia-smi查看發(fā)現(xiàn),顯示GPU的風(fēng)扇和電源報(bào)錯(cuò):解決方案自動(dòng)風(fēng)扇控制在
    發(fā)表于 01-03 08:24

    慕尼黑電子展回顧:?jiǎn)⒚髦秋@模態(tài)硬件智能引領(lǐng)科技潮流

    在剛剛落幕的慕尼黑電子展上,啟明云端攜啟明智顯與觸覺(jué)智能兩家子公司,共同為全球觀眾呈現(xiàn)了一場(chǎng)科技盛宴。本次展會(huì),啟明智顯憑借其創(chuàng)新的模態(tài)硬件智能
    的頭像 發(fā)表于 07-10 16:17 ?1116次閱讀
    慕尼黑電子展回顧:?jiǎn)⒚髦秋@<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件<b class='flag-5'>智能</b><b class='flag-5'>體</b>引領(lǐng)科技潮流

    商湯絕影在行業(yè)率先實(shí)現(xiàn)原生模態(tài)大模型的車端部署

    “基于原生模態(tài)大模型,商湯絕影正在打造一系列全新的車載智能化產(chǎn)品,推動(dòng)智能汽車向超級(jí)智能
    的頭像 發(fā)表于 07-23 10:52 ?1278次閱讀
    商湯絕影在行業(yè)率先實(shí)現(xiàn)<b class='flag-5'>原生</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型的車端部署

    ?VLM(視覺(jué)語(yǔ)言模型)?詳細(xì)解析

    視覺(jué)語(yǔ)言模型(Visual Language Model, VLM)是一種結(jié)合視覺(jué)(圖像/視頻)和語(yǔ)言(文本)處理能力的模態(tài)人工智能模型,能夠理解并生成與視覺(jué)內(nèi)容相關(guān)的自然語(yǔ)言。以下
    的頭像 發(fā)表于 03-17 15:32 ?9408次閱讀
    ?<b class='flag-5'>VLM</b>(視覺(jué)語(yǔ)言模型)?詳細(xì)解析

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著行百業(yè)數(shù)智化進(jìn)程的不斷加速模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。3月20日,全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信
    的頭像 發(fā)表于 03-20 19:03 ?921次閱讀
    移遠(yuǎn)通信<b class='flag-5'>智能</b>模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著行百業(yè)數(shù)智化進(jìn)程的不斷加速模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。 ? 3月20日,全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移
    發(fā)表于 03-21 14:12 ?567次閱讀
    移遠(yuǎn)通信<b class='flag-5'>智能</b>模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新體驗(yàn)

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)

    NVIDIA GTC 推出新一代專業(yè)級(jí) GPU 和 AI 賦能的開(kāi)發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1395次閱讀

    沐曦股份曦云C系列GPU深度適配通義問(wèn)Qwen3.5模型

    今天,通義問(wèn)今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開(kāi)放權(quán)重版本。沐曦股
    的頭像 發(fā)表于 02-26 14:26 ?683次閱讀
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>深度適配通義<b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b>Qwen<b class='flag-5'>3.5</b>模型

    沐曦股份曦云C系列GPU全面適配通義問(wèn)Qwen3.5三款新模型

    今日,通義問(wèn)團(tuán)隊(duì)正式開(kāi)源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Q
    的頭像 發(fā)表于 02-28 10:05 ?613次閱讀
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>全面適配通義<b class='flag-5'>千</b><b class='flag-5'>問(wèn)</b>Qwen<b class='flag-5'>3.5</b>三款新模型

    NVIDIA攜手全球工業(yè)軟件巨頭構(gòu)建AI智能加速設(shè)計(jì)與工程開(kāi)發(fā)流程

    ? 以及 GPU 加速的工業(yè)軟件與工具引入 FANUC、HD 現(xiàn)代集團(tuán)、本田、捷豹路虎、凱傲集團(tuán)、梅賽德斯奔馳、聯(lián)發(fā)科技、百事公司、三星、SK 海力士和 TSMC 等企業(yè),以加速工業(yè)設(shè)計(jì)、工程
    的頭像 發(fā)表于 03-19 15:39 ?299次閱讀

    天數(shù)智芯完成阿里云通義問(wèn)Qwen3.5系列模態(tài)模型全量適配

    近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義問(wèn) Qwen3.5 系列模態(tài)模型全量適配,實(shí)現(xiàn)模型精度精準(zhǔn)對(duì)齊與端到端無(wú)縫部署,再
    的頭像 發(fā)表于 03-26 09:25 ?779次閱讀