當前,人工智能技術(shù)正加速向大模型時代邁進,在政務(wù)、金融、醫(yī)療、工業(yè)等領(lǐng)域展現(xiàn)出顛覆性潛力。然而,大模型的訓(xùn)練與部署面臨算力成本高、技術(shù)生態(tài)依賴性強、行業(yè)落地門檻高三大挑戰(zhàn)。
為加速技術(shù)普惠,4月23日晚,開源中國直播欄目《數(shù)智漫談》邀請華為昇騰生態(tài)技術(shù)專家、行業(yè)先行者以及迅龍軟件等,分享一線開發(fā)經(jīng)驗,助力開發(fā)者與企業(yè)用戶抓住國產(chǎn) AI新紅利。

該話題圍繞“如何讓AI既跑得快(性能優(yōu)化)又用得好(場景適配)”而展開。華為云 HCDE、微軟 Insider Dev Tour China姚圣偉針對“昇騰插件化接入vLLM加速大模型推理創(chuàng)新最佳實踐”做了主題分享。他表示,基于自主研發(fā)的昇騰處理器及CANN異構(gòu)計算架構(gòu),昇騰推出插件化接入方案,與開源推理框架vLLM深度適配,為大模型推理提供高性能、低時延的創(chuàng)新實踐。通過該功能,用戶可以像實現(xiàn)自定義模型一樣,插件化的完成vLLM的硬件支持。用戶可以實現(xiàn)自己的Woker、ModelRunner、Attention、Communicator以及自定義算子。

迅龍軟件技術(shù)專家以O(shè)rangePi AI Studio Pro為例,分享了迅龍軟件在AI方面的探索實踐,并現(xiàn)場演示了在OrangePi AI Studio Pro上完成DeepSeek-R1-Distill-Qwen-14B模型的本地化部署。OPi AI Studio Pro是基于2個昇騰AI處理器的新一代高性能算力卡,可提供352 TOPS INT8的計算能力,內(nèi)存提供了96GB和192GB兩個版本。
OPi AI Studio Pro融合“通用處理器、AI Core、編解碼” 于一體,提供超強AI推理、目標檢索、視頻圖片編解碼等功能,具有超強算力、超高能效、超大視頻解析路數(shù)、高性能特征檢索等優(yōu)勢,支持高清視頻實時分析,可廣泛應(yīng)用于OCR識別、目標識別、搜索推薦、內(nèi)容審核、智慧城市、智慧交通、智慧園區(qū)等諸多AI應(yīng)用場景。

《數(shù)智漫談》是開源中國推出的一檔直播欄目,每月1期,已推出22期。以“深度對話、多元視角、前沿洞察”為核心理念,聚焦IT技術(shù)、開源治理、行業(yè)趨勢與創(chuàng)新實踐,通過輕松互動形式搭建開源領(lǐng)域的思想交流平臺。
-
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301358 -
開發(fā)板
+關(guān)注
關(guān)注
26文章
6289瀏覽量
118048 -
迅龍軟件
+關(guān)注
關(guān)注
0文章
51瀏覽量
2924
發(fā)布評論請先 登錄
AI共創(chuàng),江波龍攜AI存儲創(chuàng)新方案亮相2025數(shù)智科技生態(tài)大會
成都匯陽投資關(guān)于國產(chǎn)開源模型持續(xù)突破,國產(chǎn)AI 競爭力增強
融合AI的OpenHarmony應(yīng)用軟件開發(fā):ai學(xué)習(xí)自律輔助軟件
江波龍攜AI存儲創(chuàng)新亮相中國移動合作伙伴大會,合創(chuàng)AI+時代
普華基礎(chǔ)軟件亮相2025 CCF中國開源大會
迅龍軟件攜最新成果亮相2025世界人工智能大會,共探AI未來新圖景
迅龍軟件參加昇騰 AI?開發(fā)者創(chuàng)享日?廣東站,為開發(fā)者打造沉浸式實操體驗
迅龍軟件受邀參加2025龍芯產(chǎn)品發(fā)布暨用戶大會,發(fā)布基于龍芯2K3000的OrangePi Nova
迅龍軟件攜多個AI產(chǎn)品參加鯤鵬昇騰開發(fā)者大會,重磅發(fā)布新品OrangePi AImax
恩士迅:加速企業(yè)數(shù)智化創(chuàng)新“新引擎“
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
迅龍軟件聯(lián)合發(fā)布昇騰五大創(chuàng)新方向成果,共建智能生態(tài)
迅龍軟件參加開源中國《數(shù)智漫談》,探討AI如何邁進大模型時代
評論