要點
?高通與騰訊混元展開合作,基于驍龍8至尊版移動平臺實現(xiàn)騰訊混元大模型7B和3B版本的終端側部署,進一步擴展生成式AI技術在終端側的應用和普及。
?借助驍龍8至尊版的強大終端側AI性能和高通AI軟件棧,騰訊混元大模型能夠實現(xiàn)出色的終端側運行表現(xiàn),為騰訊的廣泛業(yè)務場景和應用提供底層端側AI支持。
驍龍峰會期間,高通技術公司宣布與騰訊混元合作,基于驍龍8至尊版移動平臺,共同推動了騰訊混元大模型7B和3B版本的終端側部署,展示了此合作實現(xiàn)出色的運行表現(xiàn)。這將有助于騰訊混元大模型為廣泛的業(yè)務場景提供技術支持,通過利用終端側AI加速產品創(chuàng)新,有效降低運營成本,并進一步擴展生成式AI在終端側的應用和普及。
驍龍8至尊版移動平臺搭載全新的第二代定制高通Oryon CPU和增強的高通HexagonNPU,充分利用高通AI引擎優(yōu)勢,能夠帶來更強大的終端側生成式AI處理能力。驍龍8至尊版的強大AI算力,結合高通AI軟件棧以及行業(yè)領先的工具套件,包括高通AI模型增效工具包(AIMET)等,為模型提供了全棧優(yōu)化能力。通過使用基于硬件的INT4量化技術,可以大幅提升騰訊混元大模型在終端側的運行效率,端側推理實現(xiàn)首個token生成時延達到150ms,解碼速率達到超過30 tokens/秒。
騰訊混元大模型已為騰訊內部超過700個業(yè)務場景和C端應用提供底層技術支持,包括微信輸入法、騰訊手機管家、QQ、騰訊視頻、QQ瀏覽器、企業(yè)微信、騰訊會議等,通過實現(xiàn)面向驍龍8至尊版的終端側部署,能夠利用終端側生成式AI的豐富優(yōu)勢,更好地滿足廣泛的終端側業(yè)務需求。例如,騰訊手機管家短信智能識別功能率先利用騰訊混元的終端側模型能力,通過海量數(shù)據(jù)結合深度神經網絡與預訓練,讓模型具備極強的語義理解能力,通過結合上下文語境信息更準確地理解短信意圖,使短信召回率大幅提高將近200%,識別準確率提升20%。由于部分短信涉及用戶個人敏感信息,端側AI還可以在保證出色性能表現(xiàn)的同時,有效保護用戶的個人信息隱私安全。
高通技術公司高級副總裁兼技術規(guī)劃和邊緣解決方案業(yè)務總經理馬德嘉表示:
高通與騰訊混元大模型團隊長期攜手推動前沿終端側技術創(chuàng)新在移動應用中的部署和推廣,為廣大用戶和消費者打造創(chuàng)新的應用體驗。高通公司致力于賦能廣大ISV合作伙伴和開發(fā)者,利用高通強大的異構計算、行業(yè)領先的CPU、GPU、NPU和軟件解決方案,在搭載驍龍平臺的終端上推動生成式AI應用的普及,惠及全球更多用戶。
騰訊機器學習平臺部總經理,騰訊混元大模型負責人王迪表示:
騰訊混元已經構建起了全鏈路的大模型矩陣和應用平臺。同時,騰訊混元不斷完善部署生態(tài)。在云服務場景,我們通過多種技術在提升效果的同時調用價格持續(xù)降低。在智能終端場景,騰訊和高通持續(xù)深入合作,賦能不同業(yè)務對端側模型的部署需求,并在騰訊豐富的生態(tài)中持續(xù)迭代能力,讓更多的B端和C端用戶獲得實用大模型的非凡體驗。
-
高通
+關注
關注
78文章
7731瀏覽量
199777 -
驍龍
+關注
關注
2文章
1061瀏覽量
39111 -
大模型
+關注
關注
2文章
3648瀏覽量
5179
原文標題:高通與騰訊混元合作,基于驍龍8至尊版共同推動騰訊混元大模型終端側部署
文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
匯川技術與合眾匯能及盛藏混儲達成戰(zhàn)略合作
維智科技與同濟大學達成戰(zhàn)略合作
Bosch Sensortec與樂鑫科技達成戰(zhàn)略合作
禾賽科技與高仙機器人達成戰(zhàn)略合作
嘉楠科技與SynVista Energy達成戰(zhàn)略合作
東風汽車與騰訊達成戰(zhàn)略合作
WHIS與高通達成戰(zhàn)略合作
蘑菇車聯(lián)與騰訊云達成戰(zhàn)略合作
硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型
高通與騰訊混元達成戰(zhàn)略合作
評論