7月27日,移遠通信宣布與RWKV公司建立全面合作關系,雙方將依托移遠的算力平臺,優化并支持RWKV最新模型架構,共同推動大模型在端側設備的低資源占用部署。此次合作成果于2025世界人工智能大會(WAIC)首次亮相,標志著端側大模型解決方案向更高性能、更廣場景的應用邁出關鍵一步。
RWKV(Receptance Weighted Key Value)是全球領先的RNN大模型架構,它成功結合了遞歸神經網絡(RNN)的恒定復雜度和高效串行推理,以及Transformer的并行處理優勢,使其在文本生成、時間序列、圖像和視頻、語音和音樂等領域表現出色,推理成本和訓練成本顯著低于Transformer。
這項技術的核心突破在于引入RWKV算子替代Transformer的位置編碼和多頭注意力機制。這一革新有效解決了Transformer在處理長序列時的空間和時間復雜度問題,在確保模型性能不受影響的前提下,實現了內存占用恒定、token計算復雜度恒定,意味著運算過程更高效、更省力。這一特性讓 RWKV 在端側設備部署中展現出顯著優勢:處理長序列時速度更快、內存占用更低,相當于為終端設備配備了一個 “輕量化的AI大腦”。
在本次世界人工智能大會(WAIC)上,基于高通 QCS8550 平臺的兩大 RWKV 聯合解決方案將重磅登場:
- RWKV Chat:思考永續
RWKV Chat是一款離線AI聊天應用,無需聯網即可實現推理、深度對話與文本續寫,支持個性化會話配置,成為用戶的“口袋級”生產力伙伴。例如其中的RWKV7-G1 2.9B模型在高通手機平臺的速度可達30 token/s,且由于RWKV架構無需KV cache,在超長推理后仍然可以速度恒定,內存占用恒定。
RWKV Sudoku:超長CoT
RWKV 數獨則展示了20M超小參數模型在超長鏈式推理(CoT)下的數學解題能力,憑借恒定內存與極少token消耗,輕松破解復雜數獨,直觀呈現RWKV架構在端側的高效潛能。
在Transformer架構主導大模型領域的當下,移遠通信以前瞻性的眼光,積極布局非Transformer的技術路線,致力于為客戶提供更低算力、更少內存消耗的解決方案。
此次展出的RWKV7-G1 1.5B模型,經過移遠通信的工程優化后,在SG885G模組上的實測數據表現亮眼,明顯優于同等參數量的Transformer架構的模型,具體來說,
在Prefill階段:
- 平均耗時減少83%
- 平均處理速度提升345%
在Decoding階段:
- 平均CPU使用減少23%
- 平均內存使用減少36%
- 平均功耗減少18%

移遠通信的SG885G基于高通QCS8550平臺開發,其AI綜合算力高達48 TOPS,能夠支撐7B左右參數級的多模態模型在本地化推理,從而實現實時視覺理解與多模態信息融合。在模型兼容性方面,移遠構建了強大的端側適配體系,率先實現對Llama、通義千問、DeepSeek等主流開源模型的全方位兼容,兼容的參數范圍覆蓋0.5B至8B,打造出了功能強大的端側大模型超級平臺。此外,在架構創新上,SG885G支持運行非Transformer路線的RWKV7架構,這一特征顯著降低了對算力和內存的需求。
移遠通信首席運營官張棟表示:“此次與RWKV的戰略合作,是移遠通信 ‘讓終端擁有AI大心臟’技術理念的關鍵落地!RWKV的線性注意力架構,突破性地解決了端側設備的長序列處理瓶頸,再結合移遠的高算力模組,成功將AI大模型‘裝進’了物聯網終端。當農機能‘看懂’土壤的干濕,當手表可以‘提醒’健康風險,AI就不再是飄在云里的概念,而是真真切切來到了田間地頭、來到了你我的手腕上,讓科技真正服務于每一處需要它的地方。”
RWKV聯合創始人&COO羅璇表示:“我們希望讓每一臺設備都聰明起來,就像為它們植入了會思考的‘大腦’。隨著RWKV架構在移遠算力平臺上實現規模化部署,讓終端設備突破資源限制,構建‘云端能力+本地智能’的雙引擎協同生態,為萬物智聯時代奠定技術基石。”
移遠通信與RWKV的戰略合作,不僅是一次技術與硬件的強強聯合,更是推動智能計算走向普惠的關鍵里程碑,讓“AI大模型”真正走出云端,融入萬物。
7月26日-29日,誠邀蒞臨WAIC 2025移遠展臺(H1 D815),近距離體驗端側大模型解決方案的前沿科技魅力。
-
AI
+關注
關注
91文章
39793瀏覽量
301438 -
移遠通信
+關注
關注
6文章
834瀏覽量
20819 -
大模型
+關注
關注
2文章
3650瀏覽量
5186
發布評論請先 登錄
移遠通信飛鳶AIoT大模型應用算法成功通過備案
移遠通信 × 奧飛娛樂,共同打造AI潮玩2.0時代
LLaVA、RWKV、Qwen3... 移遠端側AI大模型解決方案實現多維度躍遷
AI大模型端側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式
移遠通信聯合德壹發布全球首款搭載端側大模型的AI具身理療機器人
端側AI模組再進化!移遠通信和美格智能在MWC如何放大招?
端側大模型迎來“輕”革命!移遠通信 × RWKV 打造“輕量AI大腦”
評論