近年來,RISC-V 不斷在各個應(yīng)用場景落地,在各種真實應(yīng)用場景中,安全一直是離不開的一個話題。加密、認(rèn)證、哈希、校驗正逐步成為系統(tǒng)中的常駐負(fù)載。進(jìn)迭時空在 K3 芯片上推進(jìn) RISC-V Vector Crypto,在真實硬件與應(yīng)用中形成穩(wěn)定、可感知、可復(fù)用的密碼學(xué)能力,為RISC-V 生態(tài)的真正落地提供答案。
加密與認(rèn)證廣泛應(yīng)用于網(wǎng)頁訪問、數(shù)據(jù)傳輸、文件同步、VPN連接等場景。隨著云邊協(xié)同、零信任接入、存儲加密等需求持續(xù)增長,密碼學(xué)計算正從“可選能力”轉(zhuǎn)為“常駐負(fù)載”。針對這一趨勢,進(jìn)迭時空選擇在 RISC-V 處理器中支持 RISC-V Vector Crypto 擴(kuò)展。不同于依賴通用 CPU 標(biāo)量指令計算或外掛獨立密碼加速 IP 的方法,Vector Crypto 在原有 RISC-VVector擴(kuò)展的基礎(chǔ)上,直接增強了加密、認(rèn)證和哈希等計算,進(jìn)而提升這些場景下的應(yīng)用表現(xiàn)。
從進(jìn)迭時空的實踐來看,Vector Crypto 有以下3個特點:
同時覆蓋國際標(biāo)準(zhǔn)算法與中國商用密碼算法
以結(jié)構(gòu)化的 Element Group 提升軟硬件協(xié)同效率
在設(shè)計上注意執(zhí)行時延與加密內(nèi)容無關(guān),降低時序側(cè)信道風(fēng)險
對進(jìn)迭時空而言,Vector Crypto 的意義不只是“更快”,更在于把“高性能、標(biāo)準(zhǔn)化、可控安全實現(xiàn)”統(tǒng)一到同一條執(zhí)行路徑上。SpacemiT K3 的價值,也正在于將這一能力從規(guī)范推進(jìn)到量產(chǎn)實踐。
算法級測試結(jié)果
算法級及應(yīng)用級實驗均基于 K3 芯片的 X100 實測。以下為 OpenSSL benchmark 中,不同數(shù)據(jù)規(guī)模下開啟 Vector Crypto 后相對標(biāo)量基線的加速倍數(shù)。

結(jié)果中可觀察到幾個明確趨勢:
數(shù)據(jù)塊越大,收益通常越明顯。如 aes-128-cbc 從 16 bytes 的 4.7x 提升到 16384 bytes 的 13.9x,GHASH 更是從 2.5x 提升到 46.6x。
塊加密與認(rèn)證路徑表現(xiàn)最為突出。AES-CBC 和 GHASH 的提升符合其天然適合并行處理的特性。
不同算法對向量化的敏感度存在差異。sha512、SM3 的提升相對平穩(wěn),說明算法結(jié)構(gòu)、數(shù)據(jù)組織方式及實現(xiàn)路徑均影響最終收益。
應(yīng)用級測試結(jié)果
算法級 benchmark 固然重要,但用戶感知更多取決于真實應(yīng)用場景。
01. HTTPS / TLS 場景
網(wǎng)絡(luò)安全測試使用 Nginx + TLS 1.3 服務(wù)端,客戶端通過 openssl s_time 壓測,對比 AES-GCM 和 ChaCha20-Poly1305 兩組 cipher suite,分別在 1KB 和 1MB 文件場景下測試 with/without Vector Crypto 的差異。兩種連接方式含義如下:
新建連接:每次請求重新建立 TLS 連接
復(fù)用連接:復(fù)用已有 session 進(jìn)行請求

在 1KB 小包場景下,兩種算法均有提升,但幅度相對有限;進(jìn)入 1MB 大包傳輸后,AES-GCM 收益明顯拉開,新建連接模式提升約 72.9%,復(fù)用連接模式提升約 49.7%。這與前述算法級實驗中 AES + GHASH 受益更明顯的結(jié)論一致。
而 ChaCha20-Poly1305 的表現(xiàn)更平穩(wěn)。其原因在于,ChaCha20 本身并沒有直接對應(yīng)的 Vector Crypto 專用加速指令,因此能夠獲得的收益相對有限。這一點在 HTTPS / TLS 場景中也體現(xiàn)得比較明顯:整體有提升,但無論是小包還是大包,增益都明顯低于 AES-GCM 路徑。
02. 存儲安全場景
存儲安全測試使用 fio,在 verify=sha256 場景下觀察開啟 Vector Crypto 后,帶校驗的寫路徑和校驗讀路徑是否發(fā)生變化。測試覆蓋 4k、64k、1m 三種塊大小。


Vector Crypto 對“寫入 + SHA256 校驗”路徑提升顯著,而且塊越大,收益越高。1m 下,寫路徑達(dá)到 6.58x,校驗讀達(dá)到 6.46x。對照組表明,純順序讀幾乎沒有變化,說明提升主要來自 sha256 verify 處理過程,而非普通 I/O 。
03. 數(shù)據(jù)完整性校驗場景
數(shù)據(jù)完整性測試使用 openssl dgst -sha256,分別測試 1GB 大文件和 4096 x 16KB 批量小文件兩類場景。

實驗結(jié)果符合工程直覺:大文件完整性校驗提升顯著(約 7.34x),而批量小文件的耗時主要由文件切換和調(diào)度開銷主導(dǎo),收益很小(約 1.78%)。說明優(yōu)化更適合大塊數(shù)據(jù)的連續(xù)處理,而非存在頻繁文件切換和調(diào)度開銷主導(dǎo)的場景。
04. WireGuard 隧道場景
在 WireGuard 測試中,額外做了純 ChaCha20-Poly1305 benchmark 和實際隧道吞吐兩組對比。
純 ChaCha20-Poly1305 benchmark 下,1KB 負(fù)載提升約 19.9%
純 ChaCha20-Poly1305 benchmark 下,1MB 負(fù)載提升約 39.2%
但實際 WireGuard 隧道吞吐幾乎沒有變化,穩(wěn)定在約 0.89 Gbit/s
這一結(jié)果說明,當(dāng)前 WireGuard 負(fù)載的主要瓶頸不在加解密運算本身,因此即便 ChaCha20-Poly1305 的純算法 benchmark 已經(jīng)明顯提升,實際隧道吞吐也不會出現(xiàn)同等幅度的增長。
05. 國密合規(guī)場景
國密合規(guī)測試主要圍繞 Tongsuo 展開,對比使用 Vector Crypto 與未使用 Vector Crypto 兩種配置下的表現(xiàn),分成兩個層面:
算法級性能對比:觀察 SM3 和 SM4-CBC 在應(yīng)用實現(xiàn)中的實際收益;
TLCP 應(yīng)用場景對比:觀察這些收益能否反映到連接層性能上。
先看算法級結(jié)果:
SM3 的對比覆蓋了從 16B 到 16384B 的多個數(shù)據(jù)規(guī)模。使用 Vector Crypto 和未使用 Vector Crypto 的速度之比如下圖所示:

可以看到,SM3 在不同負(fù)載下都能獲得穩(wěn)定收益,并且數(shù)據(jù)塊越大,提升越明顯,大塊數(shù)據(jù)時已經(jīng)接近 2.4x。
SM4-CBC 的提升更直接,使用 Vector Crypto 和未使用 Vector Crypto 的速度之比如下圖所示:

這說明在 Tongsuo 的國密應(yīng)用實現(xiàn)中,SM4-CBC 是一條非常典型的高收益路徑,其提升范圍已經(jīng)達(dá)到 3.6x ~ 7x。
再看 TLCP 應(yīng)用層表現(xiàn)。測試場景使用本機(jī) TLCP 服務(wù)端,協(xié)議為 NTLSv1.1,cipher suite 為 ECC-SM2-SM4-CBC-SM3,對 /1k.bin 進(jìn)行 60 秒短連接壓測。結(jié)果如下:

也就是說,在 TLCP 國密短連接場景中,使用 Vector Crypto 已經(jīng)能夠體現(xiàn)出穩(wěn)定可見的連接層收益。綜合來看,在國密場景下,Vector Crypto 不僅能顯著提升 SM3、SM4-CBC 等算法路徑的性能,而且能將收益進(jìn)一步傳導(dǎo)到 TLCP 等真實應(yīng)用場景中。
結(jié)語
RISC-V Vector Crypto 的價值,不在于“多了一組新指令”,而在于它讓處理器第一次能更系統(tǒng)地承擔(dān)起高頻密碼學(xué)工作負(fù)載。
對進(jìn)迭時空而言,K3 的意義不只是“支持了標(biāo)準(zhǔn)”,而是將這一能力真正落地到量產(chǎn)硬件,并在算法級和應(yīng)用級兩個層面都給出了可驗證的優(yōu)化結(jié)果。下一步,進(jìn)迭時空將繼續(xù)圍繞真實業(yè)務(wù)負(fù)載推進(jìn)軟硬件協(xié)同優(yōu)化,讓 Vector Crypto 在更多場景中釋放穩(wěn)定的性能收益。
-
安全測試
+關(guān)注
關(guān)注
0文章
37瀏覽量
9002 -
RISC-V
+關(guān)注
關(guān)注
49文章
2937瀏覽量
53470 -
進(jìn)迭時空
+關(guān)注
關(guān)注
0文章
65瀏覽量
617
發(fā)布評論請先 登錄
進(jìn)迭時空 Upstream | K3 獲得 Linux 7.0 內(nèi)核原生支持
Canonical 與進(jìn)迭時空攜手:Ubuntu 全面支持 K3/K1 RISC-V AI CPU 計算平臺
進(jìn)迭時空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布
進(jìn)迭時空2025年度十大開發(fā)者揭曉
Vol.4 | 進(jìn)迭時空孫彥邦:RISC-V的答案,不是篩選“幸存者”,而是集結(jié)“共建者”
進(jìn)迭播客 | Vol.3對話孫彥邦:用胡子賭一個未來,RISC-V是AI時代的“終極答案”
進(jìn)迭時空參加2025 RISC-V北美峰會,披露第二代RISC-V AI CPU芯片 K3 進(jìn)展
進(jìn)迭時空與青少年共赴RISC-V AI科技未來!
2025RISC-V中國峰會|進(jìn)迭時空RISC-V AI CPU驅(qū)動智能化應(yīng)用發(fā)展
迎接泛機(jī)器人時代:進(jìn)迭時空如何以RISC-V架構(gòu)數(shù)智未來
高校賽事 | 進(jìn)迭時空攜手藍(lán)橋杯,誠邀全國高校學(xué)子共啟RISC-V人工智能應(yīng)用創(chuàng)新賽道
進(jìn)迭時空RISC-V Vector技術(shù)實踐
大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
大象機(jī)器人×進(jìn)迭時空聯(lián)合發(fā)布全球首款RISC-V全棧開源小六軸機(jī)械臂
加解密運算:進(jìn)迭時空 RISC-V Vector Crypto 量產(chǎn)實踐
評論