在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
由崔湛林、羅哲寬、嚴陽組成的 Horizon 團隊在本屆黑客松中拔得頭籌。同為計算機科學專業的他們雖然來自不同學校,卻因黑客松而結緣,憑借其創新項目“構建 AI 驅動的 DPU 實時網絡安全防御系統”獲得本次黑客松競賽第一名。該項目通過NVIDIA DOCA 軟件框架實現了 AI 與 DPU 的深度協同,不僅突破了傳統網絡安全防御的實時性瓶頸,更開創了智能邊緣安全防護的新范式。
用 DPU 重塑網絡安全格局
在現代網絡環境中,傳統的安全檢測方式往往存在滯后性,難以應對日益復雜的攻擊手段。Horizon 團隊敏銳地捕捉到這一痛點,提出了一種運行在 DPU 上的實時網絡安全系統。該系統結合 NVIDIA DOCA 軟件框架和 NVIDIA BlueField-3 DPU 強大的硬件特性,通過團隊首創的“混合檢測架構”,利用規則檢測與 LSTM 深度學習 AI 檢測的動態權重融合,讓網絡安全實現了從被動防御到主動預警的轉變。
談及項目創作的靈感來源,隊長崔湛林分享道:“基于對市場需求的理解和前沿技術的探索,我們意識到在 AI 時代加強網絡安全的迫切性,由此萌生了開發一個運行在 DPU 上的實時網絡安全系統的想法。在技術選型上,我們發現傳統檢測方式存在滯后性,因此創新性地引入了 AI 模型進行混合檢測與防御。”從需求分析到技術實現,Horizon 團隊展現了非凡的協作與執行能力。
從 350 微秒到 100 微秒延遲的突破性優化
在開發過程中,團隊遇到的核心技術挑戰是:如何將 AI 模型推理結果通過 DOCA Flow 寫入硬件表并將端到端延遲壓縮到 100μs(微秒)以內?
初始方案中,由于團隊默認使用了 PCIe 內存拷貝并受到中斷切換抖動的影響,實測延遲高達 350μs(微秒)以上,遠未達到目標。實現這種量級的性能優化極具挑戰性,幾乎沒有現成案例可循。
“這要求我們重新規劃底層硬件棧的數據流。”崔湛林解釋道。在 NVIDIA 技術專家的指導下,團隊啟用了 DOCA Zero Copy 技術,徹底消除了主機與 DPU 之間的數據拷貝。此外,他們還進行了深度系統優化:將 AI 推理容器綁定到特定 NUMA 節點,關閉處理器的 C States 節能狀態,并將關鍵中斷請求(IRQ)映射到專用的 CPU 核心上,從而最大程度減少了上下文切換帶來的延遲抖動。經過三輪迭代,團隊雖未完全達成 100μs 微秒的目標,但實現了顯著的性能突破,為后續優化奠定了基礎。
混合檢測架構為未來網絡安全保駕護航
該項目的創新之處在于其混合檢測架構和智能防御理念。Horizon 團隊首創的“規則檢測+LSTM 動態權重融合”方法,讓網絡安全實現了從被動到主動、從靜態到動態、從集中到邊緣的轉變。未來,他們計劃結合 Transformer、GNN 等先進架構,進一步優化模型,并探索多 DPU 協同的邊緣計算場景,將這一技術推向企業級安全產品的合規與運維監測、教育領域的網絡安全教學,以及 AI 安全算法研究等領域。
DOCA 開發者快問快答
Q
您是從哪里了解到 NVIDIA DPU 黑客松競賽的?參賽的目標是什么?
A
我們是通過 NVIDIA 官方公眾號及 DOCA 開發者社區關注到了本次競賽。參賽的核心目標在于系統性學習 NVIDIA BlueField DPU 等前沿技術,并積累實戰開發經驗。
Q
賽前舉辦的 DPU 線上技術訓練營對您的備賽起到哪些幫助?
A
訓練營為我們提供了深入了解 NVIDIA 最新網絡技術的寶貴機會,這極大地增強了我們進行技術選型和開發的信心。例如,我們最終選用的 Telemetry 與 Prometheus,正是基于我在訓練營中對相關技術演示的理解和應用。
Q
參與 NVIDIA DPU 黑客松競賽有哪些收獲?
A
這是我們第一次參加 NVIDIA DPU 黑客松競賽,備賽參賽體驗都很好。導師團隊的專業支持及時解決了我們遇到的技術難題,與其他參賽隊伍的互動也讓我們學習了許多創新理念與解決方案。
Q
本次競賽中最難忘的經歷是什么?
A
印象最深刻的是當遇到開發挑戰時,通過隊員的共同努力和導師團隊的專業指導破解了技術瓶頸,這種團隊協作攻破難題的感覺令人難忘。另外,我們也受邀去 NVIDIA 在北京的辦公室參加頒獎典禮,現場體驗了 NVIDIA 在 AI 上的強大生態,以及在硬件、軟件上的突破和創新,加強了我們在應用層做開發的信心。
Q
您是從什么渠道了解到 NVIDIA DOCA 的?什么契機使您成為 DOCA 開發者?
A
在 2024? 年的一次線上技術分享會上,演講者演示了如何通過 DOCA Flow 在網卡側完成線速 ACL,實現下行 CPU 負載驟降 70% ,這精準擊中了我們在網絡安全方案開發中的痛點。所以,當我們在 NVIDIA 官方微信公眾號看到第三屆 NVIDIA? DPU 黑客松的報名信息時,就決定通過實戰項目深入探索 DOCA,正式踏上 DOCA 開發之旅。
Q
最初從事 DOCA 開發時,有具體明確的目標嗎?
A
最開始是想要了解 NVIDIA BlueField DPU 和 NVIDIA DOCA 在網絡安全和邊緣計算中的潛力,于是開始嘗試官方提供的示例程序和 SDK。后面發現 DPU 在零信任安全框架、高性能網絡等領域都有很好表現,于是繼續探索 AI+網絡安全的方向。
Q
NVIDIA DOCA 中國開發者社區對你們有何幫助?
A
社區環境非常友好,DOCA 框架的文檔完整度極高,從驅動安裝到示例編譯都提供了詳盡的“一步一截圖”式指導,對初學者非常友好。社區的氛圍活躍且包容,官方定期組織技術分享活動,開發者之間也互相幫助答疑解惑,非常適合各階段的開發者成長。
開發者寄語
“DPU 在未來的 AI 工廠、零信任安全、邊緣計算等場景的潛力巨大,我們的項目只是開始。對于開發者而言,掌握 DOCA 開發技術意味著同時提升軟件與硬件協同優化的復合能力,這將在未來的數據中心和云計算領域構筑顯著競爭優勢。”——Horizon 團隊隊長 崔湛林
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109711 -
網絡安全
+關注
關注
11文章
3489瀏覽量
63407 -
AI
+關注
關注
91文章
39754瀏覽量
301342 -
DPU
+關注
關注
0文章
414瀏覽量
26962
原文標題:開發者故事 | 構建 AI 驅動的 DPU 實時網絡安全防御系統
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
人工智能時代,如何打造網絡安全“新范式”
攻擊逃逸測試:深度驗證網絡安全設備的真實防護能力
NVIDIA推出全新BlueField-4 DPU
陶氏化學借助AI技術重塑網絡安全
利用NVIDIA DOCA GPUNetIO技術提升MoE模型推理性能
制造商利用人工智能加強網絡安全防護
華為亮相2025國家網絡安全宣傳周
基于NVIDIA BlueField DPU的5G UPF數據面加速方案
NVIDIA助力Axio團隊打造全新DPU數據面開發框架
智慧路燈桿網絡安全監測:守護智慧城市的數字生命線
IPv6 與零信任架構重塑網絡安全新格局
利用NVIDIA DPU重塑網絡安全格局
評論