從“運維之困”到“模型驅動”:新一代網絡管理的必然演進
對于許多網絡運維工程師而言,這樣的一幕或許并不陌生:面對成百上千臺多廠商設備,一邊在命令行中重復著繁瑣的配置腳本,一邊在監(jiān)控屏幕上審視著分鐘級延遲的流量圖表,心中始終縈繞著一個疑問——在云原生與自動化浪潮席卷IT的今天,網絡運維為何依然如此“手工”與“滯后”?
這種普遍的“運維之困”,其根源在于我們長期依賴的兩大傳統(tǒng)支柱:CLI(命令行接口)與 SNMP(簡單網絡管理協(xié)議)。
- CLI是精確而直接的點對點控制工具,但在規(guī)模面前,極易因人為失誤導致配置漂移。
- SNMP曾開創(chuàng)了集中監(jiān)控的先河,但其基于靜態(tài)MIB庫與輪詢(Pull)的架構,使其在監(jiān)控精度、實時性以及業(yè)務導向的配置靈活性上力不從心。它們本質上都是面向設備參數,而非面向業(yè)務意圖的管理方式。
業(yè)務的敏捷性要求網絡能夠快速響應、動態(tài)調整。為此,IETF推出了 YANG(Yet Another Next Generation) 數據建模語言。YANG的出現,標志著網絡管理思維的根本轉變:它不再關注如何對單一設備“下命令”,而是關注如何用結構化的數據模型,清晰定義整個網絡的“期望狀態(tài)”。YANG模型層次化地描述了設備的配置、狀態(tài)乃至可執(zhí)行的操作,成為機器可讀、可編程的“網絡單一事實來源”。
YANG模型:為業(yè)務意圖提供標準化“語言”(基于 YANG 模型的幾種主流管理協(xié)議)
YANG模型的核心價值在于,它將運維人員的業(yè)務意圖(如“為某業(yè)務創(chuàng)建隔離通道”)與設備的具體配置指令解耦。工程師只需根據標準或廠商提供的YANG模型,撰寫描述最終狀態(tài)的XML或JSON文件(即數據實例),而由NETCONF、RESTCONF或gNMI等協(xié)議負責將其安全、可靠地下發(fā)至設備。

設備的配置管理
以下是使用 NETCONF 在星融元園區(qū)交換機的eth1上創(chuàng)建靜態(tài)ARP的示例。
Ethernet1 20.1.1.1/20 30.1.1.1/20 20.1.1.2 00:0e:c6:56:9d:35 30.1.1.2 00:0e:c6:56:9d:35
設備的運行狀態(tài)
設備供應商使用 YANG 模型描述設備上當前運行的各種接口和協(xié)議的所有運行狀態(tài),這些信息可以通過以下兩種方式獲取。
- 使用 NETCONF 的 GET RPC (遠程過程調用)和或供應商支持的其他管理接口的 RPC,與 SNMP 非常相似
- 使用網絡遙測技術(Telemetry)來定義需要監(jiān)控的字段,并將遙測信息發(fā)送到指定的收集器,采集精度可達納秒級
可見, YANG 數據模型適用于各種現代化的網絡管理場景,包括但不限于:
- 網絡配置管理:自動配置和同步網絡配置,減少人為錯誤,提高運營效率
- 網絡狀態(tài)監(jiān)控:利用 YANG 模型對網絡狀態(tài)進行實時監(jiān)控和驗證,從而實現主動管理和故障排除
- 網絡服務編排:支持 NFV 和 SDN 架構中的復雜服務定義和編排,從而實現動態(tài)的、按需的網絡服務
NETCONF
提供基于會話的完整事務機制(提交、確認、回滾),確保核心網絡配置變更的絕對準確性。(以下是一個典型的數據中心帶外管理網拓撲:

在帶外管理網絡內部部署一臺管理服務器,使其能與所有交換機進行網絡通信,即可對所有交換機進行集中管理,例如配置變更和狀態(tài)檢查。
NETCONF 和 YANG 提供了相對統(tǒng)一的操作接口來管理跨廠商的設備,同時具備強大的配置事務機制,配置失敗時可以自動回滾。盡管不同廠商的設備支持的YANG模型可能不同,但管理應用可以建立在相同的底座上對所有設備執(zhí)行相同的操作(如)。當具體的操作數據不同,可能需要網絡管理員針對不同廠商設備編寫不同的配置數據模板,而配置數據的語法又是相同的。
RESTCONF
RESTCONF 是 NETCONF 面向 RESTful API 的“簡化版”,2017年融合了 NETCONF 和 HTTP 協(xié)議的 RESTCONF 悄然誕生,為用戶提供高效開發(fā) Web 化運維工具的能力,提供的編程接口符合IT業(yè)界流行RESTful風格,與現代云原生應用和 DevOps 工具鏈(如 Ansible, Python腳本)集成度極高,學習成本低。使用標準的HTTP動詞(GET/POST/PUT/DELETE),讓網絡配置能無縫嵌入Ansible、Python等DevOps流水線,實現基礎設施即代碼。
gNMI(基于gRPC)
利用HTTP/2長連接和Protocol Buffers編碼,原生支持配置與流式遙測(Streaming Telemetry)。運維人員可以像訂閱新聞一樣,持續(xù)、實時地接收設備狀態(tài)更新,精度可達納秒級,徹底告別低效輪詢。
在常規(guī)的狀態(tài)查詢和配置修改方面,gNMI 和 NETCONF 的能力相差無幾;但對于大型數據中心、云網絡、5G 核心網等需要海量、實時監(jiān)控數據和高頻配置的場景,gNMI 性能卓越,通過單一協(xié)議解決了配置與監(jiān)控需求,并且原生支持流式遙測,推送模式效率遠高于輪詢,是云原生/可編程網絡的首選。
以下是一個典型的數據中心云網場景組網拓撲,使用遙測方式對網絡進行監(jiān)控:

通過連接數據中心網絡交換機提供的額外 10G 接口并輔以隔離性配置,監(jiān)控服務器可在不干擾業(yè)務流量的情況下對所有設備發(fā)起gNMI訂閱請求,持續(xù)高頻獲取網絡設備的各類信息,只要是設備支持的YANG模型有建模的數據均可。
gNMI 可采集的數據十分豐富,可用于監(jiān)控設備狀態(tài)、監(jiān)控流量計數,配合 Prometheus 和 Grafana 等可視化工具,以上時序數據可被轉化為直觀的統(tǒng)計圖表,并進一步實現系統(tǒng)異常告警、流量分析等功能。
以統(tǒng)一模型驅動全場景網絡
星融元自2025年底起,在全系列運行AsterNOS的交換機(涵蓋數據中心核心、園區(qū)接入及邊緣網關)中,全面內置了對標準YANG模型及上述三大協(xié)議的支持。這意味著,無論網絡設備身處何地,運維團隊都能使用同一套模型化的方法進行管理:
- 在數據中心:通過gNMI訂閱,實時可視化微突發(fā)流量與設備內部狀態(tài),結合Prometheus+Grafana實現預警式運維。
- 在園區(qū)網:通過RESTCONF接口,與自動化平臺集成,實現新業(yè)務網絡的分鐘級開通。
- 在邊緣:通過NETCONF可靠地下發(fā)復雜路由策略,確保配置的嚴格一致性。

邁向自驅型網絡
YANG模型的價值遠不止于替代CLI或SNMP。它奠定了模型驅動網絡(Model-Driven Networking)的基石,使得網絡真正成為可被軟件定義、驗證和閉環(huán)控制的智能實體。未來,結合AI算法,網絡管理系統(tǒng)能夠基于YANG模型實時驗證網絡狀態(tài)是否符合業(yè)務意圖,并自動執(zhí)行優(yōu)化或修復動作。
我們通過全面擁抱YANG及新一代管理協(xié)議,正助力用戶跨越傳統(tǒng)的運維鴻溝,駛向更自動化、更智能的網絡未來。
【參考資料】
https://datatracker.ietf.org/doc/html/rfc6020
https://zhuanlan.zhihu.com/p/139500393
https://medium.com/@k.okasha/yang-and-road-to-a-model-driven-network-e9e52d47148d
https://blog.csdn.net/puhaiyang/article/details/137432500
-
交換機
+關注
關注
23文章
2904瀏覽量
104462
發(fā)布評論請先 登錄
NETCONF、RESTCONF與gNMI:YANG模型下的三大管理協(xié)議解析
評論