1 引言
隨著大數據時代的迅猛發展,人們對LBS(Location Based Services,基于位置服務)的需求也快速增長,無線定位技術逐步得到重視,位置服務已經成為一種熱門的技術。輔助GPS(AGPS)定位技術結合了GPS定位和蜂窩基站定位的優勢,借助蜂窩網絡的數據傳輸功能,可以快速精準地定位,在移動設備尤其是手機終端中被廣泛使用。運營商通過更新4G網絡主設備網管,即新增輔助GPS和異網檢測功能,實現了基站MR(Measurement Report,測量報告)數據版本升級。在新的數據源中不僅能夠獲取到精確的GPS地理信息,同時異網檢測功能也可以針對其他運營商網絡覆蓋強度進行周期測量,從而解決了當前MR應用過程中定位精度不足和只能評估本網絡覆蓋情況的局限。通過本次研究,可以有效拓展MR的分析能力,針對三網(中國移動、中國電信、中國聯通)的覆蓋情況進行對比分析。
本文通過對輔助GPS數據的挖掘分析,預測出運營商的基站覆蓋中心點,可以實現運營商之間的網絡可持續化對比,為解決傳統三網對比測試樣本不充足、對比不全面的問題提供一種有效解決方案。
2 運營商基站覆蓋中心點預測
以基站采集到的終端測量報告作為數據源,并將數據源按頻點和PCI(Physical CellIdentifier,物理小區標識)進行分組,對分組后的每組數據用Mean-Shift(偏移均值向量算法)算法做首次密度聚類[3-4],找到局部最優的基站覆蓋中心點。結合專業的業務背景知識,對局部基站覆蓋中心點用DBSCAN算法做二次聚類,找到全局最優的基站覆蓋中心點[5-8]。最后用本網的主覆蓋小區來驗證所預測出來的基站覆蓋中心點的正確性。具體流程如圖1所示:

圖1 運營商基站覆蓋中心點預測流程
2.1 數據源提取及清洗
本模型采用中國電信全省MR的輔助GPS相關數據,主要包括:各運營商的頻點、PCI、用戶個人上報的百度經緯度、地市、中國電信主服務小區百度經緯度等屬性,并對每條記錄中的異常數據、無效數據進行了清洗。為減少鄰區等干擾因素影響模型的準確度,本模型只提取了室外且相距主服務小區1 km以內的MR記錄。
2.2 Mean-Shift算法聚類過程
Mean-Shift算法是一個迭代的過程。對于d維空間的N個樣本點,首先隨機選擇一個點,并以這個點為圓心、以R為半徑做一個d維的高維球,落在這個球內的所有樣本點和圓心都會產生一個向量,每個向量都以圓心為起點、以球內的樣本點為終點,計算出球內所有向量的和,最終得出Mean-Shift向量。再以Mean-Shift向量的終點為圓心重復上述步驟。由同起點向量求和法則可知,Mean-shift向量最終將收斂到概率密度最大的區域[9]。Mean-Shift向量的基本形式如下:

(1)
其中,x為空間中任意一點;D表示在N個樣本點xi中有D個點落在SD區域中。
Mean-Shift算法的偽代碼思想如下:
(1)隨機選擇一點為中心點,固定一個窗口,計算出Mean-Shift向量;
(2)判斷是否達到收斂,若收斂則終止,否則執行第(3)步;
(3)以Mean-Shift向量的終點為新的中心,重復上述步驟[10]。
由于獲取到的用戶輔助GPS數據呈現出無規律分布,因此采用基于概率密度的Mean-Shift算法進行聚類分析。該算法忽略了數據源中的異常值,每次只對窗口內局部數據進行計算,計算完成后再移動窗口。
本模型首先以中國電信的數據做訓練集,以頻點和PCI作為分組條件,分別把具有相同頻點和PCI的個人上報百度經緯度進行聚類。經過多次模型訓練并結合業務實際,本模型最終設置的Mean-Shift窗寬系數為0.02,聚類得到多個同一頻點和PCI下多個基站覆蓋中心經緯度。預測中國電信室外的基站覆蓋中心點有159 284個,將預測出來的覆蓋中心點經緯度與中國電信MR數據本身提供的小區百度經緯度在百度地圖上作距離對比。結果表明,對于廣州市區統計出基站覆蓋中心點有80.3%落在主覆蓋小區對應方向角附近150 m以內,但在同一頻點和PCI下有部分預測的基站覆蓋中心點相距較近。結合專業的業務知識,運用區域聚類算法DBSCAN進行二次聚類,將屬于同頻點同PCI且相距較近的基站覆蓋中心點聚為一個新中心點。
2.3 DBSCAN二次聚類過程
DBSCAN是一種基于高密度連通區域的聚類算法,能夠將具有足夠高密度的區域劃分為簇。該算法需要兩個核心的參數:一個參數是半徑,表示以給定點P為中心的圓形鄰域的范圍;另一個參數是以點P為中心的鄰域內最少點的數量[11]。
基于本模型需求和專業的業務知識,模型設置的半徑為200 m,鄰域內最少點數量設置為1,從而可以將具有相同頻點和PCI且距離較近的基站覆蓋中心點聚類成一個新的中心點。將基站覆蓋中心點經緯度與中國電信MR數據提供的小區經緯度作距離核對,該模型預測出中國電信室外共有155 244個基站覆蓋中心點。對于廣州市區統計出基站覆蓋中心點有83.6%落在主覆蓋小區對應方向角附近150 m以內,符合實際業務規則。
DBSCAN算法的偽代碼思想如下:
(1)選取鄰域半徑為200 m,鄰域內最少點數為1;
(2)隨機選取一點為中心點,計算相同頻點和PCI下的主覆蓋小區中心點的距離,若滿足條件,則加入該鄰域,并以新加入的點為中心判斷其余點是否滿足條件,直到遍歷完所有點,計算出該鄰域新的中心點,并把屬于該鄰域的點從原數據中刪除;
(3)從剩余的點中隨機選取一點為新的中心,重復第(2)步直到原數據中所有點都被重新歸類完畢為止。
3 運營商基站覆蓋中心點對比分析
通過上述模型,采用相同的方法可以預測出異網基站覆蓋中心點的位置及其數量,預測出運營商A室外有231 948個基站覆蓋中心點、運營商B室外有92 668個基站覆蓋中心點。將三家運營商的基站覆蓋中心點預測結果顯示在百度地圖上,以廣州兩個區域Ⅰ、Ⅱ為例,具體如圖2和圖3所示:

圖2 區域Ⅰ運營商基站覆蓋中心點對比

圖3 區域Ⅱ運營商基站覆蓋中心點對比
其中,扇形表示運營商真實的主覆蓋小區所在的位置;圓形表示用模型預測出來的基站覆蓋中心點所在的位置;黃色表示運營商A、藍色表示運營商B、紅色表示運營商C。
從圖2和圖3可以看出,預測得到的基站覆蓋中心點跟真實的小區相距較近,能夠直觀地描繪出三家運營商的覆蓋區域及覆蓋密度。通過這種直觀的比較,不僅可以掌握異網的大致網絡分布,而且也易于了解哪些區域是本網盲區、哪些區域需要加強覆蓋,為網絡建設規劃和智慧網優提供強有力的支撐。
4 結束語
本文通過對MR數據的挖掘分析,預測出運營商的基站覆蓋中心點,可以全面掌握運營商主覆蓋小區的大致分布和覆蓋密度,為全面評估網絡覆蓋程度提供有力支撐,也為掌握異網的網絡規劃和發展規模提供理論依據。后續將對全集團的MR數據做相同的挖掘分析,為全集團的網絡規劃、智慧網優、優化布局提供全方位智能化分析方法,進一步提升網絡資源投放效率。
責任編輯:gt
-
運營商
+關注
關注
4文章
2438瀏覽量
46516 -
gps
+關注
關注
22文章
3030瀏覽量
173559 -
中國移動
+關注
關注
22文章
5719瀏覽量
78128
發布評論請先 登錄
君耀壓敏電阻KD14系列與KD14-X8系列對比分析指南
不同品牌光隔離探頭關鍵性能參數對比分析
信而泰GPS異地測試解決方案:跨越空間的通信測試
對比分析電能質量在線監測裝置支持的斷點續傳文件傳輸協議的優缺點
AES加密模式簡介與對比分析
告別 “能耗糊涂賬”!Acrel Cloud-7000 企業能源管控平臺,數據驅動降本增效
XKCON祥控輸煤皮帶智能機器人巡檢系統對監測數據進行挖掘分析
基于MR數據挖掘和GPS定技術預測三網覆蓋情況進行對比分析
評論