国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python pacp模塊:自動識別文字中的省市區并將其繪圖

python爬蟲知識分享 ? 來源:python爬蟲知識分享 ? 作者:python爬蟲知識分享 ? 2022-06-27 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個用于提取簡體中文字符串中省,市和區并能夠進行映射,檢驗和簡單繪圖的python模塊。

舉個例子:

["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區"]
        ↓ 轉換
|省    |市   |區    |地址                 |
|上海市|上海市|徐匯區|虹漕路461號58號樓5樓  |
|福建省|泉州市|洛江區|萬安塘西工業區        |

注:“地址”列代表去除了省市區之后的具體地址

也可以將大段文本中所有提到的地址提取出來,并且自動將相鄰的存在所屬關系的地址歸并到一條記錄中(0.5.5版本新功能):

"分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區"
        ↓ 轉換
|省    |市   |區    |
|上海市|上海市|徐匯區|
|福建省|泉州市|洛江區|
|江蘇省|南京市|鼓樓區|

代碼目前僅僅支持python3

pip install cpca

注:cpca是chinese province city area的縮寫

如果覺得本模塊對你有用的話,施舍個star,謝謝。

常見安裝問題:

在 windows 上可能會出現類似如下問題

Building wheel for pyahocorasick (setup.py) ... error

先去下載 Microsoft Visual C++ Build Tools, 安裝完成后,再重新使用 pip install cpca 安裝,即可解決問題

開始使用

本模塊中最主要的方法是cpca.transform,該方法可以輸入任意的可迭代類型(如list,pandas的Series類型等),然后將其轉換為一個DataFrame,下面演示一個最為簡單的使用方法:

location_str = ["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "北京朝陽區北苑華貿城"]
import cpca
df = cpca.transform(location_str)
df

輸出的結果為(adcode為官方地址編碼):

   省     市    區          地址              adcode
0 上海市 上海市  徐匯區     虹漕路461號58號樓5樓  310104
1 福建省 泉州市  洛江區     萬安塘西工業區        350504
2 北京市 市轄區  朝陽區     北苑華貿城           110105

如果你想獲知程序是從字符串的那個位置提取出省市區名的,可以添加一個pos_sensitive=True參數:

location_str = ["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "北京朝陽區北苑華貿城"]
import cpca
df = cpca.transform(location_str, pos_sensitive=True)
df

輸出如下:

     省    市    區        地址               adcode        省_pos  市_pos 區_pos
0  上海市  上海市  徐匯區  虹漕路461號58號樓5樓   310104     -1     -1      0
1  福建省  泉州市  洛江區  萬安塘西工業區         350504     -1      0      3
2  北京市  市轄區  朝陽區  北苑華貿城            110105     -1     -1      0

從大段文本中提取多個地址(0.5.5版本新功能):

import cpca
df = cpca.transform_text_with_addrs("分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區")
df

結果為(注意 transform_text_with_addrs 獲得的數據,“地址”列都是空的):

    省     市     區    地址   adcode
0  上海市  市轄區  徐匯區       310104
1  福建省  泉州市  洛江區       350504
2  江蘇省  南京市  鼓樓區       320106

transform_text_with_addrs 還支持和 transform 類似的 index, pos_sensitive 以及 umap 參數

繪圖:

模塊中還自帶一些簡單繪圖工具,可以在地圖上將上面輸出的數據以熱力圖的形式畫出來.

這個工具依賴folium,為了減小本模塊的體積,所以并不會預裝這個依賴,在使用之前請使用pip install folium .

代碼如下:

import cpca
from cpca import drawer
df = cpca.transform_text_with_addrs("分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區")
drawer.draw_locations(df[cpca._ADCODE], "df.html")

繪圖展示

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動識別
    +關注

    關注

    3

    文章

    234

    瀏覽量

    23953
  • python
    +關注

    關注

    57

    文章

    4876

    瀏覽量

    90037
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何使用Python讀取不間斷數據,并將其傳輸到LabVIEW進行處理?

    使用Python讀取Count,如何將讀取到的數據傳輸至Labview;傳輸過程Python要保持讀取的動作,不能停止。
    發表于 01-23 11:09

    瑞芯微(EASY EAI)RV1126B OCR文字識別

    1.OCR文字識別簡介文字識別也是圖像領域一個常見問題。然而,對于自然場景圖像,首先要定位圖像文字
    的頭像 發表于 01-12 10:19 ?5748次閱讀
    瑞芯微(EASY EAI)RV1126B OCR<b class='flag-5'>文字</b><b class='flag-5'>識別</b>

    AIDC:自動識別數據的未來趨勢與算力基石的雙重演進

    在數字化轉型浪潮席卷全球的背景下,自動識別與數據采集(AIDC)技術不僅是連接物理世界與數字系統的“眼睛”,更是各行業提升效率的核心引擎。與此同時,隨著人工智能的爆發,AI數據中心(同樣縮寫為AIDC)作為承載這些海量數據處理的“心臟”,正在經歷一場深刻的變革。
    的頭像 發表于 12-30 16:56 ?1744次閱讀

    沒有專利的opencv-python 版本

    所有 官方發布的 opencv-python 核心版本(無 contrib 擴展)都無專利風險——專利問題僅存在于 opencv-contrib-python 擴展模塊的少數算法(如
    發表于 12-13 12:37

    新大陸自動識別馬來西亞智造基地順利量產

    馬來西亞檳城,歷來是海外華人的創業福地。作為海外華商網絡歷經百年沉淀的關鍵節點,其不僅延續著深厚的百年商脈,更傳承著華人堅韌不拔的開拓精神。如今,在這片熱土上,新大陸自動識別公司與當地領先的電子制造服務商NationGate正式啟動量產合作,共同見證中國智造揚帆遠航的重要時刻。
    的頭像 發表于 10-11 17:53 ?1713次閱讀

    新大陸自動識別亮相2025國國際工業博覽會

    9月23日,工業領域年度盛會——CIIF2025國工業博覽會正式拉開帷幕!新大陸自動識別聚焦工業制造核心需求,以“AI驅動 開拓工業識別新大陸”為主題,攜 AI 驅動的智能識別產品組
    的頭像 發表于 09-30 15:24 ?965次閱讀

    【EASY EAI Orin Nano開發板試用體驗】PP-OCRV5文字識別實例搭建與移植

    參數填上dec模型的路徑,在第三個參數填上rec模型的路徑,在第四個參數填上需要進行文字識別的源圖片: 看看效果: RK3588
    發表于 08-18 16:57

    基于LockAI視覺識別模塊:手寫數字識別

    手寫數字識別是一種經典的模式識別和圖像處理問題,旨在通過計算機自動識別用戶手寫的數字。本文將教會你如何使用基于RV1106的LockAI視覺識別模塊
    的頭像 發表于 06-30 15:44 ?1115次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b><b class='flag-5'>模塊</b>:手寫數字<b class='flag-5'>識別</b>

    揭秘單裝自動識別銘牌:基于RFID的毫秒級非接觸群讀如何革新大型裝備管理

    單裝自動識別銘牌安裝于大型裝備的規定位置,采用射頻識別技術,用于裝備的遠距離自動識別。該設備的核心功能是依托RFID技術,實現目標個體身份及關鍵屬性數據的自動化、非接觸式采集與
    的頭像 發表于 06-25 15:55 ?646次閱讀
    揭秘單裝<b class='flag-5'>自動識別</b>銘牌:基于RFID的毫秒級非接觸群讀如何革新大型裝備管理

    工信部電子信息司領導蒞臨行芯科技調研

    近日,工業和信息化部電子信息司王世江副司長一行到行芯科技進行專題調研,省市區經信部門相關負責人隨行陪同。
    的頭像 發表于 06-11 10:38 ?1466次閱讀

    新大陸自動識別亮相印尼市場行業盛會

    這個5月,新大陸自動識別(Newland AIDC)攜手印尼合作伙伴,以一場硬核科技盛宴掀起東南亞智能浪潮!作為本次活動的金牌贊助商,新大陸自動識別全面展示了在智能數據采集方面的最新成果。來自制造、物流、汽車等多領域的行業決策者和技術專家齊聚,見證數據賦能的無限可能。
    的頭像 發表于 05-29 16:14 ?834次閱讀

    新大陸自動識別2025印度合作伙伴大會成功舉辦

    近日,新大陸自動識別總部(中國·福州)迎來了一場跨越國界的智慧碰撞——2025印度合作伙伴大會圓滿舉辦!印度核心伙伴線上線下齊聚一堂,以“共創·共建·共贏(Innovate. Collaborate. Accelerate.)”為號角,共探發展新機遇!
    的頭像 發表于 04-22 17:26 ?971次閱讀

    rfid技術是如何應用在集裝箱自動識別的呢?

    在現代集裝箱物流管理,快速、準確地識別集裝箱號碼是提升港口、堆場和海關運作效率的關鍵。隨著技術的發展,RFID(射頻識別)技術與OCR視覺識別相結合,為集裝箱
    的頭像 發表于 04-18 10:13 ?903次閱讀
    rfid技術是如何應用在集裝箱<b class='flag-5'>自動識別</b>的呢?

    火車車號自動識別系統如何應對夜間識別難題?

    在鐵路運輸領域,火車車號自動識別系統已成為提升管理效率和運輸安全的重要工具。然而,夜間環境光線不足、車體反光、天氣干擾等因素,給車號識別帶來了巨大挑戰。針對這些問題,現代識別系統通過多維度技術創新
    的頭像 發表于 04-16 09:59 ?737次閱讀
    火車車號<b class='flag-5'>自動識別</b>系統如何應對夜間<b class='flag-5'>識別</b>難題?

    MS7026 新一代視頻解碼芯片

    MS7026 是一顆 NTSC、PAL,視頻解碼的產品。基于內部的模式檢測模塊,對輸入信號進行自動識別并將其轉換成數字 8-Bit ITU-RBT656 信號。MS7026 功能支持 3D 視頻解碼和隔行到逐行視頻的轉換。
    發表于 04-14 18:04