国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

盤點Pandas的100個常用函數

數據分析與開發 ? 來源:數據分析1480 ? 作者:劉順祥 ? 2021-04-01 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

經過一段時間的整理,本期將分享我認為比較常規的100個實用函數,這些函數大致可以分為六類,分別是統計匯總函數、數據清洗函數、數據篩選、繪圖與元素級運算函數、時間序列函數和其他函數。

一、統計匯總函數數據分析過程中,必然要做一些數據的統計匯總工作,那么對于這一塊的數據運算有哪些可用的函數可以幫助到我們呢?具體看如下幾張表。

96410908-9247-11eb-8b86-12bb97331649.png

96624186-9247-11eb-8b86-12bb97331649.png

import pandas as pd import numpy as np x = pd.Series(np.random.normal(2,3,1000)) y = 3*x + 10 + pd.Series(np.random.normal(1,2,1000)) # 計算x與y的相關系數 print(x.corr(y)) # 計算y的偏度 print(y.skew()) # 計算y的統計描述值 print(x.describe()) z = pd.Series([‘A’,‘B’,‘C’]).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分組,統計y的組內平均值 y.groupby(by = z).aggregate(np.mean)

968a6328-9247-11eb-8b86-12bb97331649.png

96a9b8b8-9247-11eb-8b86-12bb97331649.jpg

# 統計z中個元素的頻次 print(z.value_counts()) a = pd.Series([1,5,10,15,25,30]) # 計算a中各元素的累計百分比 print(a.cumsum() / a.cumsum()[a.size - 1])

96cea812-9247-11eb-8b86-12bb97331649.png

二、數據清洗函數同樣,數據清洗工作也是必不可少的工作,在如下表格中羅列了常有的數據清洗的函數。

96e2916a-9247-11eb-8b86-12bb97331649.jpg

x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #檢驗序列中是否存在缺失值 print(x.hasnans) # 將缺失值填充為平均值 print(x.fillna(value = x.mean())) # 前向填充缺失值 print(x.ffill())

96f12176-9247-11eb-8b86-12bb97331649.png

96f9eba8-9247-11eb-8b86-12bb97331649.png

income = pd.Series([‘12500元’,‘8000元’,‘8500元’,‘15000元’,‘9000元’]) # 將收入轉換為整型 print(income.str[:-1].astype(int)) gender = pd.Series([‘男’,‘女’,‘女’,‘女’,‘男’,‘女’]) # 性別因子化處理 print(gender.factorize()) house = pd.Series([‘大寧金茂府 | 3室2廳 | 158.32平米 | 南 | 精裝’, ‘昌里花園 | 2室2廳 | 104.73平米 | 南 | 精裝’, ‘紡大小區 | 3室1廳 | 68.38平米 | 南 | 簡裝’]) # 取出二手房的面積,并轉換為浮點型 house.str.split(‘|’).str[2].str.strip().str[:-2].astype(float)

9740314e-9247-11eb-8b86-12bb97331649.png

三、數據篩選數據分析中如需對變量中的數值做子集篩選時,可以巧妙的使用下表中的幾個函數,其中部分函數既可以使用在序列身上,也基本可以使用在數據框對象中。

976a23fa-9247-11eb-8b86-12bb97331649.png

np.random.seed(1234) x = pd.Series(np.random.randint(10,20,10)) # 篩選出16以上的元素 print(x.loc[x 》 16]) print(x.compress(x 》 16)) # 篩選出13~16之間的元素 print(x[x.between(13,16)]) # 取出最大的三個元素 print(x.nlargest(3)) y = pd.Series([‘ID:1 name:張三 age:24 income:13500’, ‘ID:2 name:李四 age:27 income:25000’, ‘ID:3 name:王二 age:21 income:8000’]) # 取出年齡,并轉換為整數 print(y.str.findall(‘age:(d+)’).str[0].astype(int))

97983e3e-9247-11eb-8b86-12bb97331649.png

四、繪圖與元素級函數

97adf68e-9247-11eb-8b86-12bb97331649.png

np.random.seed(123) import matplotlib.pyplot as plt x = pd.Series(np.random.normal(10,3,1000)) # 繪制x直方圖 x.hist() # 顯示圖形 plt.show() # 繪制x的箱線圖 x.plot(kind=‘box’) plt.show() installs = pd.Series([‘1280萬’,‘6.7億’,‘2488萬’,‘1892萬’,‘9877’,‘9877萬’,‘1.2億’]) # 將安裝量統一更改為“萬”的單位 def transform(x): if x.find(‘億’) != -1: res = float(x[:-1])*10000 elif x.find(‘萬’) != -1: res = float(x[:-1]) else: res = float(x)/10000 return res installs.apply(transform)

97fc5bbc-9247-11eb-8b86-12bb97331649.png

981dfbdc-9247-11eb-8b86-12bb97331649.png

983ede6a-9247-11eb-8b86-12bb97331649.png

五、時間序列函數

98644f1a-9247-11eb-8b86-12bb97331649.png

987f2696-9247-11eb-8b86-12bb97331649.png

98daee0e-9247-11eb-8b86-12bb97331649.png

六、其他函數

9912aa10-9247-11eb-8b86-12bb97331649.png

import numpy as np import pandas as pd np.random.seed(112) x = pd.Series(np.random.randint(8,18,6)) print(x) # 對x中的元素做一階差分 print(x.diff()) # 對x中的元素做降序處理 print(x.sort_values(ascending = False)) y = pd.Series(np.random.randint(8,16,100)) # 將y中的元素做排重處理,并轉換為列表對象 y.unique().tolist()

9955e87a-9247-11eb-8b86-12bb97331649.png

9977d3ae-9247-11eb-8b86-12bb97331649.png

原文標題:100 個 pandas 數據分析函數總結

文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 函數
    +關注

    關注

    3

    文章

    4417

    瀏覽量

    67514

原文標題:100 個 pandas 數據分析函數總結

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    嵌入式開發常用函數速查表

    在嵌入式開發中,掌握常用函數的用法可以大大提高開發效率。無論是單片機初學者還是有一定經驗的工程師,熟悉函數庫和調用方式都是必備技能。今天,我們為大家整理一份嵌入式開發常用
    的頭像 發表于 01-19 09:06 ?307次閱讀
    嵌入式開發<b class='flag-5'>常用</b><b class='flag-5'>函數</b>速查表

    請問如何從一函數內部判斷本函數是否是成員函數還是非成員函數

    如何從一函數內部判斷本函數是否是成員函數還是非成員函數
    發表于 01-06 06:30

    RFID盤點vs傳統人工盤點:企業庫存盤不準?選對工具是關鍵!

    傳統庫存盤點耗時耗力還不準?RFID手持機帶你告別Excel人工對賬,無需對準、批量識別、隔箱讀取,4步完成倉庫盤點,效率提升10倍以上!本文詳解 RFID 手持機盤點流程、適用場景及核心優勢,助力企業實現庫存可視化管理,提升現
    的頭像 發表于 12-31 14:01 ?261次閱讀
    RFID<b class='flag-5'>盤點</b>vs傳統人工<b class='flag-5'>盤點</b>:企業庫存盤不準?選對工具是關鍵!

    LUA例程-常用的回調函數使用說明

    詳細說明LUA腳本函數功能和對應的應用實例。對于LUA腳本編程有很大的幫助和提高技能。
    發表于 11-24 16:43 ?0次下載

    資產盤點 “跑斷腿”?RFID 無感盤點,1 天搞定全廠區

    資產盤點不是 “走過場”,而是摸清家底、降本增效的關鍵。RFID 無感盤點的價值,不止是 “1 天搞定全廠區” 的效率飛躍,更讓資產管理從 “事后核對” 變成 “實時可控”。
    的頭像 發表于 11-18 10:46 ?398次閱讀
    資產<b class='flag-5'>盤點</b> “跑斷腿”?RFID 無感<b class='flag-5'>盤點</b>,1 天搞定全廠區

    倉庫盤點誤差大總出錯,咋整?試試智能盤點解決方法

    倉庫盤點頻繁賬實不符?人工盤點誤差高、效率低,還吃掉利潤?RFID 智能盤點技術幫你解決!可以在2-25 米遠距離批量讀寫,庫存準確率飆升 99%+,盤點時間縮短一半,適配倉儲物流、制
    的頭像 發表于 11-05 11:56 ?406次閱讀
    倉庫<b class='flag-5'>盤點</b>誤差大總出錯,咋整?試試智能<b class='flag-5'>盤點</b>解決方法

    RFID標簽在庫存盤點中的應用

    RFID技術在庫存盤點中的應用正變得越來越廣泛,其通過無線電信號識別特定目標并讀取相關數據的能力,極大地提高了庫存管理的效率與準確性。以下是RFID標簽在庫存盤點中的一些具體應用和優勢:1.快速盤點
    的頭像 發表于 09-03 15:42 ?651次閱讀
    RFID標簽在庫存<b class='flag-5'>盤點</b>中的應用

    大彩講堂:VisualHMI-LUA教程-on_press回調函數使用指南

    屏幕會觸發回調函數100ms回調一次)?state:0-彈起、1-按下、2-長按?x:按下時X軸坐標?y:按下時Y軸坐標觸摸回調函數常用于做自定義待機邏輯,搭配
    的頭像 發表于 07-23 16:32 ?1213次閱讀
    大彩講堂:VisualHMI-LUA教程-on_press回調<b class='flag-5'>函數</b>使用指南

    精準盤點,無憂管理——RFID智能盤點終端解析

    RFID智能盤點終端高效、精準,利用RFID技術實現快速批量識別,實時更新數據,確保庫存信息準確無誤。其輕便易攜設計及簡潔操作界面使盤點工作輕松便捷。此外,該終端具有高可靠性,適用于各種環境,為企業帶來高效、精準的盤點體驗。
    的頭像 發表于 07-14 14:17 ?583次閱讀

    MSP430常用內聯函數說明

    電子發燒友網站提供《MSP430常用內聯函數說明.docx》資料免費下載
    發表于 06-05 17:20 ?0次下載

    FPC標簽在盤點中的應用

    RFID是一種通過無線電信號識別特定目標并讀取相關數據的技術。與傳統的條形碼技術相比,RFID技術具有顯著的優勢,如遠距離讀取、存儲更多信息以及更高的準確性和可靠性RFID在庫存盤點中的具體應用1.
    的頭像 發表于 05-09 15:21 ?567次閱讀
    FPC標簽在<b class='flag-5'>盤點</b>中的應用

    為什么不需要給回調函數傳遞參數

    回調函數是C語言里面一重要機制。
    的頭像 發表于 04-15 10:11 ?843次閱讀

    函數指針的六常見應用場景

    函數指針在嵌入式開發中有著廣泛的應用,它讓代碼更加靈活,減少冗余,提高可擴展性。很多時候,我們需要根據不同的情況動態調用不同的函數,而函數指針正是實現這一需求的重要工具。本文將介紹六
    的頭像 發表于 04-07 11:58 ?1477次閱讀
    <b class='flag-5'>函數</b>指針的六<b class='flag-5'>個</b>常見應用場景

    詳解RTOS中的Hook函數

    Hook函數是RTOS中的一關鍵特性,通過該函數,用戶可以增強對任務管理的控制,定義系統行為。
    的頭像 發表于 03-24 16:14 ?1081次閱讀

    39常用外圍硬件電路設計

    本文詳細介紹了39常用外圍硬件電路設計 獲取完整文檔資料可下載附件哦!!!!
    發表于 03-07 16:41