国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用Python算法預測客戶行為案例!

數據分析與開發 ? 來源:CSDN ? 作者:ChangingWudake ? 2022-10-27 13:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是一份kaggle上的銀行的數據集,研究該數據集可以預測客戶是否認購定期存款y。這里包含20個特征。

1. 分析框架

ab54dfda-55b5-11ed-a3b6-dac502259ad0.png

2. 數據讀取,數據清洗

#導入相關包
importnumpyasnp
importpandasaspd
#讀取數據
data=pd.read_csv('./1bank-additional-full.csv')
#查看表的行列數
data.shape

輸出:

ab69c184-55b5-11ed-a3b6-dac502259ad0.pngab7ee2a8-55b5-11ed-a3b6-dac502259ad0.png

這里只有nr.employed這列有丟失數據,查看下:

data['nr.employed'].value_counts()
ab8febf2-55b5-11ed-a3b6-dac502259ad0.png

這里只有5191.0這個值,沒有其他的,且只有7763條數據,這里直接將這列當做異常值,直接將這列直接刪除了。

#data.drop('nr.employed',axis=1,inplace=True)

3. 探索性數據分析

3.1查看各年齡段的人數的分布

這里可以看出該銀行的主要用戶主要集中在23-60歲這個年齡層,其中29-39這個年齡段的人數相對其他年齡段多。

importmatplotlib.pyplotasplt
importseabornassns
plt.rcParams['font.sans-serif']='SimHei'
plt.figure(figsize=(20,8),dpi=256)
sns.countplot(x='age',data=data)
plt.title("各年齡段的人數")
aba1f54a-55b5-11ed-a3b6-dac502259ad0.png

3.2 其他特征的一些分布

plt.figure(figsize=(18,16),dpi=512)
plt.subplot(221)
sns.countplot(x='contact',data=data)
plt.title("contact分布情況")

plt.subplot(222)
sns.countplot(x='day_of_week',data=data)
plt.title("day_of_week分布情況")

plt.subplot(223)
sns.countplot(x='default',data=data)
plt.title("default分布情況")

plt.subplot(224)
sns.countplot(x='education',data=data)
plt.xticks(rotation=70)
plt.title("education分布情況")

plt.savefig('./1.png')
abaf93a8-55b5-11ed-a3b6-dac502259ad0.png
plt.figure(figsize=(18,16),dpi=512)
plt.subplot(221)
sns.countplot(x='housing',data=data)
plt.title("housing分布情況")

plt.subplot(222)
sns.countplot(x='job',data=data)
plt.xticks(rotation=70)
plt.title("job分布情況")

plt.subplot(223)
sns.countplot(x='loan',data=data)
plt.title("loan分布情況")

plt.subplot(224)
sns.countplot(x='marital',data=data)
plt.xticks(rotation=70)
plt.title("marital分布情況")

plt.savefig('./2.png')
ac1c1ffa-55b5-11ed-a3b6-dac502259ad0.png
plt.figure(figsize=(18,8),dpi=512)
plt.subplot(221)
sns.countplot(x='month',data=data)
plt.xticks(rotation=30)

plt.subplot(222)
sns.countplot(x='poutcome',data=data)
plt.xticks(rotation=30)
plt.savefig('./3.png')
ac34c794-55b5-11ed-a3b6-dac502259ad0.png

3.3 各特征的相關性

plt.figure(figsize=(10,8),dpi=256)
plt.rcParams['axes.unicode_minus']=False
sns.heatmap(data.corr(),annot=True)
plt.savefig('./4.png')
ac414b4a-55b5-11ed-a3b6-dac502259ad0.png

4. 特征規范化

4.1 將自變量的特征值轉換成標簽類型

#特征化數據
fromsklearn.preprocessingimportLabelEncoder
features=['contact','day_of_week','default','education','housing',
'job','loan','marital','month','poutcome']

le_x=LabelEncoder()
forfeatureinfeatures:
data[feature]=le_x.fit_transform(data[feature])

4.2 將結果y值轉換成0、1

defparse_y(x):
if(x=='no'):
return0
else:
return1
data['y']=data['y'].apply(parse_y)
data['y']=data['y'].astype(int)

4.3 數據規范化

#數據規范化到正態分布的數據
#測試數據和訓練數據的分割
fromsklearn.preprocessingimportStandardScaler
fromsklearn.model_selectionimporttrain_test_split
ss=StandardScaler()
train_x,test_x,train_y,test_y=train_test_split(data.iloc[:,:-1],
data['y'],
test_size=0.3)
train_x=ss.fit_transform(train_x)
test_x=ss.transform(test_x)

5. 模型訓練

5.1 AdaBoost分類器

fromsklearn.ensembleimportAdaBoostClassifier
fromsklearn.metricsimportaccuracy_score
ada=AdaBoostClassifier()
ada.fit(train_x,train_y)
predict_y=ada.predict(test_x)
print("準確率:",accuracy_score(test_y,predict_y))
ac766c58-55b5-11ed-a3b6-dac502259ad0.png

5.2 SVC分類器

fromsklearn.svmimportSVC
svc=SVC()
svc.fit(train_x,train_y)
predict_y=svc.predict(test_x)
print("準確率:",accuracy_score(test_y,predict_y))
ac8cedf2-55b5-11ed-a3b6-dac502259ad0.png

5.3 K鄰近值分類器

fromsklearn.neighborsimportKNeighborsClassifier
knn=KNeighborsClassifier()
knn.fit(train_x,train_y)
predict_y=knn.predict(test_x)
print("準確率:",accuracy_score(test_y,predict_y))
aca7deb4-55b5-11ed-a3b6-dac502259ad0.png

5.4 決策樹分類器

fromsklearn.treeimportDecisionTreeClassifier
dtc=DecisionTreeClassifier()
dtc.fit(train_x,train_y)
predict_y=dtc.predict(test_x)
print("準確率:",accuracy_score(test_y,predict_y))
acbbf70a-55b5-11ed-a3b6-dac502259ad0.png

6 模型評價

6.1 AdaBoost分類器

fromsklearn.metricsimportroc_curve
fromsklearn.metricsimportauc
plt.figure(figsize=(8,6))
fpr1,tpr1,threshoulds1=roc_curve(test_y,ada.predict(test_x))
plt.stackplot(fpr1,tpr1,color='steelblue',alpha=0.5,edgecolor='black')
plt.plot(fpr1,tpr1,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr1,tpr1))
plt.title('AdaBoost分類器的ROC曲線')
acd2f4a0-55b5-11ed-a3b6-dac502259ad0.png

6.2 SVC分類器

plt.figure(figsize=(8,6))
fpr2,tpr2,threshoulds2=roc_curve(test_y,svc.predict(test_x))
plt.stackplot(fpr2,tpr2,alpha=0.5)
plt.plot(fpr2,tpr2,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr2,tpr2))
plt.title('SVD的ROC曲線')
ace52328-55b5-11ed-a3b6-dac502259ad0.png

6.3 K鄰近值分類器

plt.figure(figsize=(8,6))
fpr3,tpr3,threshoulds3=roc_curve(test_y,knn.predict(test_x))
plt.stackplot(fpr3,tpr3,alpha=0.5)
plt.plot(fpr3,tpr3,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr3,tpr3))
plt.title('K鄰近值的ROC曲線')
ad0006ac-55b5-11ed-a3b6-dac502259ad0.png

6.4 決策樹分類器

plt.figure(figsize=(8,6))
fpr4,tpr4,threshoulds4=roc_curve(test_y,dtc.predict(test_x))
plt.stackplot(fpr4,tpr4,alpha=0.5)
plt.plot(fpr4,tpr4,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr4,tpr4))
plt.title('決策樹的ROC曲線')
ad123c96-55b5-11ed-a3b6-dac502259ad0.png

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98072
  • 數據分析
    +關注

    關注

    2

    文章

    1516

    瀏覽量

    36226
  • python
    +關注

    關注

    57

    文章

    4876

    瀏覽量

    90045

原文標題:用 Python 算法預測客戶行為案例!

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    、鏈式法則等。應用場景:梯度下降優化算法、反向傳播計算等。 優化理論核心內容:凸優化、非凸優化、拉格朗日乘數法等。應用場景:模型參數調優、資源分配問題等。 編程語言Python:主流選擇,用于數據處理、模型
    發表于 02-27 10:53

    沒有專利的opencv-python 版本

    所有 官方發布的 opencv-python 核心版本(無 contrib 擴展)都無專利風險——專利問題僅存在于 opencv-contrib-python 擴展模塊中的少數算法(如早期 SIFT
    發表于 12-13 12:37

    Python中借助NVIDIA CUDA Tile簡化GPU編程

    兼容未來的 GPU 架構。借助 NVIDIA cuTile Python,開發者可以直接 Python 編寫 tile kernels。
    的頭像 發表于 12-13 10:12 ?1203次閱讀
    在<b class='flag-5'>Python</b>中借助NVIDIA CUDA Tile簡化GPU編程

    labview如何實現數據的采集與實時預測

    現有以下問題:labview可以實現數據的采集以及調用python代碼,但如何將這兩項功能集成在一個VI文件里,從而實現數據的采集與實時預測?,F有條件如下:已完成數據的采集系統,python中的
    發表于 12-03 21:13

    Python調用API教程

    兩個不同系統之間的信息交互。在這篇文章中,我們將詳細介紹Python調用API的方法和技巧。 一、Requests庫發送HTTP請求 使用Python調用API的第一步是發送HTTP請求,通常
    的頭像 發表于 11-03 09:15 ?887次閱讀

    蜂鳥E203簡單分支預測的改進

    1.蜂鳥E203的原有分支預測 蜂鳥E203處理器為了能夠連續不斷的取指令,需要在每個時鐘周期都能生成一條待取的指令。因此,在取指令的階段,IFU單元模塊進行了簡單的譯碼處理,用以判別
    發表于 10-24 07:45

    基于全局預測歷史的gshare分支預測器的實現細節

    GShare預測機制簡介 GShare預測機制作為一種常用的分支預測機制,通過基于分支歷史和分支地址來預測分支指令的執行路徑。分支歷史是指處理器在執行程序時遇到的所有分支指令的執行情
    發表于 10-22 06:50

    Python 給 Amazon 做“全身 CT”——可量產、可擴展的商品詳情爬蟲實戰

    一、技術選型:為什么選 Python 而不是 Java? 結論: “調研階段 Python,上線后如果 QPS 爆表再考慮 Java 重構?!?二、整體架構速覽(3 分鐘看懂) 三、開發前準備(5
    的頭像 發表于 10-21 16:59 ?519次閱讀
    <b class='flag-5'>用</b> <b class='flag-5'>Python</b> 給 Amazon 做“全身 CT”——可量產、可擴展的商品詳情爬蟲實戰

    Python modbus-tk如何獲得客戶端信息?

    Python modbus-tk如何獲得客戶端信息
    發表于 08-07 06:01

    電商API的五大應用場景:解鎖增長新機遇

    。 #### 4. 智能推薦系統:驅動銷售轉化和交叉銷售 推薦API利用AI算法(如協同過濾)分析用戶行為,推薦相關產品。協同過濾公式為: 預測評分_{u,i} = \\\\sum_{j \\\\in N
    發表于 06-24 14:29

    如何用AI實現電池壽命的精準預測?飛凌RK3588+融合算法給你答案

    飛凌嵌入式將AI算法(CNN+LSTM融合)和RK3588核心板相結合,成功突破這些限制,帶來高效、精準的鋰電池壽命預測
    的頭像 發表于 06-20 10:07 ?3532次閱讀
    如何用AI實現電池壽命的精準<b class='flag-5'>預測</b>?飛凌RK3588+融合<b class='flag-5'>算法</b>給你答案

    工地AI行為識別系統作用

    工地AI行為識別系統作用 工地AI行為識別系統是什么? 工地AI行為識別系統是一種基于人工智能技術的智能監控方案,通過攝像頭+AI算法,實時分析工地人員
    的頭像 發表于 05-08 12:00 ?941次閱讀

    景區AI行為識別系統作用

    景區AI行為識別系統作用 景區AI行為識別系統是什么? 景區AI行為識別系統是利用人工智能技術(如視頻分析、人臉識別)構建的智能管理方案。通過部署攝像頭+AI算法,實時監控游客
    的頭像 發表于 05-07 15:32 ?1005次閱讀
    景區AI<b class='flag-5'>行為</b>識別系統作用

    工廠園區AI行為識別系統作用

    工廠園區AI行為識別系統作用 工廠園區AI行為識別系統是什么? 工廠園區AI行為識別系統是基于人工智能技術的智能化管理方案,通過攝像頭與AI算法融合,實時監控人員
    的頭像 發表于 05-06 17:49 ?800次閱讀

    采用可更新且具區分度錨點的多模態運動預測研究

    在自動駕駛領域,運動預測 (Motion Prediction) 是一個重要任務,它有助于場景理解和安全決策。該任務利用歷史狀態和道路地圖來預測目標智能體的未來軌跡。其主要挑戰來自未來行為的多模態性 (Multimodality
    的頭像 發表于 04-01 10:32 ?780次閱讀
    采用可更新且具區分度錨點的多模態運動<b class='flag-5'>預測</b>研究