国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

10個超級實用的數據可視化圖表

數據分析與開發 ? 來源:愛數據LoveData ? 2023-01-12 10:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

可視化是一種方便的觀察數據的方式,可以一目了然地了解數據塊。我們經常使用柱狀圖、直方圖、餅圖、箱圖、熱圖、散點圖、線狀圖等。這些典型的圖對于數據可視化是必不可少的。除了這些被廣泛使用的圖表外,還有許多很好的卻很少被使用的可視化方法,這些圖有助于完成我們的工作,下面我們看看有那些圖可以進行。

1、平行坐標圖

Parallel Coordinate

我們最多可以可視化 3 維數據。但是我們有時需要可視化超過3維的數據才能獲得更多的信息。我們經常使用PCAt-SNE來降維并繪制它。在降維的情況下,可能會丟失大量信息。在某些情況下,我們需要考慮所有特征,平行坐標圖有助于做到這一點。

3ef562aa-9198-11ed-bfe3-dac502259ad0.png

鳶尾花數據集的平行坐標圖

上面的圖片。橫線(平行軸)表示鳶尾花的特征(花瓣長、萼片長、萼片寬、花瓣寬)。分類是Setosa, Versicolor和Virginica。上圖將該物種編碼為Setosa→1,Versicolor→2,Virginica→3。每個平行軸包含最小值到最大值(例如,花瓣長度從1到6.9,萼片長度從4.3到7.9,等等)。例如,考慮花瓣長度軸。這表明與其他兩種植物相比,瀨蝶屬植物的花瓣長度較小,其中維珍屬植物的花瓣長度最高。

有了這個圖,我們可以很容易地獲得數據集的總體信息。數據集是什么樣子的?讓我們來看看。

3f2362d6-9198-11ed-bfe3-dac502259ad0.png

讓我們用Plotly Express庫[1]可視化數據。Plotly庫提供了一個交互式繪圖工具。


		

importplotly.expressaspx df=px.data.iris() fig=px.parallel_coordinates(df,color="species_id",labels={"species_id":"Species", "sepal_width":"SepalWidth","sepal_length":"SepalLength", "petal_width":"PetalWidth","petal_length":"PetalLength",}, color_continuous_scale=px.colors.diverging.Tealrose, color_continuous_midpoint=2) fig.show()

output

3f31f2c4-9198-11ed-bfe3-dac502259ad0.png

除了上圖以外我們還可以使用其他庫,如pandasscikit-learnmatplotlib來繪制并行坐標。

2、六邊形分箱圖

Hexagonal Binning

六邊形分箱圖是一種用六邊形直觀表示二維數值數據點密度的方法。


		

ax=df.plot.hexbin(x='sepal_width',y='sepal_length', gridsize=20,color='#BDE320')

output

3f42d008-9198-11ed-bfe3-dac502259ad0.png

Pandas允許我們繪制六邊形binning [2]。我已經展示了用于查找sepal_widthsepal_length列的密度的圖。

如果仔細觀察圖表,我們會發現總面積被分成了無數個六邊形。每個六邊形覆蓋特定區域。我們注意到六邊形有顏色變化。六邊形有的沒有顏色,有的是淡綠色,有的顏色很深。根據圖右側顯示的色標,顏色密度隨密度變化。比例表示具有顏色變化的數據點的數量。六邊形沒有填充顏色,這意味著該區域沒有數據點。

其他庫,如matplotlibseabornbokeh(交互式繪圖)也可用于繪制它。

3、等高線密度圖

Countour

二維等高線密度圖是可視化特定區域內數據點密度的另一種方法。這是為了找到兩個數值變量的密度。例如,下面的圖顯示了在每個陰影區域有多少數據點。


		

importplotly.expressaspx fig=px.density_contour(df,x="sepal_width",y="sepal_length") fig.update_traces(contours_coloring="fill",contours_showlabels=True) fig.show()

output

3f534f82-9198-11ed-bfe3-dac502259ad0.png

為了生成上面的圖表,我這里使用了plotly庫,因為它可以方便地繪制交互式的圖表。我們這里繪制了兩個變量sepal_widthsepal_length的密度。 當然,也可以使用其他庫,如seabornmatplotlib等。

4、QQ-plot

QQ plot是另一個有趣的圖。QQQuantile - Quantile plot的縮寫(Quantile/percentile是一個范圍,在這個范圍內數據下降了指定百分比。例如,第10個quantile/percentile表示在該范圍下,找到了10%的數據,90% 超出范圍)。這是一種直觀地檢查數值變量是否服從正態分布的方法。讓我解釋一下它是如何工作的。

3f617936-9198-11ed-bfe3-dac502259ad0.png

(a)樣本分布(b)標準正態分布

圖(a)是樣本分布;(b)是標準正態分布。對于樣本分布,數據范圍從10到100(100% 數據在 10 到 100 之間)。但對于標準正態分布,100%的數據在-3 到3(z 分數)的范圍內。在QQ圖中,兩個x軸值均分為 100個相等的部分(稱為分位數)。如果我們針對x和y軸繪制這兩個值,我們將得到一個散點圖。

3f70a9b0-9198-11ed-bfe3-dac502259ad0.png

QQ-plot

散點圖位于對角線上。這意味著樣本分布是正態分布。如果散點圖位于左邊或右邊而不是對角線,這意味著樣本不是正態分布的。

導入必要的庫


		

importpandasaspd importnumpyasnp importmatplotlib.pyplotasplt importseabornassns

生成正態分布數據。


		

np.random.seed(10) #GenerateUnivariateObservations gauss_data=5*np.random.randn(100)+50

繪制數據點的分布。

sns.histplot(data=gauss_data,kde=True)

output

3f7fa8f2-9198-11ed-bfe3-dac502259ad0.png

該圖顯示數據是正態分布的。我們用數據點做qq-plot來檢驗它是否正態分布。


		

importstatsmodels.apiassm #q-qplot sm.qqplot(gauss_data,line='s') plt.show()

output

3f8b07c4-9198-11ed-bfe3-dac502259ad0.png

該圖顯示散點位于對角線上。所以它是正態分布的。

小提琴圖

Violin Plot

小提琴圖與箱線圖相關。我們能從小提琴圖中獲得的另一個信息是密度分布。簡單來說就是一個結合了密度分布的箱線圖。我們將其與箱線圖進行比較。 在小提琴圖中,小提琴中間的白點表示中點。實心框表示四分位數間距 (IQR)。上下相鄰值是異常值的圍欄。超出范圍,一切都是異常值。下圖顯示了比較。

3f99d83a-9198-11ed-bfe3-dac502259ad0.png

盒狀圖和小提琴狀圖的常見組成。所有學術級別的薪酬總額

讓我們看看小提琴圖的可視化。


		

importseabornassns sns.violinplot(data=df,y="sepal_width")

output

3fab5380-9198-11ed-bfe3-dac502259ad0.png

我們還可以通過傳遞名稱來繪制不同物種的小提琴圖。


		

importseabornassns sns.violinplot(data=df,x='species',y="sepal_width")

output

3fc285d2-9198-11ed-bfe3-dac502259ad0.png

還可以使用其他庫,如plotlymatplotlib等來繪制小提琴圖。

箱線圖的改進版

Boxen plot

Boxenplotseaborn庫引入的一種新型箱線圖。對于箱線圖,框是在四分位數上創建的。但在Boxenplot中,數據被分成更多的分位數。它提供了對數據的更多內存。

鳶尾花數據集的Boxenplot顯示了sepal_width的數據分布。

sns.boxenplot(x=df["sepal_width"])

output

3fed6702-9198-11ed-bfe3-dac502259ad0.png

上圖顯示了比箱線圖更多的盒。這是因為每個框代表一個特定的分位數。

sns.boxenplot(data=df,x="species",y='sepal_width')

output

3ffac2d0-9198-11ed-bfe3-dac502259ad0.png

不同物種sepal_widthBoxenplot圖。

點圖

下圖中有一些名為誤差線的垂直線和其他一些連接這些垂直線的線。讓我們看看它的確切含義。

40092686-9198-11ed-bfe3-dac502259ad0.png

點圖是一種通過上圖中顯示的點的位置來表示數值變量集中趨勢的方法,誤差條表示變量的不確定性(置信區間)[4]。繪制線圖是為了比較不同分類值的數值變量的變異性 [4]。

讓我們舉一個實際的例子—-我們繼續使用seaborn庫和iris數據集(在平行坐標部分中提到)。


		
			importseabornassns sns.pointplot(data=df,x="species",y="sepal_width")

output

402829e6-9198-11ed-bfe3-dac502259ad0.png

分簇散點圖

Swarm plot

Swarm plot是另一個受“beeswarm”啟發的有趣圖表。通過此圖我們可以輕松了解不同的分類值如何沿數值軸分布[5]。它在不重疊數據點的情況下繪制數據。但它不適用于大型數據集。


		

importseabornassns sns.swarmplot(data=df,x="species",y="sepal_width")

output

4036d66c-9198-11ed-bfe3-dac502259ad0.png

旭日圖

Sunburst Chart

它是圓環圖或餅圖的定制版本,將一些額外的層次信息集成到圖中 [7]。

4041d4ae-9198-11ed-bfe3-dac502259ad0.png

Sunburst Chart

整個圖表被分成幾個環(從內到外)。它保存層次結構信息,其中內環位于層次結構的頂部,外環位于較低的[7]階。

404fb330-9198-11ed-bfe3-dac502259ad0.png


		

importplotly.expressaspx df=px.data.tips()

output

405f854e-9198-11ed-bfe3-dac502259ad0.png

繪制旭日圖


		

fig=px.sunburst(df,path=['sex','day','time'], values='total_bill',color='time') fig.show()

output

406b3bc8-9198-11ed-bfe3-dac502259ad0.png

sunburst類的path屬性提供了層次結構,其中性別位于層次結構的頂部,然后是日期和時間。

詞云

Word Cloud

詞云圖的想法非常簡單。假設我們有一組文本文檔。單詞有很多,有些是經常出現的,有些是很少出現的。在詞云圖中,所有單詞都被繪制在特定的區域中,頻繁出現的單詞被高亮顯示(用較大的字體顯示)。有了這個詞云,我們可以很容易地找到重要的客戶反饋,熱門的政治議程話題等。


		

數據集 https://opendatacommons.org/licenses/odbl/1-0/

導入數據集

importpandasaspd
data=pd.read_csv('/work/android-games.csv')
data.head()

output

4079271a-9198-11ed-bfe3-dac502259ad0.png

我們統計每個類別的數據數量


		

data.category.value_counts() GAMECARD126 GAMEWORD104 GAMEACTION100 GAMEADVENTURE100 GAMESTRATEGY100 GAMEPUZZLE100 GAMESIMULATION100 GAMECASUAL100 GAMEARCADE100 GAMEROLEPLAYING100 GAMETRIVIA100 GAMEBOARD100 GAMECASINO100 GAMERACING100 GAMEEDUCATIONAL100 GAMESPORTS100 GAMEMUSIC100 Name:category,dtype:int64

然后我們來進行可視化。


		

#importingthemodulefromwordcloudlibrary fromwordcloudimportWordCloud importmatplotlib.pyplotasplt #creatingatextfromthecategorycolumnbytakingonlythe2ndpartofthecategory. text="".join(cat.split()[1]forcatindata.category) #generatingthecloud word_cloud=WordCloud(collocations=False,background_color='black').generate(text) plt.imshow(word_cloud,interpolation='bilinear') plt.axis("off") plt.show()

output

該圖表顯示了頻率最高的所有類別。我們也可以用這個圖從文本中找到經常出現的單詞。

總結

數據可視化是數據科學中不可缺少的一部分。在數據科學中,我們與數據打交道。手工分析少量數據是可以的,但當我們處理數千個數據時它就變得非常麻煩。如果我們不能發現數據集的趨勢和洞察力,我們可能無法使用這些數據。希望上面介紹的的圖可以幫助你深入了解數據。

以下是本文的引用

https://plotly.com/python/parallel-coordinates-plot/https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.plot.hexbin.html

Hintze, V. P. A Box Plot-Density Trace Synergism. Am. Sat, (52), 181 (Open Access Journal).

seaborn.pointplot — seaborn 0.12.1 documentation (pydata.org)

seaborn.swarmplot—seaborn0.12.1documentation(pydata.org)CreateasunburstchartinOffice—MicrosoftSupport

審核編輯 :李倩



聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7335

    瀏覽量

    94774
  • 可視化
    +關注

    關注

    1

    文章

    1353

    瀏覽量

    22797
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196

原文標題:總結歸納了10個超級實用的數據可視化圖表

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    物聯網平臺賦能可視化數據與決策,打造工廠“智慧大腦”

    ,無法形成全局視圖,更難以支撐快速、精準的管理決策。 打造一集中、直觀、智能的數據可視化平臺,讓關鍵信息一目了然,讓管理決策有數可依,成為企業運營管理的迫切需求。數之能物聯網平臺具備高效可靠的
    的頭像 發表于 02-04 14:52 ?144次閱讀

    工業物聯網可視化平臺是什么?有什么功能?

    工業物聯網可視化平臺是基于物聯網、大數據、人工智能等技術,將工業生產中的設備、系統、流程等數據以圖形方式呈現,實現實時監控、智能分析與交互式管理的數字化工具。 其核心功能涵蓋
    的頭像 發表于 11-17 17:49 ?1278次閱讀

    工業可視化平臺是什么

    工業可視化平臺是一種基于信息技術和可視化技術,將工業生產過程中的數據、信息、流程等以直觀、動態的圖形方式呈現,并實現交互式管理與分析的數字化工具。它通過整合工業物聯網(IIoT)、大
    的頭像 發表于 10-24 18:00 ?1068次閱讀

    光伏電站可視化的實現

    實現光伏電站可視化,核心是在于通過直觀的視覺界面,解決傳統運維中低效巡檢、數據孤島、被動響應等痛點,從而提升運營效率并提供決策支持。這是一種有效的技術手段,通過數字孿生、三維建模、數據
    的頭像 發表于 10-21 17:29 ?1157次閱讀
    光伏電站<b class='flag-5'>可視化</b>的實現

    數字孿生可視化系統構建行業數字智能管理生態!

    數字孿生可視化系統具備豐富的模型組件,包括二維平面組件及3D模型組件,可根據用戶需求進行定制。數字孿生可視化系統在行業數字升級、數字管理中有著重要的意義,充分利用大
    的頭像 發表于 09-19 11:45 ?740次閱讀
    數字孿生<b class='flag-5'>可視化</b>系統構建行業數字<b class='flag-5'>化</b>智能管理生態!

    智慧用電安全解決方案:打造全流程可視化管控

    預警、可視管控”的閉環管理體系,其核心在于實現對電氣安全風險的全流程、可視化、主動性管控。 一、 全域感知與數據采集:可視化管控的數據基石
    的頭像 發表于 09-04 16:17 ?764次閱讀
    智慧用電安全解決方案:打造全流程<b class='flag-5'>可視化</b>管控

    如何使用協議分析儀進行數據分析與可視化

    使用協議分析儀進行數據分析與可視化,需結合數據捕獲、協議解碼、統計分析及可視化工具,將原始數據轉化為可解讀的
    發表于 07-16 14:16

    工業設備可視化管理系統是什么

    工業設備可視化管理系統是一種基于物聯網(IoT)、大數據、云計算、數字孿生等技術,對工業設備的運行狀態、性能參數、維護信息等進行實時監測、數據整合與可視化呈現的智能管理平臺。它通過將復
    的頭像 發表于 05-27 14:56 ?1135次閱讀
    工業設備<b class='flag-5'>可視化</b>管理系統是什么

    結構可視化:利用數據編輯器剖析數據內在架構?

    結構可視化聚焦于展示數據的內部結構和各部分之間的關系,使企業能夠深入理解數據的組織方式和層次體系,從而更好地進行數據管理和分析。通過結構可視化
    的頭像 發表于 05-07 18:42 ?663次閱讀

    工業設備數據集中監控可視化管理平臺是什么

    工業設備數據集中監控可視化管理平臺是一種用于整合、監控和可視化工業設備數據的綜合性系統,旨在幫助企業實現設備數據的集中管理、實時監控和
    的頭像 發表于 05-06 11:10 ?1069次閱讀

    VirtualLab Fusion應用:3D系統可視化

    描述和F-Theta透鏡的應用示例。 光學系統的3D-可視化 VirtualLab Fusion提供的工具可以實現光學系統的3D可視化,因此可以用于檢查元件的位置,以及快速了解系統內部的光傳播情況
    發表于 04-30 08:47

    可視化組態物聯網平臺是什么

    可視化含義:組態是一種用于構建復雜物聯網系統的工具,它提供了豐富的圖形組件和可視化元素,使得用戶可以通過簡單的拖拽操作來創建自定義的界面。可視化則強調將物聯網系統產生的大量
    的頭像 發表于 04-21 10:40 ?899次閱讀

    可視化組態數據管理平臺是什么

    可視化組態數據管理平臺是一種用于工業自動、物聯網、能源管理等領域的軟件平臺,它結合了可視化和組態技術,幫助用戶實現數據的采集、管理、展示和
    的頭像 發表于 04-21 10:00 ?741次閱讀

    工業數據采集形成可視化數據看板解決方案

    可視化數據看板是一直觀、便捷的信息展示界面。通過把車間的實時生產數據、訂單進度、設備狀態、產能效率率等,用清晰、可視化的形式展示出來,讓管
    的頭像 發表于 03-19 14:31 ?1170次閱讀
    工業<b class='flag-5'>數據</b>采集形成<b class='flag-5'>可視化</b><b class='flag-5'>數據</b>看板解決方案

    可視化數據大屏:連線構建視覺新秩序 #數據可視化 #可視化大屏

    可視化
    阿梨是蘋果
    發布于 :2025年03月18日 16:12:04