国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎樣使用Python創(chuàng)建詞云

ss ? 來(lái)源:磐創(chuàng)AI ? 作者:磐創(chuàng)AI ? 2020-11-06 17:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹從開(kāi)始從事數(shù)據(jù)可視化工作的那一天起,我就愛(ài)上它了,我總是喜歡從數(shù)據(jù)中獲得有用的見(jiàn)解。在此之前,我只了解基本圖表,例如條形圖,散點(diǎn)圖,直方圖等,這些基本圖表內(nèi)置在tableau中,而Power BI則用于數(shù)據(jù)可視化。通過(guò)每天完成此任務(wù),我遇到了許多新圖表,例如徑向儀表盤(pán),華夫圖等。

因此,出于好奇,最近我正在搜索數(shù)據(jù)可視化中使用的所有圖表類(lèi)型,這些詞云引起了我的注意,我發(fā)現(xiàn)它非常有趣。之后,我嘗試使用Tableau和Power BI中的少量數(shù)據(jù)來(lái)制作詞云,在成功嘗試之后,我想通過(guò)使用條形圖,餅圖和其他圖表的代碼來(lái)嘗試使用它。詞云是什么?定義:詞云是一個(gè)簡(jiǎn)單但功能強(qiáng)大的可視化表示對(duì)象,用于文本處理,它以更大,更粗的字母和不同的顏色顯示最常用的詞,單詞的大小越小,重要性就越小。

詞云的用途

1.社交媒體上的熱門(mén)標(biāo)簽(Instagram,Twitter):全世界的社交媒體都在尋找最新的趨勢(shì),因此,我們可以獲取人們?cè)谄涮又惺褂米疃嗟臉?biāo)簽來(lái)探索最新的趨勢(shì)。

2.媒體中的熱門(mén)話題:分析新聞報(bào)道,我們可以在頭條新聞中找到關(guān)鍵字,并提取出前n個(gè)需求較高的主題,來(lái)獲得所需的結(jié)果,即前n個(gè)熱門(mén)媒體主題。

3.電子商務(wù)中的搜索詞:在電子商務(wù)購(gòu)物網(wǎng)站中,網(wǎng)站所有者可以制作被搜索次數(shù)最多的購(gòu)物商品的詞云,這樣,他就可以了解在特定時(shí)期內(nèi)哪些商品需求量最大。讓我們開(kāi)始使用Python來(lái)實(shí)現(xiàn)詞云首先,我們需要在jupyter notebook中安裝所有庫(kù)。在python中,我們將安裝一個(gè)內(nèi)置庫(kù)wordcloud。在Anaconda命令提示符下,輸入以下代碼:pip install wordcloud

如果你的anaconda環(huán)境支持conda,請(qǐng)輸入:conda install wordcloud

這可以直接在notebook中實(shí)現(xiàn),只需在代碼的開(kāi)頭添加“!”即可。像這樣:!pip install wordcloud

但現(xiàn)在我想生成擁有任何主題的維基百科文本的詞云,因此,我將需要一個(gè)Wikipedia庫(kù)來(lái)訪問(wèn)Wikipedia API,可以通過(guò)在anaconda命令提示符下安裝Wikipedia來(lái)完成,如下所示:pip install wikipedia

現(xiàn)在我們還需要其他一些庫(kù),它們是numpy,matplotlib和pandas。截至目前,我們需要的庫(kù)就安裝好了import wikipedia

result= wikipedia.page("MachineLearning")

final_result = result.content

print(final_result)

機(jī)器學(xué)習(xí)維基百科頁(yè)面的輸出:

上圖是我們通過(guò)檢索Wikipedia的機(jī)器學(xué)習(xí)頁(yè)面獲得的輸出圖像,我們還可以看到它可以向下滾動(dòng),這表示將檢索整個(gè)頁(yè)面。在這里,我們還可以通過(guò)摘要方法得到頁(yè)面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)

print(result)

這里我們有句子的參數(shù),因此我們可以用它來(lái)檢索特定的行數(shù)。

輸出5個(gè)句子讓我們一起創(chuàng)建wordcloudfrom wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)

plot_cloud(wordcloud)

停用詞是沒(méi)有任何含義的單詞,例如‘is’, ‘a(chǎn)re’, ‘a(chǎn)n’, ‘I’ 等。Wordcloud帶有內(nèi)置停用詞庫(kù),該庫(kù)將自動(dòng)從文本中刪除停用詞。同時(shí)我們也可以通過(guò)stopwords.add()函數(shù)在python中添加停用詞的選擇。Wordcloud方法可以設(shè)置詞云的寬度和高度,我將它們都設(shè)置為500,背景色設(shè)置為粉紅色。如果不添加隨機(jī)狀態(tài),則每次運(yùn)行代碼時(shí),詞云都會(huì)看起來(lái)不同,我們可以將其設(shè)置為任何int值。從上面的代碼中,我們將獲得這樣的詞云:

通過(guò)查看上圖,我們可以看到機(jī)器學(xué)習(xí)是最常用的詞,還有一些其他經(jīng)常使用的詞是模型,任務(wù),訓(xùn)練和數(shù)據(jù),因此,我們可以得出結(jié)論,機(jī)器學(xué)習(xí)是訓(xùn)練數(shù)據(jù)模型的任務(wù)。我們還可以在這里通過(guò)背景顏色方法更改背景顏色,并通過(guò)colormap方法更改字體顏色,還可以在背景顏色中添加顏色的哈希碼,但是mapcolor帶有內(nèi)置的特定顏色。讓我們通過(guò)使用哈希碼將背景色更改為藍(lán)綠色,將字體顏色更改為藍(lán)色:from wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)

plot_cloud(wordcloud)

在這里,我指定了ocean,如果我添加了一些錯(cuò)誤的顏色圖,jupyter將拋出一個(gè)值錯(cuò)誤,并向我顯示顏色圖的可用選項(xiàng),如下所示:

我們還可以使用PIL庫(kù)在任何圖像中實(shí)現(xiàn)詞云。尾注在本文中,我們討論了詞云,詞云的定義,應(yīng)用領(lǐng)域以及使用python實(shí)現(xiàn)詞云。參考鏈接:https://www.a(chǎn)nalyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94798
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4876

    瀏覽量

    90071
  • 數(shù)據(jù)可視化

    關(guān)注

    0

    文章

    500

    瀏覽量

    11480
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    京東關(guān)鍵的應(yīng)用

    京東關(guān)鍵應(yīng)用核心是圍繞搜索匹配與流量獲取,貫穿商品上架、搜索優(yōu)化、付費(fèi)推廣、精細(xì)化運(yùn)營(yíng)等全鏈路,以精準(zhǔn)匹配用戶(hù)需求、提升排名與轉(zhuǎn)化為目標(biāo)。以下是具體應(yīng)用與實(shí)操方法: 一、關(guān)鍵分類(lèi)與篩選
    的頭像 發(fā)表于 01-20 09:05 ?528次閱讀

    京東關(guān)鍵搜索商品列表的Python實(shí)戰(zhàn)

    一、實(shí)現(xiàn)思路分析 URL 構(gòu)造 :京東搜索 URL 格式為 https://search.jd.com/Search?keyword=關(guān)鍵q=0.9", "Connection
    的頭像 發(fā)表于 01-09 10:34 ?648次閱讀

    淺談京東關(guān)鍵

    格式的字符串)。 關(guān)鍵與搜索結(jié)果的關(guān)聯(lián)性 :關(guān)鍵的精準(zhǔn)度決定爬取結(jié)果的相關(guān)性,京東搜索會(huì)對(duì)關(guān)鍵進(jìn)行分詞匹配(如 “Python 實(shí)戰(zhàn)書(shū)籍” 會(huì)拆分匹配 “
    的頭像 發(fā)表于 01-04 10:40 ?700次閱讀

    京東關(guān)鍵搜索商品列表的Python爬蟲(chóng)實(shí)戰(zhàn)

    京東關(guān)鍵搜索商品列表 Python 爬蟲(chóng)實(shí)戰(zhàn) 你想要實(shí)現(xiàn)京東關(guān)鍵搜索商品的爬蟲(chóng),我會(huì)從 合規(guī)聲明、環(huán)境準(zhǔn)備、頁(yè)面分析、代碼實(shí)現(xiàn)、反爬優(yōu)化 五個(gè)方面展開(kāi),幫助你完成實(shí)戰(zhàn)項(xiàng)目。 一、前置聲明(重要
    的頭像 發(fā)表于 01-04 10:16 ?769次閱讀

    知聲入選國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建推薦單位

    近日,上海市知識(shí)產(chǎn)權(quán)局公示了《2025-2027年知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)建設(shè)示范創(chuàng)建工作推薦結(jié)果》。知聲(上海)智能科技有限公司憑借其卓越的自主創(chuàng)新能力與知識(shí)產(chǎn)權(quán),成功入選“國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建推薦單位
    的頭像 發(fā)表于 11-04 10:28 ?640次閱讀

    Pico Technology發(fā)布Python軟件包pyPicoSDK

    現(xiàn)有 PicoSDK 的基礎(chǔ)上構(gòu)建,使工程師、開(kāi)發(fā)人員和業(yè)余愛(ài)好者能夠創(chuàng)建 Python 腳本,更加快速方便地控制其 PicoScope 設(shè)備。
    的頭像 發(fā)表于 09-29 15:03 ?955次閱讀

    termux調(diào)試python猜數(shù)字游戲

    用termux做一個(gè)猜數(shù)字游戲 下面是在Termux中創(chuàng)建猜數(shù)字游戲的步驟及完整實(shí)現(xiàn)方案,結(jié)合Python實(shí)現(xiàn)(最適配Termux環(huán)境): ? 一、環(huán)境準(zhǔn)備(Termux基礎(chǔ)配置) 1.
    發(fā)表于 08-29 17:15

    termux如何搭建python游戲

    戲開(kāi)發(fā)流程 以Pygame為例,創(chuàng)建一個(gè)基礎(chǔ)窗口: ```python import pygame pygame.init() screen = pygame.display.set_mode
    發(fā)表于 08-29 07:06

    零基礎(chǔ)在智能硬件上克隆原神可莉?qū)崿F(xiàn)桌面陪伴(提供人設(shè)提示、知識(shí)庫(kù)、固件下載)

    個(gè)步驟:1、創(chuàng)建智能體:配置可莉的基礎(chǔ)信息2、聲音復(fù)刻:克隆可莉的聲音3、配置知識(shí)庫(kù):配置可莉和嘟嘟可的背景、故事經(jīng)歷、語(yǔ)錄等知識(shí)庫(kù) 4、自定義喚醒:修改喚醒和喚醒回復(fù)語(yǔ) (篇尾提供修改了喚醒
    發(fā)表于 08-22 19:51

    中國(guó)信通院發(fā)布“2025計(jì)算十大關(guān)鍵

    日前,中國(guó)信通院正式發(fā)布“2025計(jì)算十大關(guān)鍵”,中國(guó)信通院計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏對(duì)“2025計(jì)算十大關(guān)鍵”進(jìn)行了解讀。十大
    的頭像 發(fā)表于 07-30 10:53 ?3181次閱讀
    中國(guó)信通院發(fā)布“2025<b class='flag-5'>云</b>計(jì)算十大關(guān)鍵<b class='flag-5'>詞</b>”

    HarmonyOS5服務(wù)技術(shù)分享--函數(shù)預(yù)加載文章整理

    ??嗨,親愛(ài)的開(kāi)發(fā)者朋友們!??? 今天咱們來(lái)聊聊如何使用??端一體化方式開(kāi)發(fā)函數(shù)??,尤其針對(duì)華為的預(yù)加載服務(wù)。整個(gè)過(guò)程會(huì)手把手帶你從零開(kāi)始,涵蓋創(chuàng)建工程、編寫(xiě)代碼、調(diào)試到部署,幫你輕松掌握
    發(fā)表于 05-22 20:33

    HarmonyOS5服務(wù)技術(shù)分享--Serverless抽獎(jiǎng)模板部署

    活動(dòng)。不用寫(xiě)復(fù)雜代碼,跟著步驟走就能搞定,文末還有部署避坑指南哦~ 一、前期準(zhǔn)備 1?? ??注冊(cè)賬號(hào)+創(chuàng)建項(xiàng)目?? 先到華為開(kāi)發(fā)者平臺(tái)注冊(cè)賬號(hào) 創(chuàng)建新項(xiàng)目時(shí)記得勾選\"開(kāi)發(fā)
    發(fā)表于 05-22 20:25

    HarmonyOS5服務(wù)技術(shù)分享--ArkTS開(kāi)發(fā)Node環(huán)境

    Studio 3.0+,配置HarmonyOS SDK。 ??服務(wù)開(kāi)通??:在AGC(AppGallery Connect)控制臺(tái)創(chuàng)建項(xiàng)目,開(kāi)通函數(shù)服務(wù),獲取agconnect-services.json
    發(fā)表于 05-22 17:21

    HarmonyOS5服務(wù)技術(shù)分享--函數(shù)創(chuàng)建配置指南

    。HarmonyOS的AGC平臺(tái)提供靈活配置,支持Node.js、Python、Java等多種語(yǔ)言,還能自定義運(yùn)行環(huán)境哦! ?? 二、手把手創(chuàng)建第一個(gè)函數(shù) ??Step 1:進(jìn)入
    發(fā)表于 05-22 17:08

    python入門(mén)圣經(jīng)-高清電子書(shū)(建議下載)

    此資料內(nèi)容是一本針對(duì)所有層次的Python 讀者而作的Python 入門(mén)電子書(shū)。 全書(shū)分兩部分:第一部分介紹用Python 編程所必須了解的基本概念,包括matplotlib、NumPy
    發(fā)表于 04-10 16:53