国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

最詳細的 NumPy 圖解教程!

數據分析與開發 ? 來源:大數據文摘 ? 作者:大數據文摘 ? 2021-06-09 18:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NumPy是Python中用于數據分析、機器學習、科學計算的重要軟件包。它極大地簡化了向量和矩陣的操作及處理。python的不少數據處理軟件包依賴于NumPy作為其基礎架構的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。除了數據切片和數據切塊的功能之外,掌握numpy也使得開發者在使用各數據處理庫調試和處理復雜用例時更具優勢。

在本文中,將介紹NumPy的主要用法,以及它如何呈現不同類型的數據(表格,圖像,文本等),這些經Numpy處理后的數據將成為機器學習模型的輸入。

NumPy中的數組操作

創建數組

我們可以通過將python列表傳入np.array()來創建一個NumPy數組(也就是強大的ndarray)。在下面的例子里,創建出的數組如右邊所示,通常情況下,我們希望NumPy為我們初始化數組的值,為此NumPy提供了諸如ones(),zeros()和random.random()之類的方法。我們只需傳入元素個數即可:

d3cfeb46-c540-11eb-9e57-12bb97331649.jpg

一旦我們創建了數組,我們就可以用其做點有趣的應用了,文摘菌將在下文展開說明。

數組的算術運算

讓我們創建兩個NumPy數組,分別稱作data和ones:

d3e802c6-c540-11eb-9e57-12bb97331649.png

若要計算兩個數組的加法,只需簡單地敲入data + ones,就可以實現對應位置上的數據相加的操作(即每行數據進行相加),這種操作比循環讀取數組的方法代碼實現更加簡潔。

當然,在此基礎上舉一反三,也可以實現減法、乘法和除法等操作:

d40961aa-c540-11eb-9e57-12bb97331649.jpg

許多情況下,我們希望進行數組和單個數值的操作(也稱作向量和標量之間的操作)。比如:如果數組表示的是以英里為單位的距離,我們的目標是將其轉換為公里數。可以簡單的寫作data * 1.6:

d42978a0-c540-11eb-9e57-12bb97331649.png

NumPy通過數組廣播(broadcasting)知道這種操作需要和數組的每個元素相乘。

數組的切片操作

我們可以像python列表操作那樣對NumPy數組進行索引和切片,如下圖所示:

d43fb14c-c540-11eb-9e57-12bb97331649.png

聚合函數

NumPy為我們帶來的便利還有聚合函數,聚合函數可以將數據進行壓縮,統計數組中的一些特征值:

d44b62b2-c540-11eb-9e57-12bb97331649.jpg

除了min,max和sum等函數,還有mean(均值),prod(數據乘法)計算所有元素的乘積,std(標準差),等等。上面的所有例子都在一個維度上處理向量。除此之外,NumPy之美的一個關鍵之處是它能夠將之前所看到的所有函數應用到任意維度上。

NumPy中的矩陣操作

創建矩陣

我們可以通過將二維列表傳給Numpy來創建矩陣。

np.array([[1,2],[3,4]])

除此外,也可以使用上文提到的ones()、zeros()和random.random()來創建矩陣,只需傳入一個元組來描述矩陣的維度:

d4688572-c540-11eb-9e57-12bb97331649.jpg

矩陣的算術運算

對于大小相同的兩個矩陣,我們可以使用算術運算符(+-*/)將其相加或者相乘。NumPy對這類運算采用對應位置(position-wise)操作處理:

d476619c-c540-11eb-9e57-12bb97331649.png

對于不同大小的矩陣,只有兩個矩陣的維度同為1時(例如矩陣只有一列或一行),我們才能進行這些算術運算,在這種情況下,NumPy使用廣播規則(broadcast)進行操作處理:

d4a5dd46-c540-11eb-9e57-12bb97331649.jpg

與算術運算有很大區別是使用點積的矩陣乘法。NumPy提供了dot()方法,可用于矩陣之間進行點積運算:

d4d56c32-c540-11eb-9e57-12bb97331649.png

上圖的底部添加了矩陣尺寸,以強調運算的兩個矩陣在列和行必須相等。可以將此操作圖解為如下所示:

d4eb2338-c540-11eb-9e57-12bb97331649.jpg

矩陣的切片和聚合

索引和切片功能在操作矩陣時變得更加有用。可以在不同維度上使用索引操作來對數據進行切片。

我們可以像聚合向量一樣聚合矩陣。

不僅可以聚合矩陣中的所有值,還可以使用axis參數指定行和列的聚合。

矩陣的轉置和重構

處理矩陣時經常需要對矩陣進行轉置操作,常見的情況如計算兩個矩陣的點積。NumPy數組的屬性T可用于獲取矩陣的轉置。

在較為復雜的用例中,你可能會發現自己需要改變某個矩陣的維度。這在機器學習應用中很常見,例如模型的輸入矩陣形狀與數據集不同,可以使用NumPy的reshape()方法。只需將矩陣所需的新維度傳入即可。也可以傳入-1,NumPy可以根據你的矩陣推斷出正確的維度。

上文中的所有功能都適用于多維數據,其中心數據結構稱為ndarray(N維數組)。

很多時候,改變維度只需在NumPy函數的參數中添加一個逗號,如下圖所示:

d59f8882-c540-11eb-9e57-12bb97331649.jpg

NumPy中的公式應用示例

NumPy的關鍵用例是實現適用于矩陣和向量的數學公式。這也Python中常用NumPy的原因。例如,均方誤差是監督機器學習模型處理回歸問題的核心:

d5b3750e-c540-11eb-9e57-12bb97331649.png

在NumPy中可以很容易地實現均方誤差:

d63e1ec0-c540-11eb-9e57-12bb97331649.jpg

這樣做的好處是,numpy無需考慮predictions與labels具體包含的值。文摘菌將通過一個示例來逐步執行上面代碼行中的四個操作:

d66c614a-c540-11eb-9e57-12bb97331649.png

預測(predictions)和標簽(labels)向量都包含三個值。這意味著n的值為3。在我們執行減法后,我們最終得到如下值:

d68c8c5e-c540-11eb-9e57-12bb97331649.png

然后我們可以計算向量中各值的平方:

d696a7a2-c540-11eb-9e57-12bb97331649.png

現在我們對這些值求和:

d6abd0d2-c540-11eb-9e57-12bb97331649.png

最終得到該預測的誤差值和模型質量分數。

用NumPy表示日常數據

日常接觸到的數據類型,如電子表格,圖像,音頻。。.。。.等,如何表示呢?Numpy可以解決這個問題。

表和電子表格

電子表格或數據表都是二維矩陣。電子表格中的每個工作表都可以是自己的變量。python中類似的結構是pandas數據幀(dataframe),它實際上使用NumPy來構建的。

音頻和時間序列

音頻文件是一維樣本數組。每個樣本都是代表一小段音頻信號的數字。CD質量的音頻每秒可能有44,100個采樣樣本,每個樣本是一個-65535到65536之間的整數。這意味著如果你有一個10秒的CD質量的WAVE文件,你可以將它加載到長度為10 * 44,100 = 441,000個樣本的NumPy數組中。想要提取音頻的第一秒?只需將文件加載到我們稱之為audio的NumPy數組中,然后截取audio[:44100]。

時間序列數據也是如此(例如,股票價格隨時間變化的序列)。

圖像

圖像是大小為(高度×寬度)的像素矩陣。如果圖像是黑白圖像(也稱為灰度圖像),則每個像素可以由單個數字表示(通常在0(黑色)和255(白色)之間)。如果對圖像做處理,裁剪圖像的左上角10 x 10大小的一塊像素區域,用NumPy中的image[:10,:10]就可以實現。

如果圖像是彩色的,則每個像素由三個數字表示 :紅色,綠色和藍色。在這種情況下,我們需要第三維(因為每個單元格只能包含一個數字)。因此彩色圖像由尺寸為(高x寬x 3)的ndarray表示。

語言

如果我們處理文本,情況就會有所不同。用數字表示文本需要兩個步驟,構建詞匯表(模型知道的所有唯一單詞的清單)和嵌入(embedding)。讓我們看看用數字表示這個(翻譯的)古語引用的步驟:“Have the bards who preceded me left any theme unsung?”

模型需要先訓練大量文本才能用數字表示這位戰場詩人的詩句。我們可以讓模型處理一個小數據集,并使用這個數據集來構建一個詞匯表(71,290個單詞)。

然后可以將句子劃分成一系列“詞”token(基于通用規則的單詞或單詞部分)。

然后我們用詞匯表中的id替換每個單詞。

這些ID仍然不能為模型提供有價值的信息。因此,在將一系列單詞送入模型之前,需要使用嵌入(embedding)來替換token/單詞(在本例子中使用50維度的word2vec嵌入)。

你可以看到此NumPy數組的維度為[embedding_dimension x sequence_length]。

在實踐中,這些數值不一定是這樣的,但我以這種方式呈現它是為了視覺上的一致。出于性能原因,深度學習模型傾向于保留批數據大小的第一維(因為如果并行訓練多個示例,則可以更快地訓練模型)。很明顯,這里非常適合使用reshape()。例如,像BERT這樣的模型會期望其輸入矩陣的形狀為:[batch_size,sequence_length,embedding_size]。

這是一個數字合集,模型可以處理并執行各種有用的操作。我留空了許多行,可以用其他示例填充以供模型訓練(或預測)。

事實證明,在我們的例子中,那位詩人的話語比其他詩人的詩句更加名垂千古。盡管生而為奴,詩人安塔拉(Antarah)的英勇和語言能力使他獲得了自由和神話般的地位,他的詩是伊斯蘭教以前的阿拉伯半島《懸詩》的七首詩之一。

轉自:大數據文摘

原文鏈接:https://jalammar.github.io/visual-numpy/

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • STD
    STD
    +關注

    關注

    0

    文章

    39

    瀏覽量

    14700
  • python
    +關注

    關注

    57

    文章

    4876

    瀏覽量

    90022
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26188

原文標題:這是我見過最好的 NumPy 圖解教程!

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    屏蔽機房建設圖解,與非屏蔽機房有何區別?

    有不少朋友問到關于屏蔽機房與一般的機房有何區別,本期,為了方便大家更詳細的了解關于屏蔽機房建設,我們可以通過這個實際圖紙來詳細了解。 一、普通機房安裝圖 普通機房的主要是接地、靜電地板、機房布置
    的頭像 發表于 12-17 09:50 ?449次閱讀
    屏蔽機房建設<b class='flag-5'>圖解</b>,與非屏蔽機房有何區別?

    圖解AI核心技術:大模型、RAG、智能體、MCP

    和使用AI。 大模型 Transformer vs. Mixture of Experts 混合專家 (MoE) 是一種流行的架構,它使用不同的“專家”來改進 Transformer 模型。 下圖解釋了
    的頭像 發表于 10-21 09:48 ?706次閱讀
    <b class='flag-5'>圖解</b>AI核心技術:大模型、RAG、智能體、MCP

    圖解環路設計及控制技術探討

    由于之前缺乏控制理論方面的知識在剛接觸反饋環路的時候對其中的很多名詞不是很明白,這次準備采用圖解的方法逐一的搞清楚這些名詞并且試圖找出一種便捷的設置零、極點的方法。最后準備再探討一下關于控制技術
    發表于 08-22 17:39

    yolov11轉kmodel,numpy是要降級為1.x嗎?

    python3.9,yolo是最新的穩定版,和yolo捆綁pip安裝的numpy是2.0.1 錯誤日志
    發表于 08-11 08:16

    圖解單片機功能與應用(完整版)

    從基礎知識的介紹出發,圖文并茂,直觀、系統地介紹了單片機的內部結構、工作原理和應用技巧。全書分為10章,內容包括51單片機編程資源圖解、51單片機指令系統圖解、匯編語言程序設計圖解、輸入/輸出
    發表于 06-16 16:52

    非常詳細的無線充電原理和原理圖解

    獲取完整文檔資料可下載附件哦!!!!如果內容有幫助可以關注、點贊、評論支持一下哦~
    發表于 06-04 15:27

    芯海mcu有更詳細的數據手冊嗎?

    其官網數據手冊很簡潔,有沒有更詳細的數據手冊?
    發表于 06-02 15:12

    PID控制原理知識詳細文檔【推薦下載】

    文檔詳細介紹了控制系統歷程、控制系統概況、反饋控制原理圖、閉環控制系統的例子等內容,具體的建議下載查看。 這是部分截圖:
    發表于 05-22 17:37

    每周推薦!電子工程師自學資料及各種電路解析

    1、濾波電路(多種設計方案+原理圖) 包含下面這幾個及其經典的資料相對會對大家詳細深入的了解濾波有很大的幫助: 濾波電路及其設計 常見的濾波電路 電源濾波電路 2、電子工程師自學速成
    發表于 05-19 18:20

    漫畫圖解 電感器 抗干擾元器件指南(全彩PDF版)

    漫畫圖解電感基礎知識(高清PDF) 內容:很形象的漫畫和語言圖解關于電感器的入門基礎知識,讓電子初學者也能輕松的看懂電子電路。 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內容有幫助可以關注、點贊、評論支持一下哦~)
    發表于 05-13 15:49

    openstack搭建詳細步驟

    openstack搭建詳細步驟
    的頭像 發表于 05-07 14:05 ?2004次閱讀

    PCB封裝圖解

    PCB封裝圖解——詳細介紹了各種封裝的具體參數,并介紹了如何進行封裝制作 純分享貼,有需要可以直接下載附件獲取文檔! (如果內容有幫助可以關注、點贊、評論支持一下哦~)
    發表于 04-22 13:44

    110kV變電站典型二次回路圖解

    電子發燒友網站提供《110kV變電站典型二次回路圖解.pdf》資料免費下載
    發表于 03-31 16:57 ?13次下載

    無刷電機的繞制和接線方法及實物圖解

    下方附件可打開*附件:無刷電機的繞制和接線方法及實物圖解.doc
    發表于 03-17 20:00

    數字萬用表的使用方法詳細圖解

    現在,數字式測量儀表已成為主流,有取代模擬式儀表的趨勢。與模擬式儀表相 比,數字式儀表靈敏度高,準確度高,顯示清晰,過載能力強,便于攜帶,使用 更簡單。下面以 VC9802型數字萬用表為例,簡單介紹其使用方法和注意事項。 (1)使用方法 a使用前,應認真閱讀有關的使用說明書,熟悉電源開關、量程開關、插孔、特 殊插口的作用. b將電源開關置于 ON位置。 c交直流電壓的測量:根據需要將量程開關撥至 DCV(直流)或 ACV(交流)的 合適量程,紅表筆插入 V/Ω 孔,黑表筆插入 COM孔,并將表筆與被測線路并聯, 讀數即顯示。 d交直流電流的測量:將量程開關撥至 DCA(直流)或 ACA(交流)的合適量程, 紅表筆插入 mA孔(<200mA時)或 10A孔(>200mA時),黑表筆插入 COM孔, 并將萬用表串聯在被測電路中即可。測量直流量時,數字萬用表能自動顯示極性。 e電阻的測量:將量程開關撥至 Ω 的合適量程,紅表筆插入 V/Ω 孔,黑表筆 插入 COM孔。如果被測電阻值超出所選擇量程的最大值,萬用表將顯示 1 , 這時應選擇更高的量程。測量電阻時,紅表筆為正極,黑表筆為負極,這與指針 式萬用表正好相反。因此,測量晶體管、電解電容器等有極性的元器件時,必須 注意表筆的極性。 (2).使用注意事項 a如果無法預先估計被測電壓或電流的大小,則應先撥至最高量程擋測量一次, 再視情況逐漸把量程減小到合適位置。測量完畢,應將量程開關撥到最高電壓擋, 并關閉電源。 b滿量程時,儀表僅在最高位顯示數字 1 ,其它位均消失,這時應選擇更高 的量程。 c測量電壓時,應將數字萬用表與被測電路并聯。測電流時應與被測電路串聯, 測直流量時不必考慮正、負極性。 d當誤用交流電壓擋去測量直流電壓,或者誤用直流電壓擋去測量交流電壓時, 顯示屏將顯示 000 ,或低位上的數字出現跳動。 e禁止在測量高電壓(220V以上)或大電流(0.5A以上)時換量程,以防止產 生電弧,燒毀開關觸點。 f當顯示 、 BATT 或 LOWBAT 時,表示電池電壓低于工作電壓。 一、指針表和數字表的選用: 1、指針表讀取精度較差,但指針擺動的過程比較直觀,其擺動速度幅度有時也能比較 客觀地反映了被測量的大小(比如測電視機數據總線(SDL)在傳送數據時的輕微抖動); 數字表讀數直觀,但數字變化的過程看起來很雜亂,不太容易觀看。 2、指針表內一般有兩塊電池,一塊低電壓的 1.5V,一塊是高電壓的 9V 或 15V,其黑 表筆相對紅表筆來說是正端。數字表則常用一塊 6V 或 9V 的電池。在電阻檔,指針表 的表筆輸出電流相對數字表來說要大很多,用 R×1|? 檔可以使揚聲器發出響亮的“噠” 聲,用 R×10k|? 檔甚至可以點亮發光二極管(LED)。 3、在電壓檔,指針表內阻相對數字表來說比較小,測量精度相比較差。某些高電壓微 電流的場合甚至無法測準,因為其內阻會對被測電路造成影響(比如在測電視機顯像管 的加速級電壓時測量值會比實際值低很多)。數字表電壓檔的內阻很大,至少在兆歐級, 對被測電路影響很小。但極高的輸出阻抗使其易受感應電壓的影響,在一些電磁干擾比 較強的場合測出的數據可能是虛的。 4、總之,在相對來說大電流高電壓的模擬電路測量中適用指針表,比如電視機、音響 功放。在低電壓小電流的數字電路測量中適用數字表,比如 BP 機、手機等。不是絕對 的,可根據情況選用指針表和數字表。 文件過大,大家下載附件查看全文哦!
    發表于 03-05 15:15