国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于PyTorch的深度學習入門教程之使用PyTorch構建一個神經網絡

ss ? 來源:雁回晴空 ? 作者:雁回晴空 ? 2021-02-15 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

本文參考PyTorch官網的教程,分為五個基本模塊來介紹PyTorch。為了避免文章過長,這五個模塊分別在五篇博文中介紹。

Part1:PyTorch簡單知識

Part2:PyTorch的自動梯度計算

Part3:使用PyTorch構建一個神經網絡

Part4:訓練一個神經網絡分類器

Part5:數據并行化

本文是關于Part3的內容。

Part3:使用PyTorch構建一個神經網絡

神經網絡可以使用touch.nn來構建。nn依賴于autograd來定義模型,并且對其求導。一個nn.Module包含網絡的層(layers),同時forward(input)可以返回output。

例如,下面的網絡(卷積網絡)是用來對數字圖像進行分類的。

convnet

這是一個簡單的前饋網絡。它接受輸入,然后一層一層向前傳播,最后輸出一個結果。

訓練神經網絡的典型步驟如下:

(1) 定義神經網絡,該網絡包含一些可以學習的參數(如權重)

(2) 在輸入數據集上進行迭代

(3) 使用網絡對輸入數據進行處理

(4) 計算loss(輸出值距離正確值有多遠)

(5) 將梯度反向傳播到網絡參數中

(6) 更新網絡的權重,使用簡單的更新法則:weight = weight - learning_rate* gradient,即:新的權重=舊的權重-學習率*梯度值。

1 定義網絡

我們先定義一個網絡:

import torch
from torch.autograd import Variable
import torch.nn as nn
import torch.nn.functional as F


class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        # 1 input image channel, 6 output channels, 5x5 square convolution
        # kernel
        self.conv1 = nn.Conv2d(1, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        # an affine operation: y = Wx + b
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        # Max pooling over a (2, 2) window
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # If the size is a square you can only specify a single number
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]  # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features


net = Net()
print(net)

預期輸出:

Net(

(conv1):Conv2d(1,6,kernel_size=(5,5),stride=(1,1))

(conv2):Conv2d(6,16,kernel_size=(5,5),stride=(1,1))

(fc1):Linear(400->120)

(fc2):Linear(120->84)

(fc3):Linear(84->10)

)

你只需要定義forward函數,那么backward函數(梯度在此函數中計算)就會利用autograd來自動定義。你可以在forward函數中使用Tensor的任何運算。

學習到的參數可以被net.parameters()返回。

params = list(net.parameters())
print(len(params))
print(params[0].size())  # conv1's .weight

預期輸出:

10

torch.Size([6,1,5,5])

前向計算的輸入和輸出都是autograd.Variable,注意,這個網絡(LeNet)的輸入尺寸是32*32。為了在MNIST數據集上使用這個網絡,請把圖像大小轉變為32*32。

input = Variable(torch.randn(1, 1, 32, 32))
out = net(input)
print(out)

預期輸出:

Variable containing:
-0.0796  0.0330  0.0103  0.0250  0.1153 -0.0136  0.0234  0.0881  0.0374 -0.0359
[torch.FloatTensor of size 1x10]

將梯度緩沖區歸零,然后使用隨機梯度值進行反向傳播。

net.zero_grad()
out.backward(torch.randn(1, 10))

注意:torch.nn只支持mini-batches. 完整的torch.nn package只支持mini-batch形式的樣本作為輸入,并且不能只包含一個樣本。例如,nn.Conv2d會采用一個4D的Tensor(nSamples* nChannels * Height * Width)。如果你有一個單樣本,可以使用input.unsqueeze(0)來添加一個虛假的批量維度。

在繼續之前,讓我們回顧一下迄今為止所見過的所有類。

概述:

(1) torch.Tensor——多維數組

(2) autograd.Variable——包裝了一個Tensor,并且記錄了應用于其上的運算。與Tensor具有相同的API,同時增加了一些新東西例如backward()。并且有相對于該tensor的梯度值。

(3) nn.Module——神經網絡模塊。封裝參數的簡便方式,對于參數向GPU移動,以及導出、加載等有幫助。

(4) nn.Parameter——這是一種變量(Variable),當作為一個屬性(attribute)分配到一個模塊(Module)時,可以自動注冊為一個參數(parameter)。

(5) autograd.Function——執行自動求導運算的前向和反向定義。每一個Variable運算,創建至少一個單獨的Function節點,該節點連接到創建了Variable并且編碼了它的歷史的函數身上。

2 損失函數(Loss Function)

損失函數采用輸出值和目標值作為輸入參數,來計算輸出值距離目標值還有多大差距。在nn package中有很多種不同的損失函數,最簡單的一個loss就是nn.MSELoss,它計算輸出值和目標值之間的均方差。

例如:

output = net(input)
target = Variable(torch.arange(1, 11))  # a dummy target, for example
criterion = nn.MSELoss()

loss = criterion(output, target)
print(loss)

現在,從反向看loss,使用.grad_fn屬性,你會看到一個計算graph如下:

input -> conv2d -> relu -> maxpool2d -> conv2d -> relu -> maxpool2d
      -> view -> linear -> relu -> linear -> relu -> linear
      -> MSELoss
      -> loss

當我們調用loss.backward(),整個的graph關于loss求導,graph中的所有Variables都會有他們自己的.grad變量。

為了理解,我們進行幾個反向步驟。

print(loss.grad_fn)  # MSELoss
print(loss.grad_fn.next_functions[0][0])  # Linear
print(loss.grad_fn.next_functions[0][0].next_functions[0][0])  # ReLU

預期輸出:

<torch.autograd.function.MSELossBackwardobjectat0x7fb3c0dcf4f8>

<torch.autograd.function.AddmmBackwardobjectat0x7fb3c0dcf408>

<AccumulateGradobjectat0x7fb3c0db79e8>

3 反向傳播(Backprop)

可以使用loss.backward()進行誤差反向傳播。你需要清除已經存在的梯度值,否則梯度將會積累到現有的梯度上。

現在,我們調用loss.backward(),看一看conv1的bias 梯度在backward之前和之后的值。

net.zero_grad()     # zeroes the gradient buffers of all parameters

print('conv1.bias.grad before backward')
print(net.conv1.bias.grad)

loss.backward()

print('conv1.bias.grad after backward')
print(net.conv1.bias.grad)

4 更新權重

實踐當中最簡單的更新法則就是隨機梯度下降法( StochasticGradient Descent (SGD))

weight = weight - learning_rate * gradient

執行這個操作的python代碼如下:

learning_rate = 0.01
for f in net.parameters():
    f.data.sub_(f.grad.data * learning_rate)

但是當你使用神經網絡的時候,你可能會想要嘗試多種不同的更新法則,例如SGD,Nesterov-SGD, Adam, RMSProp等。為了實現此功能,有一個package叫做torch.optim已經實現了這些。使用它也很方便:

import torch.optim as optim

# create your optimizer
optimizer = optim.SGD(net.parameters(), lr=0.01)

# in your training loop:
optimizer.zero_grad()   # zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()    # Does the update

責任編輯:xj
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107756
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124396
  • pytorch
    +關注

    關注

    2

    文章

    813

    瀏覽量

    14850
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PyTorch 中RuntimeError分析

    原生實現。這是已知的 PyTorch 限制,常見于 Stable Diffusion、ComfyUI 等使用 interpolate(..., mode=\'nearest\') 的模型中
    發表于 03-06 06:02

    Pytorch 與 Visionfive2 兼容嗎?

    Pytorch 與 Visionfive2 兼容嗎? $ pip3 install torch torchvision torchaudio --index-url https
    發表于 02-06 08:28

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現。什么是神經網絡
    的頭像 發表于 12-17 15:05 ?323次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    自動駕駛中常提的卷積神經網絡啥?

    在自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是種專門用來處理網格狀數據(比如圖像)的深度學習模型。CNN在圖像
    的頭像 發表于 11-19 18:15 ?2076次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經網絡</b>是<b class='flag-5'>個</b>啥?

    NMSIS神經網絡庫使用介紹

    NMSIS NN 軟件庫是組高效的神經網絡內核,旨在最大限度地提高 Nuclei N 處理器內核上的神經網絡的性能并最??大限度地減少其內存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發表于 10-29 06:08

    構建CNN網絡模型并優化的般化建議

    通過實踐,本文總結了構建CNN網絡模型并優化的般化建議,這些建議將會在構建高準確率輕量級CNN神經網絡模型方面提供幫助。 1)避免單層
    發表于 10-28 08:02

    在Ubuntu20.04系統中訓練神經網絡模型的些經驗

    本帖欲分享在Ubuntu20.04系統中訓練神經網絡模型的些經驗。我們采用jupyter notebook作為開發IDE,以TensorFlow2為訓練框架,目標是訓練手寫數字識
    發表于 10-22 07:03

    液態神經網絡(LNN):時間連續性與動態適應性的神經網絡

    1.算法簡介液態神經網絡(LiquidNeuralNetworks,LNN)是種新型的神經網絡架構,其設計理念借鑒自生物神經系統,特別是秀麗隱桿線蟲的
    的頭像 發表于 09-28 10:03 ?1211次閱讀
    液態<b class='flag-5'>神經網絡</b>(LNN):時間連續性與動態適應性的<b class='flag-5'>神經網絡</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經形態計算、類腦芯片

    AI芯片不僅包括深度學細AI加速器,還有另外主要列別:類腦芯片。類腦芯片是模擬人腦神經網絡架構的芯片。它結合微電子技術和新型神經形態器件
    發表于 09-17 16:43

    如何在機器視覺中部署深度學習神經網絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經常會出現“神經網絡
    的頭像 發表于 09-10 17:38 ?900次閱讀
    如何在機器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>神經網絡</b>

    Nordic收購 Neuton.AI 關于產品技術的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是家專注于超小型機器學習(TinyML)解決方案的公司。 Neuton 開發了種獨特的神經網絡
    發表于 06-28 14:18

    無刷電機小波神經網絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建以三相相電壓為輸人,轉角為輸出的小波神經網絡來實現轉角預測,并采用改進遺傳算法來訓練
    發表于 06-25 13:06

    神經網絡專家系統在電機故障診斷中的應用

    摘要:針對傳統專家系統不能進行自學習、自適應的問題,本文提出了基于種經網絡專家系統的并步電機故障診斷方法。本文將小波神經網絡和專家系統相結合,充分發揮了二者故障診斷的優點,很大程度上降低了對電機
    發表于 06-16 22:09

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe
    的頭像 發表于 06-03 15:51 ?1198次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟解析

    神經網絡壓縮框架 (NNCF) 中的過濾器修剪統計數據怎么查看?

    無法觀察神經網絡壓縮框架 (NNCF) 中的過濾器修剪統計數據
    發表于 03-06 07:10