国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

python多線程和多進程的對比

python爬蟲知識分享 ? 來源:python爬蟲知識分享 ? 作者:python爬蟲知識分享 ? 2022-03-15 16:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 基本概念

在開始講解理論知識之前,先過一下幾個基本概念。雖然咱是進階教程,但我也希望寫得更小白,更通俗易懂。

串行:一個人在同一時間段只能干一件事,譬如吃完飯才能看電視;

并行:一個人在同一時間段可以干多件事,譬如可以邊吃飯邊看電視;

Python中,多線程協(xié)程 雖然是嚴格上來說是串行,但卻比一般的串行程序執(zhí)行效率高得很。 一般的串行程序,在程序阻塞的時候,只能干等著,不能去做其他事。就好像,電視上播完正劇,進入廣告時間,我們卻不能去趁廣告時間是吃個飯。對于程序來說,這樣做顯然是效率極低的,是不合理的。

雖然 多線程協(xié)程 已經(jīng)相當(dāng)智能了。但還是不夠高效,最高效的應(yīng)該是一心多用,邊看電視邊吃飯邊聊天。這就是我們的 多進程 才能做的事了。

2. 單線程VS多線程VS多進程

文字總是蒼白無力的,不如用代碼直接來測試一下。

開始對比之前,首先定義四種類型的場景

- CPU計算密集型

- 磁盤IO密集型

- 網(wǎng)絡(luò)IO密集型

- 【模擬】IO密集型

為什么是這幾種場景,這和多線程 多進程的適用場景有關(guān)。結(jié)論里,我再說明。

# CPU計算密集型
def count(x=1, y=1):
    # 使程序完成150萬計算
    c = 0
    while c < 500000:
        c += 1
        x += x
        y += y


# 磁盤讀寫IO密集型
def io_disk():
    with open("file.txt", "w") as f:
        for x in range(5000000):
            f.write("python-learning\n")


# 網(wǎng)絡(luò)IO密集型
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
url = "https://www.tieba.com/"

def io_request():
    try:
        webPage = requests.get(url, headers=header)
        html = webPage.text
        return
    except Exception as e:
        return {"error": e}


# 【模擬】IO密集型
def io_simulation():
    time.sleep(2)

比拼的指標,我們用時間來考量。時間耗費得越少,說明效率越高。

為了方便,使得代碼看起來,更加簡潔,我這里先定義是一個簡單的 時間計時器 的裝飾器。 如果你對裝飾器還不是很了解,也沒關(guān)系,你只要知道它是用于 計算函數(shù)運行時間的東西就可以了。

def timer(mode):
    def wrapper(func):
        def deco(*args, **kw):
            type = kw.setdefault('type', None)
            t1=time.time()
            func(*args, **kw)
            t2=time.time()
            cost_time = t2-t1
            print("{}-{}花費時間:{}秒".format(mode, type,cost_time))
        return deco
    return wrapper

第一步,先來看看單線程的
@timer("【單線程】")
def single_thread(func, type=""):
    for i in range(10):
              func()

# 單線程
single_thread(count, type="CPU計算密集型")
single_thread(io_disk, type="磁盤IO密集型")
single_thread(io_request,type="網(wǎng)絡(luò)IO密集型")
single_thread(io_simulation,type="模擬IO密集型")

看看結(jié)果

【單線程】-CPU計算密集型花費時間:83.42633867263794秒
【單線程】-磁盤IO密集型花費時間:15.641993284225464秒
【單線程】-網(wǎng)絡(luò)IO密集型花費時間:1.1397218704223633秒
【單線程】-模擬IO密集型花費時間:20.020972728729248秒

第二步,再來看看多線程的

@timer("【多線程】")
def multi_thread(func, type=""):
    thread_list = []
    for i in range(10):
        t=Thread(target=func, args=())
        thread_list.append(t)
        t.start()
    e = len(thread_list)

    while True:
        for th in thread_list:
            if not th.is_alive():
                e -= 1
        if e <= 0:
            break

# 多線程
multi_thread(count, type="CPU計算密集型")
multi_thread(io_disk, type="磁盤IO密集型")
multi_thread(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_thread(io_simulation, type="模擬IO密集型")

看看結(jié)果

【多線程】-CPU計算密集型花費時間:93.82986998558044秒
【多線程】-磁盤IO密集型花費時間:13.270896911621094秒
【多線程】-網(wǎng)絡(luò)IO密集型花費時間:0.1828296184539795秒
【多線程】-模擬IO密集型花費時間:2.0288875102996826秒

第三步,最后來看看多進程

@timer("【多進程】")
def multi_process(func, type=""):
    process_list = []
    for x in range(10):
        p = Process(target=func, args=())
        process_list.append(p)
        p.start()
    e = process_list.__len__()

    while True:
        for pr in process_list:
            if not pr.is_alive():
                e -= 1
        if e <= 0:
            break

# 多進程
multi_process(count, type="CPU計算密集型")
multi_process(io_disk, type="磁盤IO密集型")
multi_process(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_process(io_simulation, type="模擬IO密集型")

看看結(jié)果

【多進程】-CPU計算密集型花費時間:9.082211017608643秒
【多進程】-磁盤IO密集型花費時間:1.287339448928833秒
【多進程】-網(wǎng)絡(luò)IO密集型花費時間:0.13074755668640137秒
【多進程】-模擬IO密集型花費時間:2.0076842308044434秒

3. 性能對比成果總結(jié)

將結(jié)果匯總一下,制成表格。

https://file.elecfans.com//web2/M00/36/11/poYBAGIwUWCALmJbAADPTR8eNVs753.png

我們來分析下這個表格。

首先是CPU密集型,多線程以對比單線程,不僅沒有優(yōu)勢,顯然還由于要不斷的加鎖釋放GIL全局鎖,切換線程而耗費大量時間,效率低下,而多進程,由于是多個CPU同時進行計算工作,相當(dāng)于十個人做一個人的作業(yè),顯然效率是成倍增長的。

然后是IO密集型,IO密集型可以是磁盤IO,網(wǎng)絡(luò)IO數(shù)據(jù)庫IO等,都屬于同一類,計算量很小,主要是IO等待時間的浪費。通過觀察,可以發(fā)現(xiàn),我們磁盤IO,網(wǎng)絡(luò)IO的數(shù)據(jù),多線程對比單線程也沒體現(xiàn)出很大的優(yōu)勢來。這是由于我們程序的的IO任務(wù)不夠繁重,所以優(yōu)勢不夠明顯。

所以我還加了一個「模擬IO密集型」,用sleep來模擬IO等待時間,就是為了體現(xiàn)出多線程的優(yōu)勢,也能讓大家更加直觀的理解多線程的工作過程。單線程需要每個線程都要sleep(2),10個線程就是20s,而多線程,在sleep(2)的時候,會切換到其他線程,使得10個線程同時sleep(2),最終10個線程也就只有2s.

可以得出以下幾點結(jié)論

單線程總是最慢的,多進程總是最快的。

多線程適合在IO密集場景下使用,譬如爬蟲,網(wǎng)站開發(fā)等

多進程適合在對CPU計算運算要求較高的場景下使用,譬如大數(shù)據(jù)分析,機器學(xué)習(xí)

多進程雖然總是最快的,但是不一定是最優(yōu)的選擇,因為它需要CPU資源支持下才能體現(xiàn)優(yōu)勢

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 多線程
    +關(guān)注

    關(guān)注

    0

    文章

    279

    瀏覽量

    21027
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4876

    瀏覽量

    90025
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【瑞薩RA × Zephyr評測】多線程和看門狗

    本文章旨在評估使用 Zephyr RTOS 在 Renesas FPB-RA6E2 開發(fā)板上實現(xiàn)多線程調(diào)度與硬件看門狗功能的應(yīng)用。評估內(nèi)容包括任務(wù)調(diào)度、看門狗初始化流程、主程序邏輯的詳細解析,以及實驗現(xiàn)象與數(shù)據(jù)分析。
    的頭像 發(fā)表于 01-10 10:23 ?2466次閱讀
    【瑞薩RA × Zephyr評測】<b class='flag-5'>多線程</b>和看門狗

    解析Linux的進程線程和協(xié)程

    和系統(tǒng)資源。線程的引入使得多核處理器得以充分利用,因為多線程程序可以更有效地分配和管理多核心的計算資源。 線程的特點包括: (1)共享性:線程之間共享同一
    發(fā)表于 12-22 11:00

    多線程的系統(tǒng)

    多線程系統(tǒng)的事件響應(yīng)也是在中斷中完成的,但事件的處理是在線程中完成的。在多線程系統(tǒng)中,線程跟中斷一樣,也具有優(yōu)先級,優(yōu)先級高的線程會被優(yōu)先執(zhí)
    發(fā)表于 12-08 07:55

    嵌入式應(yīng)掌握的幾種能力

    RT-Thread等。學(xué)習(xí)操作系統(tǒng)內(nèi)核知識:線程調(diào)度、時鐘管理、線程間同步、線程間通信、內(nèi)存管理、設(shè)備管理等,并掌握基本的使用。 再熟悉Linux操作系統(tǒng)的基本使用。 再學(xué)習(xí)Linux下的應(yīng)用開發(fā)知識:
    發(fā)表于 12-08 06:05

    Linux多線程對比線程的優(yōu)勢

    :「資源利用率」:通過多線程,可以更有效地利用CPU資源,特別是多核CPU?!覆⑿刑幚怼梗?b class='flag-5'>線程允許同時執(zhí)行多個任務(wù),提高程序的執(zhí)行效率?!负喕O(shè)計」:使用線程可以簡化程序設(shè)計,因為線程
    發(fā)表于 12-01 06:11

    飛凌嵌入式ElfBoard-文件I/O的了解探究之競爭冒險

    競爭冒險(Race Condition)指的是在多線程多進程環(huán)境中,多個線程進程對共享資源進行訪問和修改時可能導(dǎo)致的不確定性結(jié)果或錯誤行為。競爭冒險通常發(fā)生在多個
    發(fā)表于 11-26 15:38

    rt-thread studio 如何進行多線程編譯?

    ,使用的是5800h+32g內(nèi)存+sn550 ssd,開啟16線程編譯時cpu的占用率也只能到30%,編譯完整個工程需要3分鐘 感覺多線程編譯設(shè)置沒有生效,有辦法提高編譯速度嗎 rtthread studio版本是 2.2.9
    發(fā)表于 10-11 09:16

    多線程與多處理有何區(qū)別

    多處理也稱為進程進程是一個在自己的內(nèi)存空間中運行的獨立程序。
    的頭像 發(fā)表于 09-16 14:21 ?552次閱讀

    【HZ-T536開發(fā)板免費體驗】—— linux創(chuàng)建線程

    線程進程 一個進程指的是一個正在執(zhí)行的應(yīng)用程序,而線程的功能是執(zhí)行應(yīng)用程序中的某個具體任務(wù)。線程具有傳統(tǒng)
    發(fā)表于 09-01 21:31

    多線程的安全注意事項

    多線程安全是指多個線程同時訪問或修改共享資源時,能夠保證程序的正確性和可靠性。 開發(fā)者選擇TaskPool或Worker進行多線程開發(fā)時,在TaskPool和Worker的工作線程中導(dǎo)
    發(fā)表于 06-20 07:49

    TaskPool和Worker的對比分析

    支持。不支持。適用場景對比 TaskPool和Worker均支持多線程并發(fā)能力。由于TaskPool的工作線程會綁定系統(tǒng)的調(diào)度優(yōu)先級,并且支持負載均衡(自動擴縮容),而Worker需要開發(fā)者自行創(chuàng)建
    發(fā)表于 06-18 06:43

    工控一體機多線程任務(wù)調(diào)度優(yōu)化:聚徽分享破解工業(yè)復(fù)雜流程高效協(xié)同密碼

    在當(dāng)今工業(yè) 4.0 的浪潮下,工業(yè)生產(chǎn)正朝著高度自動化、智能化的方向大步邁進。生產(chǎn)流程日益復(fù)雜,眾多任務(wù)需要同時、高效地協(xié)同執(zhí)行,這對工業(yè)控制系統(tǒng)的核心 —— 工控一體機提出了前所未有的挑戰(zhàn)。多線程
    的頭像 發(fā)表于 05-28 14:06 ?633次閱讀

    一種實時多線程VSLAM框架vS-Graphs介紹

    針對現(xiàn)有VSLAM系統(tǒng)語義表達不足、地圖可解釋性差的問題,本文提出vS-Graphs,一種實時多線程VSLAM框架。該方案顯著提升了重建地圖的語義豐富度、可解釋性及定位精度。實驗表明
    的頭像 發(fā)表于 04-19 14:07 ?1001次閱讀
    一種實時<b class='flag-5'>多線程</b>VSLAM框架vS-Graphs介紹

    進程線程、協(xié)程傻傻分不清?一文帶你徹底扒光它們的\"底褲\"!

    外賣員(線程C):負責(zé)送外賣他們共用: 原料冰箱(共享內(nèi)存) 工作臺(棧空間)但不共享: 自己的工牌(線程ID) 心情日記(線程本地存儲) 代碼示例(Python
    發(fā)表于 03-26 09:27

    請問如何在Python中實現(xiàn)多線程多進程的協(xié)作?

    大家好!我最近在開發(fā)一個Python項目時,需要同時處理多個任務(wù),且每個任務(wù)需要不同的計算資源。我想通過多線程多進程的組合來實現(xiàn)并發(fā),但遇到了一些問題。 具體來說,我有兩個任務(wù),一個是I/O密集型
    發(fā)表于 03-11 06:57