国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SO_REUSEADDR 與 SO_REUSEPORT是什么?

Linux愛好者 ? 來源:187J3X1 ? 作者:187J3X1 ? 2020-12-11 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

SO_REUSEPORT選項在Linux 3.9被引入內核,在這之前也有一個很像的選項SO_REUSEADDR。

如果你不太清楚這兩者的區別和聯系,建議搜索 How do SO_REUSEADDR and SO_REUSEPORT differ?。

如果不想讀,那么下面這一節算是為懶人準備的。

SO_REUSEADDR 與 SO_REUSEPORT 是什么?

TCP/UDP用五元組唯一標識一個連接。

任何時候,兩條連接的五元組都不能完全相同,否則當收到一個報文時,協議棧沒辦法判斷它是屬于哪個連接的。

五元組{, , , , }

五元組里,protocol在創建socket時確定,在bind()時確定,在connect()時確定。

當然,bind()和connect()在一些時候并不需要顯式使用,不過這不在本文的討論范圍里。

那么,如果對socket設置了SO_REUSEADDR和SO_REUSEPORT選項,它們什么時候起作用呢?

答案是bind(),也就在確定時。

不同操作系統內核對待SO_REUSEADDR和SO_REUSEPORT的行為有少許差異,但它們都源自BSD

因此,接下來就以BSD的實現為標準進行說明。

SO_REUSEADDR

假設我現在需要bind()將socketA綁定到A:X,將socketB綁定到B:Y(不考慮X=0或者Y=0,因為0表示讓內核自動分配端口,一定不會沖突)。

如果X!=Y,那么無論A和B的關系如何,兩個bind()都會成功。但如果X==Y,那么結果會是下面這樣:

SO_REUSEADDR socketA socketB Result --------------------------------------------------------------------- ON/OFF 192.168.0.1:21 192.168.0.1:21 Error (EADDRINUSE) ON/OFF 192.168.0.1:21 10.0.0.1:21 OK ON/OFF 10.0.0.1:21 192.168.0.1:21 OK OFF 0.0.0.0:21 192.168.1.0:21 Error (EADDRINUSE) OFF 192.168.1.0:21 0.0.0.0:21 Error (EADDRINUSE) ON 0.0.0.0:21 192.168.1.0:21 OK ON 192.168.1.0:21 0.0.0.0:21 OK ON/OFF 0.0.0.0:21 0.0.0.0:21 Error (EADDRINUSE)

第一列表示是否設置SO_REUSEADDR注,最后一列表示后綁定的socket是否能綁定成功。

注:這里設置的對象是指后綁定的socket(也就是說不關心前一個是否設置)

可以看出,BSD的實現中SO_REUSEADDR可以讓一個使用通配地址(0.0.0.0),一個使用指定地址(192.168.1.0)的socket同時綁定成功。

SO_REUSEADDR還有一種應用情景:在TCP中存在一個TIME_WAIT狀態,它是指主動關閉的一端最后停留的階段。

假設socketA綁定到A:X,在完成TCP通信后主動使用close(),進入TIME_WAIT,此時,如果socketB也去綁定A:X,那么同樣會得到EADDRINUSE錯誤,但如果socketB設置了SO_REUSEADDR,那么就可以綁定成功。

SO_REUSEPORT

如果理解了SO_REUSEADDR,那么SO_REUSEPORT就很好理解了,它讓兩個socket可以綁定完全相同的

SO_REUSEPORT socketA socketB Result --------------------------------------------------------------------- ON 192.168.0.1:21 192.168.0.1:21 OK

提醒一下,以上的結果都是BSD的結果,Linux內核有一些不一樣的地方,具體表現為

3.9版本支持SO_REUSEPORT,作為Server的TCP Socket一旦綁定到了具體的端口,啟動了LISTEN,即使它之前設置過SO_REUSEADDR, 也不會生效。這一點Linux比BSD更加嚴格

SO_REUSEADDR socketA socketB Result --------------------------------------------------------------------- ON/OFF 192.168.0.1:21 0.0.0.0:21 Error (EADDRINUSE)

3.9版本之前,作為Client的Socket,SO_REUSEADDR選項具有BSD中的SO_REUSEPORT的效果。這一點Linux又比BSD更加寬松。

SO_REUSEADDR socketA socketB Result --------------------------------------------------------------------- ON 192.168.0.2:55555 192.168.0.2:55555 OK

Linux中reuseport的演進

Linux < 3.9

下面看看具體是怎么做的: 內核socket使用skc_reuse字段表示是否設置了SO_REUSEADDR

struct sock_common { /* omitted */ unsigned char skc_reuse; /* omitted */ } int sock_setsockopt(struct socket *sock, int level, int optname,... { ...... case SO_REUSEADDR: sk->sk_reuse = (valbool ? SK_CAN_REUSE : SK_NO_REUSE); break; }

inet_bind_bucket表示一個綁定的端口。

struct inet_bind_bucket { /* omitted */ unsigned short port; signed short fastreuse; int num_owners; struct hlist_node node; struct hlist_head owners; };

上面結構中的fastreuse表示該端口是否支持共享,所有共享該端口的socket掛到owner成員上。在用戶使用bind()時,內核使用TCP:inet_csk_get_port(),UDP:udp_v4_get_port()來綁定端口。

/* inet_connection_Sock.c: inet_csk_get_port() */ tb_found: if (!hlist_empty(&tb->owners)) { ...... if (tb->fastreuse > 0 && sk->sk_reuse && sk->sk_state != TCP_LISTEN && smallest_size == -1) { goto success;

所以,當該端口支持共享,且socket也設置了SO_REUSEADDR并且不為LISTEN狀態時,此次bind()可以成功。

3.9 =< Linux < 4.5

3.9版本內核增加了對SO_REUSEPORT的支持,listener可以綁定到相同的了。

這個時候,當Server收到Client發送的SYN報文時,會選擇其中一個socket進行響應。

具體到實現,3.9版本擴展了sock_common,將原來記錄skc_reuse進行了拆分.

struct sock_common { unsigned short skc_family; volatile unsigned char skc_state; - unsigned char skc_reuse; + unsigned char skc_reuse:4; + unsigned char skc_reuseport:4; @@ int sock_setsockopt(struct socket *sock, int level, int optname, case SO_REUSEADDR: sk->sk_reuse = (valbool ? SK_CAN_REUSE : SK_NO_REUSE); break; + case SO_REUSEPORT: + sk->sk_reuseport = valbool; + break;

然后對inet_bind_bucket也相應進行了擴展

struct inet_bind_bucket { /* omitted */ unsigned short port; - signed short fastreuse; + signed char fastreuse; + signed char fastreuseport; + kuid_t fastuid;

而在綁定端口時,增加了一個隊reuseport的通過條件

/* inet_connection_sock.c: inet_csk_get_port() */ tb_found: if (sk->sk_reuse == SK_FORCE_REUSE) goto success; - if (tb->fastreuse > 0 && - sk->sk_reuse && sk->sk_state != TCP_LISTEN && + if (((tb->fastreuse > 0 && + sk->sk_reuse && sk->sk_state != TCP_LISTEN) || + (tb->fastreuseport > 0 && + sk->sk_reuseport && uid_eq(tb->fastuid, uid))) && smallest_size == -1) { goto success;

而當Client的SYN報文到達時,Server會首先根據本地端口(SYN報文的)計算出一條hash沖突鏈,然后遍歷該鏈表上的所有Socket,根據四元組匹配程度進行打分;

如果使能了reuseport,那么可能有多個Socket都將拿到最高分,此時內核將隨機選擇一個進行后續處理。

/* inet_hashtables.c */ struct sock *__inet_lookup_listener(struct......) { struct sock *sk, *result; unsigned int hash = inet_lhashfn(net, hnum); struct inet_listen_hashbucket *ilb = &hashinfo->listening_hash[hash]; // 根據本地端口找到hash沖突鏈 /* code omitted */ result = NULL; hiscore = 0; sk_nulls_for_each_rcu(sk, node, &ilb->head) { score = compute_score(sk, net, hnum, daddr, dif); // 根據匹配程度進行打分 if (score > hiscore) { result = sk; hiscore = score; reuseport = sk->sk_reuseport; if (reuseport) { phash = inet_ehashfn(net, daddr, hnum, saddr, sport); matches = 1; // 如果是reuseport 則累計多少個socket滿足 } } else if (score == hiscore && reuseport) { matches++; if (reciprocal_scale(phash, matches) == 0) result = sk; phash = next_pseudo_random32(phash); } } /* * if the nulls value we got at the end of this lookup is * not the expected one, we must restart lookup. * We probably met an item that was moved to another chain. */ return result; }

舉個栗子,假設內核有4條listening socket的hash沖突鏈,然后用戶建立了4個Server:A、B、C、D,監聽的地址和端口如下圖所示,A和B使能了SO_REUSEPORT。

沖突鏈是以端口為Key的,因此A、B、D會掛到同一條沖突鏈上。

如果此時收到對端一個SYN報文<192.168.10.1, 21>,那么內核會遍歷listening_hash[0],為上面的7個socket進行打分,而由于B監聽的是精確的地址,所以B的得分會比A高,內核最終選擇出一個SocketB進行后續處理。

89f4964a-2eb2-11eb-a64d-12bb97331649.png

4.5 < Linux

從上面的例子可以看出,當收到SYN報文時,內核一定會遍歷一條完整hash沖突鏈,為每一個socket進行打分,這稍微有些多余。

因此,在4.5版本中,內核引入了reuseport groups,它將綁定到同一個IP和Port,并且設置了SO_REUSEPORT選項的socket組織到一個group內部。

8a34dac0-2eb2-11eb-a64d-12bb97331649.png

--- a/include/net/sock.h +++ b/include/net/sock.h @@ -318,6 +318,7 @@ struct cg_proto; * @sk_error_report: callback to indicate errors (e.g. %MSG_ERRQUEUE) * @sk_backlog_rcv: callback to process the backlog * @sk_destruct: called at sock freeing time, i.e. when all refcnt == 0 + * @sk_reuseport_cb: reuseport group container */ struct sock { /* @@ -453,6 +454,7 @@ struct sock { int (*sk_backlog_rcv)(struct sock *sk, struct sk_buff *skb); void (*sk_destruct)(struct sock *sk); + struct sock_reuseport __rcu *sk_reuseport_cb; };

這個特性在4.5版本只支持UDP,而在4.6版本開始支持TCP(patch)。

這樣在查找listen socket時,內核將不用再遍歷整個沖突鏈,而是在找到一個合格的socket時,如果它設置了SO_REUSEPORT,就直接找到它所屬的reuseport group,從中選擇一個進行后續處理。

@@ -215,6 +217,7 @@ struct sock *__inet_lookup_listener(struct net *net, unsigned int hash = inet_lhashfn(net, hnum); struct inet_listen_hashbucket *ilb = &hashinfo->listening_hash[hash]; int score, hiscore, matches = 0, reuseport = 0; + bool select_ok = true; u32 phash = 0; rcu_read_lock(); @@ -230,6 +233,15 @@ begin: if (reuseport) { phash = inet_ehashfn(net, daddr, hnum, saddr, sport); + if (select_ok) { + struct sock *sk2; + sk2 = reuseport_select_sock(sk, phash, + skb, doff); + if (sk2) { + result = sk2; + goto found; + } + } matches = 1; } }

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 內核
    +關注

    關注

    4

    文章

    1467

    瀏覽量

    42869
  • Linux
    +關注

    關注

    88

    文章

    11758

    瀏覽量

    219006

原文標題:Linux 內核中 reuseport 的演進

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    無法打開 starfive:/usr/lib/dri/starfive_dri.so怎么解決?

    我創建了一個干凈的debootstraped Debian 圖像。啟動 X 會話時,我收到一個關于丟失的奇怪錯誤starfive_dri.所以.會話仍會開始。但我想知道可以在哪里聲明這樣的自定義/供應商庫。StarFive 是否提供此庫的源代碼或軟件包?雖然提供了一些與 GPU 相關的庫這里,我找不到starfive_dri.所以在。 root@host:~# startxX.Org X Server 1.21.1.7X Protocol Version 11, Revision 0Current Operating System: Linux DietPi 5.15.102 #1 SMP Tue Mar 14 15:28:55 UTC 2023 riscv64Kernel command line: root=PARTUUID=c3534437-01 rootfstype=ext4 rootwait earlycon console=ttyS0,115200 console=tty0 consoleblank=0 net.ifnames=0xorg-server 2:21.1.7-1 (https://www.debian.org/support)Current version of pixman: 0.42.2Before reporting problems, check http://wiki.x.orgto make sure that you have the latest version.Markers: (--) probed, (**) from config file, (==) default setting,(++) from command line, (!!) notice, (II) informational,(WW) warning, (EE) error, (NI) not implemented, (??) unknown.(==) Log file: "/var/log/xorg.0.log", Time: Tue Mar 14 22:40:39 2023(==) Using config directory: "/etc/X11/xorg.conf.d"(==) Using system config directory "/usr/share/X11/xorg.conf.d"MESA-LOADER: failed to open starfive: /usr/lib/dri/starfive_dri.所以: cannot open shared object file: No such file or directory (search paths /usr/lib/riscv64-linux-gnu/dri:$${ORIGIN}/dri:/usr/lib/dri, suffix _dri)failed to load driver: starfive^Cxinit: connection to X server lostwaiting for X server to shut down .(II) Server terminated successfully (0). Closing log file.xinit: unexpected signal 2root@host:~#我打斷了 X 會話,如^C,在它運行了幾分鐘之后。由于系統是遠程的,我無法測試桌面是否真的顯示在附加的屏幕上。遠程團隊成員稍后將執行此作.這/var/log/xorg.0.log不提供更多相關細節。
    發表于 02-10 08:08

    MDD品牌三極管MMBT4403數據手冊

    SO T-23開關晶體管
    發表于 01-05 09:53 ?0次下載

    探索CYTVII-B-E-100-SO評估板:功能、操作與連接全解析

    探索CYTVII-B-E-100-SO評估板:功能、操作與連接全解析 在電子設計領域,評估板是驗證和開發新設備功能的重要工具。今天,我們將深入探討CYTVII-B-E-100-SO評估板,它是
    的頭像 發表于 12-19 10:30 ?352次閱讀

    Amphenol ICC DDR5 SO - DIMM連接器:高速高密度的理想之選

    Amphenol ICC DDR5 SO - DIMM連接器:高速高密度的理想之選 在當今高速發展的電子科技領域,內存連接器的性能對于系統的整體表現起著至關重要的作用。Amphenol ICC推出
    的頭像 發表于 12-12 11:15 ?472次閱讀

    DDR5設計指南(二):什么是CAMM2?

    的? SO-DIMM ?標準。 CAMM2 的主要特點和優勢: 更薄、更節省空間: CAMM2 模組的設計非常纖薄,它平貼在主板上,而不是像 SO-DIMM 那樣傾斜插入。與 SO-DIMM 相比,它可以節省高
    的頭像 發表于 10-28 11:15 ?5386次閱讀
    DDR5設計指南(二):什么是CAMM2?

    昂科燒錄器支持Microchip微芯科技的8位CMOS微控制器PIC16F54-I/SO

    芯片燒錄領導者昂科技術在發布新版燒錄軟件的同時,宣布擴展了兼容芯片型號列表。新增型號里有了微芯科技的8位CMOS微控制器PIC16F54-I/SO,這款芯片已得到昂科通用燒錄平臺AP8000通用
    的頭像 發表于 08-05 09:38 ?1073次閱讀
    昂科燒錄器支持Microchip微芯科技的8位CMOS微控制器PIC16F54-I/<b class='flag-5'>SO</b>

    在linux環境下 軟件啟動失敗怎么解決?

    anyway. /usr/lib/x86_64-linux-gnu/libproxy/libpxbackend-1.0.so: undefined symbol
    發表于 06-23 07:37

    se5 8使用YOLOv5_object示例程序出錯“Not able to open cpu.so”的原因?

    ][bmcpu_setup:346] WARNING:Not able to open cpu.so [BMRT][load_bmodel:1018] INFO:Loading bmodel from
    發表于 04-22 11:29

    如何為LSDK構建libgtk-x11-2.0.so.0?

    我正在嘗試為我的 LS1028A RDB板(運行 LSDK)構建 libgtk-x11-2.0.so.0。這是 libopencv_highgui.so 所需要的。有沒有辦法為 LS1028A 交叉編譯這個庫?
    發表于 04-04 08:00

    L272 雙功率運算放大器技術手冊

    L272 是采用 Powerdip、Minidip 和 SO封裝的單片集成電路,旨在用作功率運算放大器,應用范圍廣泛,包括伺服放大器和電源、光盤、VCR 等。
    的頭像 發表于 03-31 09:21 ?1234次閱讀
    L272 雙功率運算放大器技術手冊

    為imx6qsabresd進行bitbake mesa時未構建libGL.so,為什么?

    /gl.h 標頭,但我找不到,但我可以在 /usr/lib 下看到 libGL.so。我的理解是專有的 GPU 驅動程序不支持 OpenGL,僅支持 OpenGLES,并且提供的 libGL.so
    發表于 03-28 08:18

    MT-HIL(8):使用MATLAB導出.SO文件,并在LabVIEW中配合RIO設備使用

    串口
    芒果樹數字
    發布于 :2025年03月18日 11:11:15

    SO1400光耦參數測試系統 多通道光電器件綜合測試平臺

    SO1400是專為?第三代光耦器件?設計的全自動測試系統,集成1400V高壓測試與1A大電流驅動能力。本設備采用軍工級測試架構,滿足?工業4.0?標準下對光耦器件的?在線質量檢測?與?可靠性驗證?需求,適用于新能源、智能電網等高可靠性應用場景。
    的頭像 發表于 03-13 12:05 ?1015次閱讀
    <b class='flag-5'>SO</b>1400光耦參數測試系統  多通道光電器件綜合測試平臺

    STM32H7使用LWIP通信,數據量過大會卡死怎么解決?

    , SO_REUSEADDR, &enable, sizeof(enable));//允許本地地址重用 // 設置讀取超時 struct timeval timeout
    發表于 03-11 06:43

    使用GPU作為目標設備“無法創建插件libclDNNPlugin.so怎么解決?

    運行OpenVINO時的 GPU 驅動程序故障排除
    發表于 03-07 08:02