伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

HTTP協議三種狀態碼的觸發場景和排查方法

馬哥Linux運維 ? 來源:馬哥Linux運維 ? 2026-04-09 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言:狀態碼不是數字游戲

作為運維工程師,每天都要和 502、503、504 這些狀態碼打交道。但真正能說清楚這三者區別的人并不多——很多人只知道"網關錯誤",卻不清楚具體是哪個環節出了問題。

這篇文章從 HTTP 協議原理講起,詳細區分這三種狀態碼的觸發場景、排查方法,并給出實際的排障案例。看完之后,你遇到這類問題應該能快速定位根因。

前置知識:HTTP 協議基礎、Nginx/Apache 基礎

實驗環境:CentOS Stream 9 / Ubuntu 24.04 LTS

1 HTTP 狀態碼體系

1.1 HTTP 狀態碼分類

HTTP 狀態碼結構:
  1xx - 信息響應
  2xx - 成功響應
  3xx - 重定向
  4xx - 客戶端錯誤
  5xx - 服務器錯誤

重點關注 5xx:
  502 Bad Gateway
  503 Service Unavailable
  504 Gateway Timeout

1.2 5xx 狀態的共同點

# Nginx 配置:返回 5xx 狀態碼時記錄詳細日志
log_format detailed '$remote_addr - $remote_user [$time_local] '
          '"$request" $status $body_bytes_sent '
          '"$http_referer" "$http_user_agent" '
          'rt=$request_time uct="$upstream_connect_time" '
          'uht="$upstream_header_time" urt="$upstream_response_time"';

access_log /var/log/nginx/detailed.log detailed;

# 自定義錯誤頁面
error_page 502 503 504 /50x.html;
location = /50x.html {
  root /usr/share/nginx/html;
  internal;
}

1.3 錯誤碼與 HTTP 協議層的關系

          ┌─────────────────────────────────────┐
          │      HTTP 層(應用層)      │
          │ 理解請求內容、狀態碼、緩存控制等   │
          └─────────────────────────────────────┘
                  ▲
                  │ 協議解析
                  │
┌─────────────────────────────────────┴───────────────────────────┐
│           Proxy/網關 層                │
│ Nginx 作為反向代理,接收客戶端請求,轉發給后端          │
│ Nginx 負責返回 502/503/504 狀態碼               │
└─────────────────────────────────────────────────────────────────┘
                  ▲
                  │ 轉發請求
                  │
┌─────────────────────────────────────┴───────────────────────────┐
│          Upstream(后端服務)層             │
│ PHP-FPM、Node.js、Python uWSGI、Java Tomcat 等         │
│ 后端服務可能返回 500 錯誤或其他狀態               │
└─────────────────────────────────────────────────────────────────┘

2 502 Bad Gateway 深度解析

2.1 502 的定義

502 Bad Gateway:作為網關或代理的服務器收到了無效響應。

客戶端          Nginx           PHP-FPM
 |             |              |
 | ──────── GET / ──────> |              |
 |             | ──────── FastCGI ──────> |
 |             |              |
 |             | <─────── (無響應) ─────── |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ?連接被拒絕/超時 ? ? ? |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | <──── 502 Bad Gateway -| ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |

2.2 502 的典型觸發場景

場景一:后端服務未啟動

# 檢查 PHP-FPM 是否運行
systemctl status php-fpm
# 或
ps aux | grep php-fpm

# 如果未運行
sudo systemctl start php-fpm
sudo systemctlenablephp-fpm

場景二:后端端口配置錯誤

# Nginx 配置
upstream backend {
  server 127.0.0.1:9000; # 正確的端口
  # server 127.0.0.1:9001; # 錯誤的端口(服務未監聽)
}

server {
  listen 80;
  server_name example.com;

  location / {
    proxy_pass http://backend;
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
  }

  # FastCGI 配置(PHP)
  location ~ .php$ {
    fastcgi_pass 127.0.0.1:9000; # 檢查端口是否正確
    fastcgi_index index.php;
    include fastcgi_params;
    fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
  }
}

場景三:后端服務崩潰

# 查看 PHP-FPM 錯誤日志
tail -100 /var/log/php-fpm/error.log
# 或
journalctl -u php-fpm -n 100 --no-pager

# 查看進程狀態
ps aux | grep php-fpm
# 如果進程存在但無法響應,可能是 worker 進程耗盡

場景四:連接數耗盡

# PHP-FPM 配置檢查
cat /etc/php-fpm.d/www.conf | grep -E"^pm|^pm.|^request_"

# 典型配置
[www]
pm = dynamic
pm.max_children = 50   # 最大子進程數
pm.start_servers = 5  # 啟動時進程數
pm.min_spare_servers = 5# 最小空閑進程
pm.max_spare_servers = 35# 最大空閑進程
pm.max_requests = 500  # 每個進程處理多少請求后回收

# 如果 max_children 已滿,新請求會排隊或超時

2.3 502 排查流程圖

502 錯誤發生
  │
  ├── Step 1: 檢查 Nginx 能否連接后端
  │  ├── telnet 127.0.0.1 9000
  │  ├── nc -zv 127.0.0.1 9000
  │  └── ss -tlnp | grep 9000
  │
  ├── Step 2: 檢查后端服務狀態
  │  ├── systemctl status php-fpm
  │  ├── ps aux | grep php-fpm
  │  └── ss -tlnp | grep :9000
  │
  ├── Step 3: 檢查后端資源
  │  ├── /var/log/php-fpm/error.log
  │  ├── dmesg | tail
  │  └── free -h
  │
  └── Step 4: 檢查 Nginx 日志
    ├── /var/log/nginx/error.log
    └── /var/log/nginx/access.log (rt 字段)

2.4 502 實際排查腳本

#!/bin/bash
# check_502.sh - 502 錯誤快速排查

echo"=========================================="
echo"     502 錯誤排查"
echo"=========================================="

# 1. 檢查 Nginx 狀態
echo""
echo"[1] Nginx 服務狀態"
systemctl is-active nginx &&echo"? Nginx 運行中"||echo"? Nginx 未運行"
ss -tlnp | grep :80 | head -5

# 2. 檢查后端服務
echo""
echo"[2] PHP-FPM 服務狀態"
systemctl is-active php-fpm &&echo"? PHP-FPM 運行中"||echo"? PHP-FPM 未運行"
ps aux | grep -E"php-fpm|php-cgi"| grep -v grep | head -5

# 3. 檢查端口監聽
echo""
echo"[3] 端口監聽狀態"
ss -tlnp | grep -E":80|:9000|:9001|:8080"| head -10

# 4. 檢查連接測試
echo""
echo"[4] 后端連接測試"
timeout 3 bash -c"echo > /dev/tcp/127.0.0.1/9000"2>/dev/null &&echo"? 127.0.0.1:9000 可連接"||echo"? 127.0.0.1:9000 無法連接"
timeout 3 bash -c"echo > /dev/tcp/127.0.0.1/9001"2>/dev/null &&echo"? 127.0.0.1:9001 可連接"||echo"? 127.0.0.1:9001 無法連接"

# 5. 檢查資源使用
echo""
echo"[5] 資源使用情況"
free -h | grep Mem
df -h / | tail -1

# 6. 查看 Nginx 錯誤日志
echo""
echo"[6] Nginx 502 錯誤日志(最近 10 條)"
grep -A2"502"/var/log/nginx/error.log 2>/dev/null | tail -20

# 7. 查看 PHP-FPM 錯誤日志
echo""
echo"[7] PHP-FPM 錯誤日志(最近 10 條)"
tail -10 /var/log/php-fpm/error.log 2>/dev/null || tail -10 /var/log/php-fpm/www-error.log 2>/dev/null

echo""
echo"=========================================="
echo"      排查完成"
echo"=========================================="

3 503 Service Unavailable 深度解析

3.1 503 的定義

503 Service Unavailable:服務器暫時無法處理請求,可能是過載或維護。

客戶端          Nginx           后端服務
 |             |              |
 | ──────── GET / ──────> |              |
 |             |              |
 |             | <─────── 503 ────────── ? |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? 服務暫時不可用 ? ? ? ? ? |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | <──── 503 Service ----- | ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | ? ? ? ? Unavailable ? ? ?| ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |

3.2 503 的典型觸發場景

場景一:后端服務主動返回 503

# Nginx 配置:限流觸發 503
limit_req_zone $binary_remote_addr zone=one:10m rate=10r/s;

server {
  listen 80;
  server_name example.com;

  location / {
    limit_req zone=one burst=20 nodelay;
    proxy_pass http://backend;
  }
}

# 自定義 503 頁面
error_page 503 /503.html;
location = /503.html {
  root /usr/share/nginx/html;
  internal;
}

場景二:維護模式

# 維護開關
set $maintenance false;

# 可以通過變量控制
if (-f /var/www/maintenance.html) {
  set $maintenance true;
}

server {
  listen 80;
  server_name example.com;

  if ($maintenance = true) {
    return 503;
  }

  location / {
    proxy_pass http://backend;
  }

  error_page 503 @maintenance;
  location @maintenance {
    root /var/www;
    rewrite ^(.*)$ /maintenance.html break;
  }
}

場景三:連接數限制

# Nginx 層面限制
limit_conn_zone $binary_remote_addr zone=addr:10m;

server {
  listen 80;

  location / {
    limit_conn addr 10; # 每個 IP 最多 10 個連接
    proxy_pass http://backend;
  }
}

場景四:后端服務過載

# 查看當前連接數
ss -ant | grep :8080 | wc -l

# 查看 PHP-FPM 狀態頁面
# 需要啟用 status 頁面
cat /etc/php-fpm.d/www.conf | grep status
# pm.status_path = /status

# Nginx 配置 status 頁面
location ~ ^/(status|ping)$ {
  access_log off;
  allow 127.0.0.1;
  deny all;
  fastcgi_pass 127.0.0.1:9000;
  fastcgi_param SCRIPT_FILENAME$document_root$fastcgi_script_name;
  include fastcgi_params;
}

# 訪問狀態頁面
curl http://127.0.0.1/status
# pool:         www
# process manager:   dynamic
# status:        idle
# accepted conn:    12345
# listen queue:     0
# max listen queue:   10
# listen queue len:   10
# idle processes:    4
# active processes:   1
# total processes:   5
# max children reached: 0

3.3 503 與限流的配合

#!/bin/bash
# test_nginx_limit.sh - 測試 Nginx 限流效果

echo"測試 Nginx 限流配置..."
echo""

# 使用 ab 進行壓力測試
# 安裝 ab(如果未安裝)
whichab || sudo dnf install httpd-tools -y

# 單個請求測試
echo"=== 正常請求測試 ==="
curl -I http://localhost/ 2>/dev/null | head -1

# 并發測試
echo""
echo"=== 限流測試(20 并發,50 請求)==="
ab -n 50 -c 20 http://localhost/

# 查看限流日志
echo""
echo"=== Nginx 限流日志 ==="
tail -20 /var/log/nginx/error.log | grep -ilimit||echo"無限流日志"

# 查看響應碼統計
echo""
echo"=== 響應碼統計 ==="
awk'{print $9}'/var/log/nginx/access.log | sort | uniq -c | sort -rn

3.4 503 排查流程圖

503 錯誤發生
  │
  ├── Step 1: 判斷是 Nginx 返回還是后端返回
  │  ├── 查看響應頭
  │  └── curl -I http://example.com
  │
  ├── Step 2: 如果是 Nginx 返回
  │  ├── 檢查限流配置 (limit_req)
  │  ├── 檢查連接數限制 (limit_conn)
  │  └── 檢查維護模式
  │
  └── Step 3: 如果是后端返回
    ├── 檢查后端服務是否過載
    ├── 檢查后端日志
    └── 檢查后端資源狀態

4 504 Gateway Timeout 深度解析

4.1 504 的定義

504 Gateway Timeout:作為網關或代理的服務器未能在規定時間內完成請求。

客戶端          Nginx          后端服務
 |             |              |
 | ──────── GET / ──────> |              |
 |             | ──── 轉發請求 ─────────> |
 |             |              |
 |             |     (等待中...)    |
 |             |              |
 |             |   超時!       |
 |             | <─── (無響應) ────────── |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | <──── 504 Gateway ----- | ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | ? ? ? ? Timeout ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |
? | ? ? ? ? ? ? ? ? ? ? ? ? | ? ? ? ? ? ? ? ? ? ? ? ? ? |

4.2 504 的典型觸發場景

場景一:后端處理時間過長

# Nginx 超時配置
server {
  listen 80;
  server_name example.com;

  # FastCGI 超時設置
  fastcgi_connect_timeout 60s;  # 連接后端超時
  fastcgi_send_timeout 60s;    # 發送請求超時
  fastcgi_read_timeout 60s;    # 讀取響應超時

  # Proxy 超時設置
  proxy_connect_timeout 60s;
  proxy_send_timeout 60s;
  proxy_read_timeout 60s;

  location / {
    fastcgi_pass 127.0.0.1:9000;
    fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
    include fastcgi_params;
  }
}

場景二:慢查詢導致 PHP-FPM 超時

# PHP-FPM 超時配置
# /etc/php-fpm.d/www.conf
request_terminate_timeout = 30s # 單個請求超時
request_slowlog_timeout = 10s  # 慢查詢日志閾值

# 查看 PHP-FPM 慢日志
tail -50 /var/log/php-fpm/www-slow.log

# 找到執行時間過長的腳本
cat /var/log/php-fpm/www-slow.log
# [07-Jan-2026 1045] [pool www] pid 12345
# script: /var/www/html/api.php
# call:  mysqli_query()
# timeout: 30s elapsed

場景三:數據庫連接超時

options(MYSQLI_OPT_CONNECT_TIMEOUT,5);

// 設置讀超時
$conn->options(MYSQLI_OPT_READ_TIMEOUT,30);

// 設置寫超時
$conn->options(MYSQLI_OPT_WRITE_TIMEOUT,30);

// 執行查詢
$result = $conn->query("SELECT * FROM large_table");
?>

場景四:Nginx 等待后端響應超時

# 典型場景:API 接口處理時間過長

upstream backend {
  server 127.0.0.1:8080;
  keepalive 32;
}

server {
  listen 80;
  server_name api.example.com;

  # API 超時配置(較長)
  proxy_connect_timeout 300s;
  proxy_send_timeout 300s;
  proxy_read_timeout 300s;

  # 大文件上傳場景
  client_max_body_size 100m;
  proxy_read_timeout 600s;

  location /api/ {
    proxy_pass http://backend;
    proxy_http_version 1.1;
    proxy_set_header Connection "";
    proxy_set_header Host $host;
  }
}

4.3 504 排查流程圖

504 錯誤發生
  │
  ├── Step 1: 檢查是哪個超時
  │  ├── Nginx -> 后端:proxy_read_timeout
  │  ├── FastCGI:fastcgi_read_timeout
  │  └── 后端 PHP:max_execution_time
  │
  ├── Step 2: 檢查后端日志
  │  ├── PHP-FPM 慢日志
  │  ├── 后端應用日志
  │  └── 數據庫慢查詢日志
  │
  ├── Step 3: 檢查后端性能
  │  ├── CPU 使用率
  │  ├── 內存使用率
  │  └── 數據庫連接池
  │
  └── Step 4: 優化方案
    ├── 增加超時時間
    ├── 優化后端代碼
    └── 使用異步處理

4.4 超時配置綜合示例

# /etc/nginx/nginx.conf

# 全局超時配置
proxy_connect_timeout 60s;
proxy_send_timeout 60s;
proxy_read_timeout 60s;

# FastCGI 全局配置
fastcgi_connect_timeout 60s;
fastcgi_send_timeout 60s;
fastcgi_read_timeout 60s;
fastcgi_buffering_timeout 60s;

# uWSGI 超時配置
uwsgi_connect_timeout 60s;
uwsgi_send_timeout 60s;
uwsgi_read_timeout 60s;

server {
  listen 80;
  server_name example.com;

  # 默認頁面配置
  location / {
    proxy_pass http://backend;
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
  }

  # 靜態資源(較短超時)
  location /static/ {
    proxy_pass http://static_backend;
    proxy_connect_timeout 10s;
    proxy_read_timeout 30s;
    expires 1d;
  }

  # API 接口(較長超時)
  location /api/ {
    proxy_pass http://api_backend;
    proxy_connect_timeout 300s;
    proxy_read_timeout 300s;
  }

  # 上傳接口(更長超時)
  location /upload/ {
    proxy_pass http://upload_backend;
    proxy_connect_timeout 600s;
    proxy_read_timeout 600s;
    client_max_body_size 500m;
  }

  # 錯誤頁面
  error_page 502 503 504 /50x.html;
  location = /50x.html {
    root /usr/share/nginx/html;
    internal;
  }
}

5 三種錯誤的對比

5.1 核心區別對比表

特性 502 Bad Gateway 503 Service Unavailable 504 Gateway Timeout
含義 網關收到無效響應 服務暫時不可用 網關等待超時
問題位置 后端連接/后端崩潰 限流/過載/維護 后端處理太慢
Nginx 視角 連接失敗 連接成功但拒絕服務 連接成功但響應超時
常見原因 后端未啟動、端口錯誤 限流、worker 耗盡 慢查詢、接口耗時過長
解決方向 檢查后端服務 擴容、限流、等待 優化后端代碼
HTTP 方法 所有方法 所有方法 通常 GET/POST

5.2 響應時間對比

502: ████????????????????? 立即返回(連接失?。?503: ████????????????????? 立即返回(限流拒絕)
504: ██████████████████████ 等待超時后返回

5.3 日志特征對比

# Nginx 錯誤日志示例

# 502 - 后端連接被拒絕
2026/01/15 1045 [error] 12345#0: *1 connect() failed (111: Connection refused) while connecting to upstream, client: 192.168.1.100, server: example.com, request: "GET / HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "example.com"

# 502 - 后端無響應
2026/01/15 1000 [error] 12345#0: *2 no live connection while connecting to upstream, client: 192.168.1.101, server: example.com, request: "GET /api/data HTTP/1.1", upstream: "http://127.0.0.1:8080"

# 503 - 限流觸發
2026/01/15 1000 [error] 12345#0: *3 limiting connections by zone "addr" while connecting to upstream, client: 192.168.1.102, server: example.com, request: "GET / HTTP/1.1", upstream: "http://backend"

# 503 - 維護模式
2026/01/15 1000 [error] 12345#0: *4 maintenance mode, client: 192.168.1.103, server: example.com, request: "GET / HTTP/1.1"

# 504 - FastCGI 超時
2026/01/15 1000 [error] 12345#0: *5 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 192.168.1.104, server: example.com, request: "GET /slow-api HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "example.com"

# 504 - Proxy 超時
2026/01/15 1000 [error] 12345#0: *6 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 192.168.1.105, server: example.com, request: "GET /heavy-query HTTP/1.1", upstream: "http://127.0.0.1:8080"

6 實戰排障案例

案例一:502 后端服務崩潰

現象:網站間歇性出現 502 錯誤

排查過程

# 1. 檢查 Nginx 錯誤日志
tail -100 /var/log/nginx/error.log | grep 502
# 輸出:
# 2026/01/15 1045 [error] 12345#0: *1 connect() failed (111: Connection refused) while connecting to upstream

# 2. 檢查 PHP-FPM 狀態
systemctl status php-fpm
# 輸出:php-fpm.service - PHP FastCGI Process Manager
#  Active: inactive (dead) since Thu 2026-01-15 1000 CST

# 3. 檢查系統資源(OOM)
dmesg | grep -i"out of memory"
# 輸出:
# [12543.123456] php-fpm[12345]: oom-kill: victim=12345

# 4. 檢查內存使用
free -h
#        total    used    free   shared buff/cache  available
# Mem:     7.6Gi    7.2Gi    128Mi    45Mi    200Mi    80Mi
# Swap:     2.0Gi    1.8Gi    200Mi

# 5. 查看 PHP-FPM 配置
cat /etc/php-fpm.d/www.conf | grep -E"^pm|^max_children|^request_terminate"
# pm.max_children = 50
# request_terminate_timeout = 30

根因:PHP-FPM worker 進程耗盡內存,被 OOM Killer 殺死后服務停止。

解決

# 1. 臨時:啟動 PHP-FPM
sudo systemctl start php-fpm

# 2. 調整 PHP-FPM 配置
# /etc/php-fpm.d/www.conf
[www]
pm = dynamic
pm.max_children = 20   # 減小,避免內存耗盡
pm.start_servers = 3
pm.min_spare_servers = 2
pm.max_spare_servers = 5
pm.max_requests = 200  # 減少每個 worker 處理請求數,防止內存泄漏

# 3. 調整 PHP 內存限制
php_admin_value[memory_limit] = 128M

# 4. 重啟服務
sudo systemctl restart php-fpm
sudo systemctl restart nginx

案例二:504 慢查詢超時

現象:查詢接口頻繁超時,返回 504

排查過程

# 1. 查看 Nginx 錯誤日志
grep 504 /var/log/nginx/error.log | tail -20
# 輸出:
# upstream timed out (110: Connection timed out) while reading response header

# 2. 查看 PHP-FPM 慢日志
cat /var/log/php-fpm/www-slow.log
# [07-Jan-2026 1400] [pool www] pid 12345
# script: /var/www/html/api/report.php
# call:  mysqli_query()
# timeout: 30s

# 3. 進入 MySQL 檢查慢查詢
mysql -u root -p -e"SHOW PROCESSLIST;"
# 輸出:
# | Id | User | db   | Command | Time | State      | Info       |
# | 45 | app | mydb  | Query  | 125 | Sending data   | SELECT * FROM huge_table |

# 4. 查看慢查詢日志配置
mysql -u root -p -e"SHOW VARIABLES LIKE 'slow_query%';"
# slow_query_log = ON
# slow_query_log_file = /var/log/mysql/slow.log

# 5. 查看最近的慢查詢
tail -20 /var/log/mysql/slow.log
# Query_time: 45.234521 Lock_time: 0.000023 Rows_sent: 500000 Rows_examined: 5000000
# SELECT * FROM huge_table WHERE created_at < '2026-01-01';

根因:SQL 查詢沒有索引,全表掃描導致查詢時間過長。

解決

prepare("SELECT * FROM huge_table WHERE created_at < ? ORDER BY id LIMIT ? OFFSET ?");
$stmt->bind_param("sii", $date, $perPage, $offset);
$stmt->execute();
?>
-- 添加索引
ALTERTABLEhuge_tableADDINDEXidx_created_at (created_at);
ALTERTABLEhuge_tableADDINDEXidx_created_at_id (created_at,id);

-- 驗證索引
EXPLAINSELECT*FROMhuge_tableWHEREcreated_at 

案例三:503 限流導致服務不可用

現象:促銷活動期間,大量用戶收到 503 錯誤

排查過程

# 1. 檢查 Nginx 限流配置
grep -r"limit_req"/etc/nginx/
# /etc/nginx/nginx.conf: limit_req_zone $binary_remote_addr zone=one:10m rate=10r/s;

# 2. 查看限流觸發情況
tail -100 /var/log/nginx/error.log | grep"limiting"
# 輸出:
# limiting requests, excess: 15.5 by zone "one"

# 3. 檢查連接數
ss -ant | grep :80 | wc -l
# 輸出:15000

# 4. 查看 PHP-FPM 狀態
curl http://127.0.0.1/status
# pool:         www
# accepted conn:    1000000
# listen queue:     50
# max listen queue:   100
# active processes:   50
# max children reached: 1

# 5. 統計 503 錯誤
grep"503"/var/log/nginx/access.log | wc -l
# 輸出:12345

根因:限流配置過于嚴格,高峰期正常請求被拒絕。

解決

# 調整限流配置
# /etc/nginx/nginx.conf

# 限流配置 - 提高限制
limit_req_zone $binary_remote_addr zone=one:100m rate=100r/s;
limit_req_zone $binary_remote_addr zone=api:50m rate=50r/s;

server {
  listen 80;
  server_name example.com;

  # 普通頁面 - 較高限制
  location / {
    limit_req zone=one burst=200 nodelay;
    proxy_pass http://backend;
  }

  # API 接口 - 較低限制(防止濫用)
  location /api/ {
    limit_req zone=api burst=50 nodelay;
    proxy_pass http://api_backend;
  }

  # 靜態資源 - 幾乎不限流
  location /static/ {
    limit_req zone=one burst=500;
    proxy_pass http://static_backend;
    expires 7d;
    add_header Cache-Control "public";
  }
}

7 監控與告警配置

7.1 監控 5xx 錯誤率

#!/bin/bash
# monitor_5xx.sh - 監控 5xx 錯誤率

LOG_FILE="/var/log/nginx/access.log"
ALERT_THRESHOLD=5 # 5xx 錯誤百分比閾值

# 獲取當前分鐘的錯誤統計
current_minute=$(date +"%d/%b/%Y:%H:%M")
total_requests=$(grep"$current_minute""$LOG_FILE"| wc -l)
error_5xx=$(grep"$current_minute""$LOG_FILE"| awk'$9 ~ /^5[0-9][0-9]$/'| wc -l)

if[$total_requests-gt 0 ];then
  error_rate=$(echo"scale=2;$error_5xx* 100 /$total_requests"| bc)
 echo"總請求:$total_requests"
 echo"5xx 錯誤:$error_5xx"
 echo"錯誤率:${error_rate}%"

 if(( $(echo"$error_rate>$ALERT_THRESHOLD"| bc -l) ));then
   echo" 告警:5xx 錯誤率超過${ALERT_THRESHOLD}%"
   # 發送告警(可接入 Prometheus/Zabbix)
 fi
else
 echo"當前分鐘無請求"
fi

7.2 Prometheus 告警規則

# prometheus_5xx_alerts.yml
groups:
-name:nginx_5xx_alerts
 rules:
  -alert:NginxHigh502ErrorRate
   expr:|
     sum(rate(nginx_http_requests_total{status=~"502"}[5m]))
     / sum(rate(nginx_http_requests_total[5m])) * 100 > 5
   for:2m
   labels:
    severity:critical
   annotations:
    summary:"Nginx 502 錯誤率過高"
    description:"502 錯誤率超過 5%,當前值:{{ $value }}%"

  -alert:NginxHigh503ErrorRate
   expr:|
     sum(rate(nginx_http_requests_total{status=~"503"}[5m]))
     / sum(rate(nginx_http_requests_total[5m])) * 100 > 5
   for:2m
   labels:
    severity:warning
   annotations:
    summary:"Nginx 503 錯誤率過高"
    description:"503 錯誤率超過 5%,當前值:{{ $value }}%"

  -alert:NginxHigh504ErrorRate
   expr:|
     sum(rate(nginx_http_requests_total{status=~"504"}[5m]))
     / sum(rate(nginx_http_requests_total[5m])) * 100 > 5
   for:2m
   labels:
    severity:warning
   annotations:
    summary:"Nginx 504 錯誤率過高"
    description:"504 錯誤率超過 5%,當前值:{{ $value }}%"

7.3 Zabbix 監控模板

# Zabbix Agent 配置
# /etc/zabbix/zabbix_agentd.d/nginx_status.conf

UserParameter=nginx.active_connections,curl -s http://localhost/status | grep'Active connections:'| awk'{print $3}'
UserParameter=nginx.accepts,curl -s http://localhost/status | awk'/^s+[0-9]+ [0-9]+ [0-9]+/ {print $1}'
UserParameter=nginx.handled,curl -s http://localhost/status | awk'/^s+[0-9]+ [0-9]+ [0-9]+/ {print $2}'
UserParameter=nginx.requests,curl -s http://localhost/status | awk'/^s+[0-9]+ [0-9]+ [0-9]+/ {print $3}'
UserParameter=nginx.5xx_rate,grep -c' 502 | 503 | 504 '/var/log/nginx/access.log

8 總結與檢查清單

三種錯誤對比總結

502 Bad Gateway:
  問題:后端無法連接
  原因:后端服務未啟動、端口錯誤、后端崩潰
  排查:檢查后端服務、檢查端口、檢查日志

503 Service Unavailable:
  問題:后端拒絕服務
  原因:限流、過載、維護模式、worker 耗盡
  排查:檢查限流配置、檢查后端負載、檢查維護開關

504 Gateway Timeout:
  問題:后端響應超時
  原因:處理時間過長、慢查詢、接口耗時
  排查:檢查后端日志、檢查慢查詢、優化代碼

排查檢查清單

#!/bin/bash
# comprehensive_5xx_check.sh - 5xx 錯誤綜合排查

echo"============================================"
echo"   502/503/504 錯誤綜合排查"
echo"============================================"

# Nginx 服務
echo""
echo"[1] Nginx 服務狀態"
systemctl is-active nginx &&echo"? 運行中"||echo"? 未運行"
ss -tlnp | grep :80 | head -3

# 后端服務
echo""
echo"[2] 后端服務狀態"
forserviceinphp-fpm php80-php-fpm php74-php-fpm node java python;do
 ifsystemctl list-units --type=service | grep -q"$service";then
    systemctl is-active"$service"&&echo"?$service運行中"||echo"$service未運行"
 fi
done

# 端口監聽
echo""
echo"[3] 關鍵端口監聽"
ss -tlnp | grep -E":80|:443|:8080|:9000|:9001"| head -10

# 近 5 分鐘 5xx 統計
echo""
echo"[4] 近 5 分鐘 5xx 錯誤統計"
current_time=$(date +"%d/%b/%Y:%H:%M")
grep"$current_time"/var/log/nginx/access.log 2>/dev/null | awk'$9 ~ /^5[0-9][0-9]$/ {print $9}'| sort | uniq -c

# Nginx 錯誤日志
echo""
echo"[5] Nginx 錯誤日志(最近 20 條)"
tail -20 /var/log/nginx/error.log 2>/dev/null

# PHP-FPM 狀態
echo""
echo"[6] PHP-FPM 狀態(如果有)"
curl -s http://127.0.0.1/status 2>/dev/null ||echo"PHP-FPM status 頁面未配置"

# 連接數
echo""
echo"[7] 當前連接數"
ss -ant | wc -l

echo""
echo"============================================"

快速響應流程

收到 5xx 告警
  │
  ├── 立即檢查
  │  ├── Nginx 是否運行
  │  ├── 后端服務是否運行
  │  └── 端口是否監聽
  │
  ├── 查看日志
  │  ├── Nginx error.log
  │  ├── 后端服務日志
  │  └── PHP-FPM 慢日志(如有)
  │
  ├── 臨時處置
  │  ├── 重啟后端服務
  │  ├── 調整超時配置
  │  └── 臨時關閉限流
  │
  └── 根因分析
    ├── 分析錯誤日志
    ├── 檢查慢查詢
    ├── 優化配置或代碼
    └── 完善監控告警

常用命令速查

# 查看 502 錯誤日志
grep 502 /var/log/nginx/error.log

# 查看 503/504 錯誤日志
grep -E"503|504"/var/log/nginx/error.log

# 統計 5xx 錯誤
awk'$9 ~ /^5[0-9][0-9]$/'/var/log/nginx/access.log | wc -l

# 檢查后端服務
systemctl status php-fpm
ps aux | grep php-fpm

# 檢查端口
ss -tlnp | grep :9000

# 測試后端連接
nc -zv 127.0.0.1 9000
telnet 127.0.0.1 9000

# PHP-FPM 狀態
curl http://127.0.0.1/status

# 查看慢日志
tail -50 /var/log/php-fpm/www-slow.log

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    14

    文章

    10328

    瀏覽量

    91688
  • HTTP協議
    +關注

    關注

    0

    文章

    68

    瀏覽量

    10682

原文標題:網站 502、503、504 的區別是什么?運維別再混著說了

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    [轉]生產環境常見的HTTP狀態列表

    (切換協議) 請求者已要求服務器切換協議,服務器已確認并準備切換。2xx (成功)表示成功處理了請求的狀態代碼。代碼 說明http狀態
    發表于 09-25 18:29

    三種跨時鐘域處理的方法

    三種方法跨時鐘域處理方法如下:  1. 打兩拍;  2. 異步雙口RAM;  3. 格雷轉換?! ?b class='flag-5'>方法一:打兩拍  大家很清楚,處理跨時鐘域的數據有單bit和多bit之分,而打兩拍
    發表于 01-08 16:55

    進程類型及三種狀態

    進程類型進程的三種狀態
    發表于 04-02 07:06

    LwIP協議棧開發嵌入式網絡的三種方法有何關系

    LwIP協議棧開發嵌入式網絡的三種方法分析 輕量級的TCP/IP協議棧LwIP,提供了三種應用程序設計方法,且很容易被移植到多任務的操作系統
    發表于 08-05 07:55

    功放管的三種工作狀態

    功放管的三種工作狀態低頻功率輸出級按功放管的工作狀態為甲類、乙類、丙類三種。它們
    發表于 04-17 23:21 ?4009次閱讀

    功放極管的三種工作狀態工作狀態

    功放極管的三種工作狀態工作狀態 低頻功率輸出級按功放管的工作狀態為甲類、乙類、丙類三種
    發表于 09-17 08:29 ?1.5w次閱讀
    功放<b class='flag-5'>三</b>極管的<b class='flag-5'>三種</b>工作<b class='flag-5'>狀態</b>工作<b class='flag-5'>狀態</b>

    功放管的三種工作狀態

    功放管的三種工作狀態 低頻功率輸出級按功放管的工作狀態為甲類、乙類、丙類三種。 它們各有特點:
    發表于 12-02 11:05 ?2753次閱讀

    電路的三種工作狀態分別是什么

    在學電子電路中,要學會分析電路,就從了解電路的三種狀態開始。電路有哪三種狀態:通路(負載)、短路、開路(空載)三種
    的頭像 發表于 09-13 09:54 ?10.3w次閱讀

    Allegro網絡的MAC、DHCP 和 HTTP三種協議解析

    Allegro 網絡萬用表連接在設備和服務器基礎設施之間,以查找網絡設備的 IP 地址。使用 MAC、DHCP 和 HTTP三種協議。
    發表于 10-17 14:57 ?1266次閱讀

    HTTP狀態你知道幾個

    紅框中的200就是HTTP狀態,它用來標記一個http請求的狀態。客戶端發送請求到服務端,然后服務端會回應結果給客戶端,回應的數據會包含一
    的頭像 發表于 02-16 09:33 ?1199次閱讀

    繼電保護的三種狀態解析

    繼電保護的三種狀態解析? 繼電保護系統是電力系統中非常重要的一個組成部分,其具有三種狀態,包括:正常狀態、故障
    的頭像 發表于 09-27 16:00 ?4670次閱讀

    如何理解HTTP協議是無狀態

    主要解決網絡路由和尋址問題,TCP 協議主要解決如何在 IP 層之上可靠的傳遞數據包,使在網絡上的另一端收到發端發出的所有包,并且順序與發出順序一致。TCP 有可靠,面向連接的特點。 2、如何理解HTTP協議是無
    的頭像 發表于 11-11 15:46 ?4172次閱讀
    如何理解<b class='flag-5'>HTTP</b><b class='flag-5'>協議</b>是無<b class='flag-5'>狀態</b>的

    示波器的三種觸發模式

    示波器的觸發模式有自動模式(Auto)、正常模式(Norm)和單次模式(Single)三種。在測不同信號時,采用不同的觸發模式,才能準確測量到所需要的波形。下面以我司靜電發生器TEH-10030
    的頭像 發表于 01-18 08:12 ?4518次閱讀
    示波器的<b class='flag-5'>三種</b><b class='flag-5'>觸發</b>模式

    mosfet的三種工作狀態及工作條件是什么

    的工作狀態及工作條件對于理解和設計相關電路至關重要。以下是MOSFET的三種主要工作狀態及其工作條件的介紹。 一、MOSFET的三種工作狀態
    的頭像 發表于 10-06 16:51 ?1.1w次閱讀

    示波器的三種觸發模式

    示波器的觸發方式不僅影響波形捕捉的時機,還決定了顯示的波形是否穩定。 常見的觸發模式有三種: 單次觸發 (Single)、 正常觸發 (No
    的頭像 發表于 01-07 11:04 ?1.6w次閱讀
    示波器的<b class='flag-5'>三種</b><b class='flag-5'>觸發</b>模式