Nginx常见问题排查与性能调优实战指南

错误排查与日志分析

错误排查三板斧

配置语法检查
每次修改配置后务必执行：

nginx -t

输出示例：

nginx: the configuration file /etc/nginx/nginx.conf syntax is ok
nginx: configuration file /etc/nginx/nginx.conf test is successful

日志级别调整
在nginx.conf中设置debug级别日志：
```
error_log /var/log/nginx/error.log debug;
```
常见日志级别：debug | info | notice | warn | error | crit
实时日志监控
```
tail -f /var/log/nginx/error.log
```

实践建议：生产环境建议使用warn级别，调试时临时改为debug，避免日志量过大。

性能瓶颈定位

关键监控工具

strace跟踪系统调用

strace -p $(pgrep -f "nginx: worker") -T -tt -o nginx.strace

启用stub_status模块
配置示例：

server {
    location /nginx_status {
        stub_status on;
        allow 127.0.0.1;
        deny all;
    }
}

访问输出：

Active connections: 291 
server accepts handled requests
 16630948 16630948 31070465 
Reading: 6 Writing: 179 Waiting: 106

top命令分析

top -p $(pgrep -f "nginx: worker" | paste -sd ",")

性能指标参考值：

单个worker进程CPU持续>70% → 需增加worker_processes
Waiting连接数持续>worker_connections的50% → 需调整连接参数

热重载与无缝升级

平滑重启流程

配置热重载
```
nginx -s reload
```

二进制升级步骤：

# 备份旧版本
cp /usr/sbin/nginx /usr/sbin/nginx.bak

# 替换新版本
cp nginx-new /usr/sbin/nginx

# 发送USR2信号触发升级
kill -USR2 $(cat /run/nginx.pid)

# 优雅关闭旧进程
kill -QUIT $(cat /run/nginx.pid.oldbin)

升级检查清单：

验证新版本nginx -V参数兼容性
提前测试新版本核心模块
确保配置备份完整

典型问题解决方案

案例1：502 Bad Gateway

排查步骤：

检查后端服务是否存活
查看error_log是否有connect() failed错误
验证proxy_pass地址是否可达
检查防火墙规则

配置修复示例：

location /api {
    proxy_pass http://backend;
    proxy_next_upstream error timeout invalid_header;
    proxy_connect_timeout 2s;  # 增加连接超时
}

案例2：内存泄漏排查

安装debug符号包：
```
yum install nginx-debuginfo
```

使用gdb分析：

gdb -p $(pgrep -f "nginx: worker")
(gdb) dump memory /tmp/nginx.dump 0x00000000 0xFFFFFFFF

最佳实践建议

日志轮转配置（logrotate示例）：

/var/log/nginx/*.log {
    daily
    rotate 30
    missingok
    compress
    delaycompress
    notifempty
    sharedscripts
    postrotate
        /bin/kill -USR1 $(cat /run/nginx.pid 2>/dev/null) 2>/dev/null || true
    endscript
}

性能调优参数：

events {
    worker_connections 2048;
    multi_accept on;
    use epoll;
}

http {
    keepalive_timeout 30s;
    keepalive_requests 100;
    sendfile on;
    tcp_nopush on;
}

应急回滚方案：

# 快速回退配置
cp /etc/nginx/nginx.conf.bak /etc/nginx/nginx.conf && nginx -s reload

# 二进制回退
mv /usr/sbin/nginx.bak /usr/sbin/nginx && kill -HUP $(cat /run/nginx.pid)

通过系统化的排查方法和工具链组合，可以快速定位Nginx各类异常问题。建议建立完整的监控体系（如Prometheus+Grafana）实现事前预警。

Nginx问题排查与性能调优实战指南