如何快速定位高 CPU 使用率的进程

当服务器出现 高 CPU 使用率 时,快速定位问题进程是解决问题的第一步。以下是从基础到高级的排查方法,帮助快速定位高 CPU 使用率的进程。


1. 使用基础命令定位高 CPU 使用率的进程

1.1 使用 top 命令

top 是一个实时监控工具,用于查看系统资源使用情况,尤其是 CPU 和内存。

  1. 运行 top:
  2. bash
  3. top
  4. 观察输出,按 CPU 使用率排序
  5. 默认情况下,top 按 CPU 使用率排序。
  6. 如果未排序,可以按下键盘上的 P,按 CPU 使用率降序排列。
  7. 重点关注以下字段:
  8. PID:进程 ID。
  9. USER:运行该进程的用户。
  10. %CPU:进程占用的 CPU 百分比。
  11. COMMAND:进程名称。
  12. 示例输出:
  13. basic
  14. PID USER %CPU %MEM TIME+ COMMAND 1234 www-data 90.3 2.5 00:05:12 php-fpm 5678 mysql 45.1 3.0 00:02:34 mysqld
  15. 退出 top:按 q 键。

1.2 使用 htop(交互式工具)

htop 是 top 的增强版,提供更友好的界面和交互功能。

  1. 安装 htop(如果未安装):
  2. bash
  3. sudo apt install htop # Ubuntu/Debian sudo yum install htop # CentOS/RHEL
  4. 运行 htop:
  5. bash
  6. htop
  7. 排序:
  8. F6 键选择排序条件,选择 CPU%
  9. 观察高 CPU 使用率的进程:
  10. 找到占用 CPU 最高的进程及其 PIDCOMMAND

1.3 使用 ps 命令

ps 命令用于列出当前运行的进程,并可以按 CPU 使用率排序。

  1. 查看占用 CPU 最高的 10 个进程:
  2. bash
  3. ps aux --sort=-%cpu | head -n 10
  4. 输出示例:
  5. apache
  6. USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND www-data 1234 90.3 2.5 123456 12345 ? S 10:00 5:12 php-fpm mysql 5678 45.1 3.0 234567 23456 ? S 10:02 2:34 mysqld
  7. 重点关注:
  8. %CPU:CPU 使用率。
  9. PID:进程 ID。
  10. COMMAND:进程名称。

2. 分析高 CPU 使用率的进程

2.1 查看进程的详细信息

2.1.1 使用 pidstat 命令

pidstat 提供每个进程的 CPU 使用率。

  1. 安装 pidstat(如果未安装):
  2. bash
  3. sudo apt install sysstat # Ubuntu/Debian sudo yum install sysstat # CentOS/RHEL
  4. 查看进程的 CPU 使用情况:
  5. bash
  6. pidstat -u -p <PID> 1
  7. 替换 <PID> 为高 CPU 使用率的进程 ID。
  8. 每秒更新一次 CPU 使用率。

2.1.2 查看进程的线程(子任务)

  1. 使用 top 查看线程:
  2. 运行 top,按 H 键切换到线程视图。
  3. 查看哪个线程占用最多的 CPU。
  4. 使用 ps 查看线程:
  5. bash
  6. ps -Lp <PID>
  7. 列出进程的所有线程及其 CPU 使用率。

2.2 分析进程的行为

  1. 使用 strace 跟踪系统调用:
  2. bash
  3. strace -p <PID>
  4. 输出进程的系统调用信息。
  5. 如果某些系统调用频率异常高,可能是问题根源。
  6. 使用 lsof 查看进程打开的文件:
  7. bash
  8. lsof -p <PID>
  9. 确定进程正在访问的文件或网络资源。
  10. 使用 perf 分析性能瓶颈:
  11. bash
  12. sudo perf top
  13. 查看哪个函数或模块消耗了最多的 CPU。

3. 常见高 CPU 使用率原因及解决方法

3.1 应用程序问题

表现:

  • Web 服务(如 php-fpm、nginx)或数据库进程(如 mysqld)占用大量 CPU。

解决方法:

  1. 优化应用程序代码: 检查慢查询(数据库)或高负载的请求(Web 服务器)。 使用 APM 工具(如 New Relic、Skywalking)分析性能瓶颈。
  2. 限制并发请求: 调整 Web 服务器或数据库的最大连接数。

3.2 死循环或进程异常

表现:

  • 某个进程持续消耗 100% 的 CPU。

解决方法:

  1. 杀死异常进程:
  2. bash
  3. sudo kill -9 <PID>
  4. 分析问题根源:
  5. 查看应用日志以确定原因。

3.3 系统任务导致 CPU 高使用

表现:

  • 系统进程(如 kworker)占用 CPU。

解决方法:

  1. 检查内核任务:
  2. bash
  3. sudo dmesg
  4. 确定是否有硬件问题(如磁盘或网卡故障)。
  5. 调整系统调度:
  6. 优化 I/O 调度器或硬件配置。

3.4 网络或 I/O 密集型任务

表现:

  • 数据传输任务(如 rsync、scp)导致 CPU 高使用。

解决方法:

  1. 限制任务带宽:
  2. bash
  3. rsync --bwlimit=1000 source target
  4. 优化 I/O 调度:
  5. bash
  6. sudo ionice -c 3 -p <PID>

3.5 JVM 或其他虚拟机问题

表现:

  • Java 进程(如 java 或 tomcat)占用大量 CPU。

解决方法:

  1. 使用 jstack 分析线程堆栈:
  2. bash
  3. jstack <PID>
  4. 调整 JVM 参数:
  5. 增加堆内存或调整垃圾回收策略。

4. 持续优化和监控

4.1 设置警报

  • 使用监控工具(如 Zabbix、Nagios、Prometheus)设置 CPU 使用率警报。

4.2 定期优化

  • 定期检查高负载进程,优化代码和配置。

4.3 使用负载均衡

  • 如果服务器长期高负载,考虑增加更多服务器并进行负载均衡。

5. 总结

通过以下步骤,可以快速定位高 CPU 使用率的进程并解决问题:

  1. 使用 top 或 htop 快速定位高 CPU 使用率的进程。
  2. 使用 ps 或 pidstat 查看详细信息。
  3. 使用 strace 或 perf 深入分析进程行为。
  4. 根据具体原因优化应用、调整系统配置或扩展硬件资源。

持续监控和优化可以有效避免高 CPU 使用率问题的再次发生。

相关文章

cython如何调用C语言的函数?_c 中如何调用python

在 Cython 中调用 C 语言函数主要通过以下几种方式实现:1. 使用 cdef extern 声明外部 C 函数基本语法cdef extern from "头文件.h":返回类型...

C/C++函数调用的奥秘_c++函数调用原理

在C/C++编程的世界里,函数调用是程序运行的核心机制之一。然而,许多程序员在日常开发中,往往只关注代码的逻辑,而忽略了函数调用背后的底层细节。今天,就让我们一起深入探索C/C++函数调用的全过程,从...

C++成员函数如何工作?this指针、name mangling 成员函数指针解析

0.引言 在C++面向对象编程中,成员函数是对象行为的核心载体。我们每天都在使用成员函数,但却很少深入思考其底层的实现机制:为什么成员函数可以直接访问成员变量?编译器如何区分不同类的同名函数?静态成员...

C语言入门:学生成绩管理程序的完善(1):用文件保存数据

这是C语言入门的第27篇文章。今天讲学生成绩管理程序的完善:怎样利用文件来保存数据。还是昨天的问题:我怎么知道一个文件的内容是什么?我怎么知道比如一行有多少个数,多少个数以后是换行?这是因为文件是我们...

C语言应用笔记:常用的printf打印输出不同类型数据

我叫程序员阿虾, 在终端前摸过太多凌晨, 熟悉printf这一行字带来的安心与危险。今天想跟你聊聊我踩过的坑, 和一些别人不常说的细节, 用第一人称把经验交给你, 有点唠叨, 希望你少走弯路。为什么要...

C语言应用笔记:简单的最大最小值比较

使用宏定义实现泛型比较函数,用于求取两个值的最大值和最小值。核心宏定义解析#define MAX(x, y) ((x) > (y) ? (x) : (y)) // 返回两个值中较大的一个 #de...