【面试普通人VS高手系列】CPU飙高系统反应慢怎么排查?

面试过程中,场景类的问题更容易检测出一个开发人员的基本能力。
这不,一个小伙伴去阿里面试,第一面就遇到了关于“CPU飙高系统反应慢怎么排查”的问题?
对于这个问题,我们来看看普通人和高手的回答!

普通人:

嗯, CPU飙高的原因可能是线程创建过多导致的。

高手:
好的,关于这个问题,我从四个方面来回答。

  1. CPU是整个电脑的核心计算资源,对于一个应用进程来说,CPU的最小执行单元是线程。

  2. 导致CPU飙高的原因有几个方面

    1. CPU上下文切换过多,对于CPU来说,同一时刻下每个CPU核心只能运行一个线程,如果有多个线程要执行,CPU只能通过上下文切换的方式来执行不同的线程。上下文切换需要做两个事情

      1. 保存运行线程的执行状态
      2. 让处于等待中的线程执行

      这两个过程需要CPU执行内核相关指令实现状态保存,如果较多的上下文切换会占据大量CPU资源,从而使得cpu无法去执行用户进程中的指令,导致响应速度下降。

      在Java中,文件IO、网络IO、锁等待、线程阻塞等操作都会造成线程阻塞从而触发上下文切换

    2. CPU资源过度消耗,也就是在程序中创建了大量的线程,或者有线程一直占用CPU资源无法被释放,比如死循环!

    CPU利用率过高之后,导致应用中的线程无法获得CPU的调度,从而影响程序的执行效率!

  3. 既然是这两个问题导致的CPU利用率较高,于是我们可以通过top命令,找到CPU利用率较高的进程,在通过Shift+H找到进程中CPU消耗过高的线程,这里有两种情况。

    1. CPU利用率过高的线程一直是同一个,说明程序中存在线程长期占用CPU没有释放的情况,这种情况直接通过jstack获得线程的Dump日志,定位到线程日志后就可以找到问题的代码。
    2. CPU利用率过高的线程id不断变化,说明线程创建过多,需要挑选几个线程id,通过jstack去线程dump日志中排查。
  4. 最后有可能定位的结果是程序正常,只是在CPU飙高的那一刻,用户访问量较大,导致系统资源不够。

以上就是我对这个问题的理解!

总结:

从这个问题来看,面试官主要考察实操能力,以及解决问题的思路。

如果你没有实操过,但是你知道导致CPU飙高这个现象的原因,并说出你的解决思路,通过面试是没问题的。

如果你在面试的时候遇到了一些比较刁钻也奇葩的问题,欢迎私信或在评论区给我留言。

我是Mic,一个工作了14年的Java程序员,咱们下篇文章再见。

 4 total views,  1 views today

页面下部广告