linux僵尸进程产生的原因以及如何避免产生僵尸进程

linux僵尸进程产生的原因以及如何避免产生僵尸进程给进程设置僵尸状态的目的是维护子进程的信息 以便父进程在以后某个时间获取 这些信息包括子进程的进程 ID 终止状态以及资源利用信息 CPU 时间 内存使用量等等 如果一个进程终止 而该进程有子进程处于僵尸状态 那么它的所有僵尸子进程的父进程 ID 将被重置为 1 init 进程 继承这些子进程的 init 进程将清理它们 init 进程将 wait 它们 从而去除僵尸状态 nbsp nbsp nbsp nbsp nbsp nbsp nbsp 但通常情况下 我们是

给进程设置僵尸状态的目的是维护子进程的信息,以便父进程在以后某个时间获取。这些信息包括子进程的进程ID、终止状态以及资源利用信息(CPU时间,内存使用量等等)。如果一个进程终止,而该进程有子进程处于僵尸状态,那么它的所有僵尸子进程的父进程ID将被重置为1(init进程)。继承这些子进程的init进程将清理它们(init进程将wait它们,从而去除僵尸状态)。

        但通常情况下,我们是不愿意留存僵尸进程的,它们占用内核中的空间,最终可能导致我们耗尽进程资源。那么为什么会产生僵尸进程以及如何避免产生僵尸进程呢?下边我将从这两个方面进行分析。

    僵尸进程的原因

        我们知道,要在当前进程中生成一个子进程,一般需要调用fork这个系统调用,fork这个函数的特别之处在于一次调用,两次返回,一次返回到父进程中,一次返回到子进程中,我们可以通过返回值来判断其返回点:

复制代码

pid_t child = fork(); if( child < 0 ) { //fork error. perror("fork process fail.\n"); } else if( child ==0 ) { // in child process printf(" fork succ, this run in child process\n "); } else { // in parent process printf(" this run in parent process\n "); }

复制代码

        如果子进程先于父进程退出, 同时父进程又没有调用wait/waitpid,则该子进程将成为僵尸进程。通过ps命令,我们可以看到该进程的状态为Z(表示僵死),如图1所示:

        ddd1

                                                   (图1)

    备注: 有些unix系统在ps命令输出的COMMAND栏以

指明僵尸进程。

        代码如下:

复制代码

if( child == -1 ) { //error perror("\nfork child error."); exit(0); } else if(child == 0){ cout << "\nIm in child process:" << getpid() << endl; exit(0); } else { cout << "\nIm in parent process." << endl; sleep(600); }

复制代码

        让父进程休眠600s, 然后子进程先退出,我们就可以看到先退出的子进程成为僵尸进程了(进程状态为Z)

   避免产生僵尸进程

        我们知道了僵尸进程产生的原因,下边我们看看如何避免产生僵尸进程。

        一般,为了防止产生僵尸进程,在fork子进程之后我们都要wait它们;同时,当子进程退出的时候,内核都会给父进程一个SIGCHLD信号,所以我们可以建立一个捕获SIGCHLD信号的信号处理函数,在函数体中调用wait(或waitpid),就可以清理退出的子进程以达到防止僵尸进程的目的。如下代码所示:

复制代码

void sig_chld( int signo ) { pid_t pid; int stat; pid = wait(&stat); printf( "child %d exit\n", pid ); return; } int main() { signal(SIGCHLD, &sig_chld); }

复制代码

        现在main函数中给SIGCHLD信号注册一个信号处理函数(sig_chld),然后在子进程退出的时候,内核递交一个SIGCHLD的时候就会被主进程捕获而进入信号处理函数sig_chld,然后再在sig_chld中调用wait,就可以清理退出的子进程。这样退出的子进程就不会成为僵尸进程。

        然后,即便我们捕获SIGCHLD信号并且调用wait来清理退出的进程,仍然不能彻底避免产生僵尸进程;我们来看一种特殊的情况:

        我们假设有一个client/server的程序,对于每一个连接过来的client,server都启动一个新的进程去处理来自这个client的请求。然后我们有一个client进程,在这个进程内,发起了多个到server的请求(假设5个),则server会fork 5个子进程来读取client输入并处理(同时,当客户端关闭套接字的时候,每个子进程都退出);当我们终止这个client进程的时候 ,内核将自动关闭所有由这个client进程打开的套接字,那么由这个client进程发起的5个连接基本在同一时刻终止。这就引发了5个FIN,每个连接一个。server端接受到这5个FIN的时候,5个子进程基本在同一时刻终止。这就又导致差不多在同一时刻递交5个SIGCHLD信号给父进程,如图2所示:

        tcp1111

                           (图2)

        正是这种同一信号多个实例的递交造成了我们即将查看的问题。

        我们首先运行服务器程序,然后运行客户端程序,运用ps命令看以看到服务器fork了5个子进程,如图3:

        t1

                                   (图3)

        然后我们Ctrl+C终止客户端进程,在我机器上边测试,可以看到信号处理函数运行了3次,还剩下2个僵尸进程,如图4:

        t2

                                  (图4)

       通过上边这个实验我们可以看出,建立信号处理函数并在其中调用wait并不足以防止出现僵尸进程,其原因在于:所有5个信号都在信号处理函数执行之前产生,而信号处理函数只执行一次,因为Unix信号一般是不排队的(我的这篇博客中有提到http://www.cnblogs.com/yuxingfirst/p/3160697.html)。 更为严重的是,本问题是不确定的,依赖于客户FIN到达服务器主机的时机,信号处理函数执行的次数并不确定。

       正确的解决办法是调用waitpid而不是wait,这个办法的方法为:信号处理函数中,在一个循环内调用waitpid,以获取所有已终止子进程的状态。我们必须指定WNOHANG选项,他告知waitpid在有尚未终止的子进程在运行时不要阻塞。(我们不能在循环内调用wait,因为没有办法防止wait在尚有未终止的子进程在运行时阻塞,wait将会阻塞到现有的子进程中第一个终止为止),下边的程序分别给出了这两种处理办法(func_wait, func_waitpid)。

复制代码

//server.c #include 
 
   #include 
  
    #include 
   
     #include 
    
      #include 
     
       #include 
      
        #include 
       
         #include 
        
          #include 
         
           #include 
          
            #include 
           
             #include 
            
              typedef void sigfunc(int); void func_wait(int signo) { pid_t pid; int stat; pid = wait(&stat); printf( "child %d exit\n", pid ); return; } void func_waitpid(int signo) { pid_t pid; int stat; while( (pid = waitpid(-1, &stat, WNOHANG)) > 0 ) { printf( "child %d exit\n", pid ); } return; } sigfunc* signal( int signo, sigfunc *func ) { struct sigaction act, oact; act.sa_handler = func; sigemptyset(&act.sa_mask); act.sa_flags = 0; if ( signo == SIGALRM ) { #ifdef SA_INTERRUPT act.sa_flags |= SA_INTERRUPT; /* SunOS 4.x */ #endif } else { #ifdef SA_RESTART act.sa_flags |= SA_RESTART; /* SVR4, 4.4BSD */ #endif } if ( sigaction(signo, &act, &oact) < 0 ) { return SIG_ERR; } return oact.sa_handler; } void str_echo( int cfd ) { ssize_t n; char buf[1024]; again: memset(buf, 0, sizeof(buf)); while( (n = read(cfd, buf, 1024)) > 0 ) { write(cfd, buf, n); } if( n <0 && errno == EINTR ) { goto again; } else { printf("str_echo: read error\n"); } } int main() { signal(SIGCHLD, &func_waitpid); int s, c; pid_t child; if( (s = socket(AF_INET, SOCK_STREAM, 0)) < 0 ) { int e = errno; perror("create socket fail.\n"); exit(0); } struct sockaddr_in server_addr, child_addr; bzero(&server_addr, sizeof(server_addr)); server_addr.sin_family = AF_INET; server_addr.sin_port = htons(9998); server_addr.sin_addr.s_addr = htonl(INADDR_ANY); if( bind(s, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0 ) { int e = errno; perror("bind address fail.\n"); exit(0); } if( listen(s, 1024) < 0 ) { int e = errno; perror("listen fail.\n"); exit(0); } while(1) { socklen_t chilen = sizeof(child_addr); if ( (c = accept(s, (struct sockaddr *)&child_addr, &chilen)) < 0 ) { perror("listen fail."); exit(0); } if( (child = fork()) == 0 ) { close(s); str_echo(c); exit(0); } close(c); } } //client.c #include 
             
               #include 
              
                #include 
               
                 #include 
                
                  #include 
                 
                   #include 
                  
                    #include 
                   
                     #include 
                    
                      #include 
                     
                       #include 
                      
                        #include 
                       
                         void str_cli(FILE *fp, int sfd ) { char sendline[1024], recvline[2014]; memset(recvline, 0, sizeof(sendline)); memset(sendline, 0, sizeof(recvline)); while( fgets(sendline, 1024, fp) != NULL ) { write(sfd, sendline, strlen(sendline)); if( read(sfd, recvline, 1024) == 0 ) { printf("server term prematurely.\n"); } fputs(recvline, stdout); memset(recvline, 0, sizeof(sendline)); memset(sendline, 0, sizeof(recvline)); } } int main() { int s[5]; for (int i=0; i<5; i++) { if( (s[i] = socket(AF_INET, SOCK_STREAM, 0)) < 0 ) { int e = errno; perror("create socket fail.\n"); exit(0); } } for (int i=0; i<5; i++) { struct sockaddr_in server_addr, child_addr; bzero(&server_addr, sizeof(server_addr)); server_addr.sin_family = AF_INET; server_addr.sin_port = htons(9998); inet_pton(AF_INET, "127.0.0.1", &server_addr.sin_addr); if( connect(s[i], (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0 ) { perror("connect fail."); exit(0); } } sleep(10); str_cli(stdin, s[0]); exit(0); } 
                        
                       
                      
                     
                    
                   
                  
                 
                
               
              
             
            
           
          
         
        
       
      
     
    
   
 
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/225058.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 上午10:13
下一篇 2026年3月17日 上午10:13


相关推荐

  • vue eslint报错_如何关闭eslint

    vue eslint报错_如何关闭eslintvue.config.js中module.exports={lintOnSave:false}或者只在开发环境中开启eslint自检lintOnSave:process.env.NODE_ENV!==”production”,

    2022年10月8日
    3
  • POC测试是什么

    POC测试是什么POC 测试 即 ProofofConce 可以理解为 根据客户需求进行测试是业界流行的针对客户具体应用的验证性测试 根据用户对采用系统提出的性能要求和扩展需求的指标 在选用服务器上进行真实数据的运行 对承载用户数据量和运行时间进行实际测算 并根据用户未来业务扩展的需求加大数据量以验证系统和平台的承载能力和性能变化

    2026年3月20日
    2
  • latex文字加粗、斜体

    latex文字加粗、斜体显示直立文本 textup 文本 意大利斜体 textit 文本 slanted 斜体 textsl 文本 显示小体大写文本 textsc 文本 中等权重 textmd 文本 加粗命令 textbf 文本 默认值 textnormal 文本 斜体字 textit italic 或者 emph italic 细体字 textlf lightf

    2025年10月23日
    6
  • 数据库系统原理——ER图转化成关系模式

    数据库系统原理——ER图转化成关系模式目录 E R 图转换 实体集向关系模式的转换 两个实体型之间的联系集向关系模式的转换 同一实体型之间的联系集向关系模式的转换 多实体型之间的联系向关系模式的转换 弱实体集向关系模式的转换 应用实例 E R 图转换 E R 图是由实体 实体的属性和实体之间的联系三个要素组成的 将 E R 图转换为关系模型实际上就是要将实体 实体的属性和实体之间的联系转化为关系模式 实体集向关系模式的转换一般转换遵循的原则实体集的转换规则 一个实体型转换为一个关系模式 实体的属性就是关系

    2026年3月17日
    2
  • vue 虚拟主机_虚拟主机数据库怎么导入怎么样-vue部署到阿里云虚拟主机测评

    vue 虚拟主机_虚拟主机数据库怎么导入怎么样-vue部署到阿里云虚拟主机测评腾讯云 点击进入高性能云服务器 1 核 2G 首年 99 元 华为云 点击进入 2 核 4G5M 企业级云主机 707 元 年香港免备案主机 129 年 阿里云 点击进入云服务器低至 0 95 折 1 核 2GECS 云服务器 8 1 元 月低车哪谌莅 韵氯 鑫募 允菊 埃 诵小 p gt 文件 1 文件 2 文件 3 1 引言一个小的命令行工具被配置为向网络发送主机 因特网控制消息协议 回波请求 类似于平 但性能高得多当

    2026年3月18日
    3
  • n8n + MCP 入门设置教程

    n8n + MCP 入门设置教程

    2026年3月15日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号