Ptrace 详解

Ptrace 详解Ptrace 详解引子 1 在 Linux 系统中 进程状态除了我们所熟知的 TASK RUNNING TASK INTERRUPTIBL TASK STOPPED 等 还有一个 TASK TRACED 这表明这个进程处于什么状态 2 strace 可以方便的帮助我们记录进程所执行的系统调用 它是如何跟踪到进程执行的 3 gdb 是我们调试程序的利器 可以设置断点 单步跟踪程序 它的实现原理又是什么

1.在 Linux系统中,进程状态除了我们所熟知的 TASK_RUNNINGTASK_INTERRUPTIBLETASK_STOPPED等,还有一个TASK_TRACED。这表明这个进程处于什么状态?
2.strace可以方便的帮助我们记录进程所执行的系统调用,它是如何跟踪到进程执行的?
3.gdb是我们调试程序的利器,可以设置断点,单步跟踪程序。它的实现原理又是什么?




所有这一切的背后都隐藏着Linux所提供的一个强大的系统调用ptrace().

1.ptrace系统调用

ptrace系统调从名字上看是用于进程跟踪的,它提供了父进程可以观察和控制其子进程执行的能力,并允许父进程检查和替换子进程的内核镜像(包括寄存器)的值。
其基本原理是: 当使用了ptrace跟踪后,所有发送给被跟踪的子进程的信号(除了SIGKILL),都会被转发给父进程,而子进程则会被阻塞,这时子进程的状态就会被系统标注为TASK_TRACED
而父进程收到信号后,就可以对停止下来的子进程进行检查和修改,然后让子进程继续运行。
其原型为:






 #include 
  
    long ptrace(enum __ptrace_request request, pid_t pid, void *addr, void *data); 
  

ptrace有四个参数:

 1). enum __ptrace_request request:指示了ptrace要执行的命令。 2). pid_t pid: 指示ptrace要跟踪的进程。 3). void *addr: 指示要监控的内存地址。 4). void *data: 存放读取出的或者要写入的数据。 

ptrace是如此的强大,以至于有很多大家所常用的工具都基于ptrace来实现,如stracegdb
接下来,我们借由对stracegdb的实现,来看看ptrace是如何使用的。

2 strace的实现

strace常常被用来拦截和记录进程所执行的系统调用,以及进程所收到的信号。如有这么一段程序:

HelloWorld.c: #include 
  
    int main(){ printf("Hello World!/n"); return 0; } 
  

编译后,用strace跟踪: strace ./HelloWorld
可以看到形如:

execve("./HelloWorld", ["./HelloWorld"], [/* 67 vars */]) = 0 brk(0) = 0x804a000 mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7f18000 access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory) open("/home/supperman/WorkSpace/lib/tls/i686/sse2/libc.so.6", O_RDONLY) = -1 ENOENT (No such file or directory) ... 

的一段输出,这就是在执行HelloWorld中,系统所执行的系统调用,以及他们的返回值。

下面我们用ptrace来研究一下它是怎么实现的。

... switch(pid = fork()) { case -1: return -1; case 0: //子进程 ptrace(PTRACE_TRACEME,0,NULL,NULL); execl("./HelloWorld", "HelloWorld", NULL); default: //父进程 wait(&val); //等待并记录execve if(WIFEXITED(val)) return 0; syscallID=ptrace(PTRACE_PEEKUSER, pid, ORIG_EAX*4, NULL); printf("Process executed system call ID = %ld/n",syscallID); ptrace(PTRACE_SYSCALL,pid,NULL,NULL); while(1) { wait(&val); //等待信号 if(WIFEXITED(val)) //判断子进程是否退出 return 0; if(flag==0) //第一次(进入系统调用),获取系统调用的参数 { syscallID=ptrace(PTRACE_PEEKUSER, pid, ORIG_EAX*4, NULL); printf("Process executed system call ID = %ld ",syscallID); flag=1; } else //第二次(退出系统调用),获取系统调用的返回值 { returnValue=ptrace(PTRACE_PEEKUSER, pid, EAX*4, NULL); printf("with return value= %ld/n", returnValue); flag=0; } ptrace(PTRACE_SYSCALL,pid,NULL,NULL); } } ... 

在上面的程序中,fork出的子进程先调用了ptrace(PTRACE_TRACEME)表示子进程让父进程跟踪自己。
然后子进程调用execl加载执行了HelloWorld
而在父进程中则使用wait系统调用等待子进程的状态改变。
子进程因为设置了PTRACE_TRACEME而在执行系统调用被系统停止(设置为TASK_TRACED),
这时父进程被唤醒,使用ptrace(PTRACE_PEEKUSER,pid,...)
分别去读取子进程执行的系统调用ID(放在ORIG_EAX中)
以及系统调用返回时的值(放在EAX中)。
然后使用ptrace(PTRACE_SYSCALL,pid,...)
指示子进程运行到下一次执行系统调用的时候(进入或者退出),直到子进程退出为止。
















程序的执行结果如下:

Process executed system call ID = 11 Process executed system call ID = 45 with return value=  Process executed system call ID = 192 with return value= - Process executed system call ID = 33 with return value= -2 Process executed system call ID = 5 with return value= -2 ... 

其中,11号系统调用就是execve45号是brk,192mmap2,33access,5open
经过比对可以发现,和strace的输出结果一样。
当然strace进行了更详尽和完善的处理,我们这里只是揭示其原理,感兴趣的同学可以去研究一下strace的实现。




PS:

1). 在系统调用执行的时候,会执行pushl %eax# 保存系统调用号ORIG_EAX在程序用户栈中。
2). 在系统调用返回的时候,会执行movl %eax,EAX(%esp)将系统调用的返回值放入寄存器%eax中。
3). WIFEXITED()宏用来判断子进程是否为正常退出的,如果是,它会返回一个非零值。
4). 被跟踪的程序在进入或者退出某次系统调用的时候都会触发一个SIGTRAP信号,而被父进程捕获。
5). execve()系统调用执行成功的时候并没有返回值,因为它开始执行一段新的程序,并没有”返回”的概念。失败的时候会返回-1
6). 在父进程进行进行操作的时候,用ps查看,可以看到子进程的状态为T,表示子进程处于TASK_TRACED状态。当然为了更具操作性,你可以在父进程中加入sleep()










3.GDB的实现

GDBGNU发布的一个强大的程序调试工具,用以调试C/C++程序。
可以使程序员在程序运行的时候观察程序在内存/寄存器中的使用情况。
它的实现也是基于ptrace系统调用来完成的。
其原理是利用ptrace系统调用,在被调试程序和gdb之间建立跟踪关系。
然后所有发送给被调试程序的信号(除SIGKILL)都会被gdb截获,gdb根据截获的信号,查看被调试程序相应的内存地址,并控制被调试的程序继续运行。
GDB常用的使用方法有断点设置和单步跟踪,接下来我们来分析一下他们是如何实现的。










3.1 建立调试关系

gdb调试程序,可以直接gdb ./test,也可以gdb (test的进程号)。这对应着使用ptrace建立跟踪关系的两种方式:
1)fork: 利用fork+execve执行被测试的程序,子进程在执行execve之前调用ptrace(PTRACE_TRACEME),建立了与父进程(debugger)的跟踪关系。如我们在分析strace时所示意的程序。

2)attach: debugger可以调用ptrace(PTRACE_ATTACH,pid,...)
建立自己与进程号为pid的进程间的跟踪关系。
即利用PTRACE_ATTACH,使自己变成被调试程序的父进程(用ps可以看到)。
attach建立起来的跟踪关系,可以调用ptrace(PTRACE_DETACH,pid,...)来解除。
注意attach进程时的权限问题,如一个非root权限的进程是不能attach到一个root进程上的。








3.2 断点原理

断点是大家在调试程序时常用的一个功能,如break linenumber,当执行到linenumber那一行的时候被调试程序会停止,等待debugger的进一步操作。
断点的实现原理,就是在指定的位置插入断点指令,当被调试的程序运行到断点的时候,产生SIGTRAP信号。
该信号被gdb捕获并进行断点命中判定,当gdb判断出这次SIGTRAP是断点命中之后就会转入等待用户输入进行下一步处理,否则继续。
断点的设置原理: 在程序中设置断点,就是先将该位置的原来的指令保存,然后向该位置写入int 3
当执行到int 3的时候,发生软中断,内核会给子进程发出SIGTRAP信号,当然这个信号会被转发给父进程。
然后用保存的指令替换int3,等待恢复运行。
断点命中判定:gdb把所有的断点位置都存放在一个链表中,命中判定即把被调试程序当前停止的位置和链表中的断点位置进行比较,看是断点产生的信号,还是无关信号。












3.3 单步跟踪原理

linux上,指令单步可以通过ptrace来实现。
调用ptrace(PTRACE_SINGLESTEP,pid,...)可以使被调试的进程在每执行完一条指令后就触发一个SIGTRAP信号,让GDB运行。下面来看一个例子:

 child = fork(); if(child == 0) { execl("./HelloWorld", "HelloWorld", NULL); } else { ptrace(PTRACE_ATTACH,child,NULL,NULL); while(1){ wait(&val); if(WIFEXITED(val)) break; count++; ptrace(PTRACE_SINGLESTEP,child,NULL,NULL); } printf("Total Instruction number= %d/n",count); } 

这段程序比较简单,子进程调用execve执行HelloWorld,而父进程则先调用ptrace(PTRACE_ATTACH,pid,...)建立与子进程的跟踪关系。
然后调用ptrace(PTRACE_SINGLESTEP, pid, ...)让子进程一步一停,以统计子进程一共执行了多少条指令(你会发现一个简单的HelloWorld实际上也执行了好几万条指令才完成)。
当然你也完全可以在这个时候查看EIP寄存器中存放的指令,或者某个变量的值,当然前提是你得知道这个变量在子进程内存镜像中的位置。
指令单步可以依靠硬件完成,如x86架构处理器支持单步模式(通过设置EFLAGS寄存器的TF标志实现),
每执行一条指令,就会产生一次异常(在Intel 80386以上的处理器上还提供了DRx调试寄存器以用于软件调试)。
也可以通过软件完成,即在每条指令后面都插入一条断点指令,这样每执行一条指令都会产生一次软中断。
语句单步基于指令单步实现,即GDB算好每条语句所对应的指令,从什么地方开始到什么地方结束。
然后在结束的地方插入断点,或者指令单步一步一步的走到结束点,再进行处理。














当然gdb的实现远比今天我们所说的内容要复杂,它能让我们很容易的监测,修改被调试的进程,比如通过行号,函数名,变量名。
而要真正实现这些,一是需要在编译的时候提供足够的信息,如在gcc时加入-g选项,这样gcc会把一些程序信息放到生成的ELF文件中,包括函数符号表,行号,变量信息,宏定义等,以便日后gdb调试,当然生成的文件也会大一些。
二是需要我们对ELF文件格式,进程的内存镜像(布局)以及程序的指令码十分熟悉。
这样才能保证在正确的时机(断点发生?单步?)找到正确的内存地址(代码?数据?)并链接回正确的程序代码(这是哪个变量?程序第几行?)。
感兴趣的同学可以找到相应的代码仔细分析一下。








最后让我们来回顾一下ptrace的使用:

1)用PTRACE_ATTACH或者PTRACE_TRACEME 建立进程间的跟踪关系。
2)PTRACE_PEEKTEXT, PTRACE_PEEKDATA, PTRACE_PEEKUSR等读取子进程内存/寄存器中保留的值。
3)PTRACE_POKETEXT, PTRACE_POKEDATA, PTRACE_POKEUSR等把值写入到被跟踪进程的内存/寄存器中。
4)用PTRACE_CONTPTRACE_SYSCALL,PTRACE_SINGLESTEP控制被跟踪进程以何种方式继续运行。
5)PTRACE_DETACH,PTRACE_KILL脱离进程间的跟踪关系。








TIPS:

  1. 进程状态TASK_TRACED用以表示当前进程因为被父进程跟踪而被系统停止。
  2. 如在子进程结束前,父进程结束,则trace关系解除。
  3. 利用attach建立起来的跟踪关系,虽然ps看到双方为父子关系,但在”子进程”中调用getppid()仍会返回原来的父进程id
  4. 不能attach到自己不能跟踪的进程,如non-root进程跟踪root进程。
  5. 已经被trace的进程,不能再次被attach
  6. 即使是用PTRACE_TRACEME建立起来的跟踪关系,也可以用DETACH的方式予以解除。
  7. 因为进入/退出系统调用都会触发一次SIGTRAP,所以通常的做法是在第一次(进入)的时候读取系统调用的参数,在第二次(退出)的时候读取系统调用的返回值。但注意execve是个例外。
  8. 程序调试时的断点由int 3设置完成,而单步跟踪则可由ptrace(PTRACE_SINGLESTEP)实现。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/204870.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午7:20
下一篇 2026年3月19日 下午7:21


相关推荐

  • ORA-12514 解决方法

    ORA-12514 解决方法场景:修改oracle系统参数之后,数据库重启,客户端报ORA-12514错误,其实这只是表象,实际并非Listener的问题。SELECT*FROMV$RESOURCE_LIMIT根据

    2022年7月1日
    31
  • Mac 安装 node.js 及环境配置[通俗易懂]

    Mac 安装 node.js 及环境配置[通俗易懂]目录安装node1:官网下载2:安装3:验证4:环境配置安装node1:官网下载访问nodejs官网,点击蓝色选框区域稳定版,并下载https://nodejs.org/en2:安装双击刚下载的文件,按步骤默认安装就行3:验证安装完成后打开终端输入npm-vnode-v两个命令,如下图出现版本信息,说明安装成功4:环境配置1:打开Mac终端,配置全局环境变量vim.bash_profile2:打开之后添加一行以下代码,(Mac的node,npm可执行文件都在/usr

    2022年5月13日
    61
  • 在MT4上使用双线MACD指标源码

    在MT4上使用双线MACD指标源码MACD指标是股票交易中经典的一款技术分析指标,该指标由两条曲线和柱线组成。基本用法:MACD金叉:DIFF由下向上突破DEA,为买入信号。MACD死叉:DIFF由上向下突破DEA,为卖出信号。MACD绿转红:MACD值由负变正,市场由空头转为多头。MACD红转绿:MACD值正转负,市场多头转空头。DIFF与DEA均为正值,即都在零轴线以上时,大势属于多头市场,DIFF向上突破DEA,可以做买入信号。DIFF与DEA均为负值,即都在零轴线以下时,大势属于空头市场,DIFF向下跌破DEA,可做卖出信号。DE

    2022年5月7日
    103
  • 基本农田卫星地图查询软件下载_谷歌高清卫星地图2019村庄

    基本农田卫星地图查询软件下载_谷歌高清卫星地图2019村庄谷歌地图整合Google的本地搜索以及驾车指南两项服务,能够鸟瞰世界,将取代目前桌面搜索软件。谷歌地图可在虚拟世界中如同一只雄鹰在大峡谷中自由飞翔,登陆峡谷顶峰,潜入峡谷深渊。谷歌地图使用界面相关软件版本说明下载地址谷歌卫星地图下载器X2.0查看高德地图官方最新版v7.7.4查看奥维互动地图v6.1.1查看谷歌浏览器稳定版v56.0.2924.3查看谷歌翻译v6.0查看软件简介谷歌地图采…

    2022年4月19日
    373
  • 死磕带通滤波器

    死磕带通滤波器带通滤波器的作用与陷波器类似,带通滤波器在数字电源控制领域有重要作用。比如在三相LCL逆变器的谐振抑制控制方面,通过带通滤波器可以提取谐振点附近的频谱做进一步的控制策略。在有源电力滤波器利用带通滤波器可以提取电网信号的基波频率从而做进一步的控制。带通滤波器传递函数带通滤波器的传递函数是:h(s)=AwoBss2+Bs+wo2h(s)=\frac{Aw_oBs}{s^2+Bs+w_o^2}h(s)=s2+Bs+wo2​Awo​Bs​其中,wow_owo​是带通的“中心频率”,也就是想要通过频率

    2022年6月7日
    45
  • mysql的字符串拼接函数怎么用_拼接字段的函数是什么

    mysql的字符串拼接函数怎么用_拼接字段的函数是什么MySQL的字符串拼接有三个函数CONCAT(str1,str2,…)CONCAT_WS(separator,str1,str2,…)GROUP_CONCAT(expr)这三个函数都各有作用,现在测试看看是什么样子的效果准备数据表CREATETABLE`user_info`(`id`int(11)NOTNULLAUTO_INCREMENT,`name`varchar(255)DEFAULTNULL,`age`int(3)DEFAULTNULL,

    2025年7月13日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号