nginx源代码分析–模块分类

nginx源代码分析–模块分类

大家好,又见面了,我是全栈君。

ngx-modules

Nginx 基本的模块大致能够分为四类:

  • handler – 协同完毕client请求的处理、产生响应数据。比方模块, ngx_http_rewrite_module, ngx_http_log_module, ngx_http_static_module

  • filter – 对 handler 产生的响应数据做各种过滤处理。

    比方模块, ngx_http_not_modified_filter_module, ngx_http_header_filter_module

  • upstream – upstream 模块使 Nginx 能够充当反向代理,仅仅对client请求进行转发。

    比 如,ngx_http_proxy_module, ngx_http_fastcgi_module

  • loadbalance – 在 Nginx 充当反向代理时,通过 loadbalance 模块的策略选择处理某次 请求的后端server节点。

比方。对一个普通的訪问本地静态文件的请求处理,从 Nginx 收到请求并開始处理。到处 理结果的响应包体发送到网络上结束,整个过程的两个步骤 – 请求处理和响应处理 – 分别 由 handler 和 filter 处理完毕。

严格来说,upstream 模块 (proxy, fastcgi 等),也是请求处理的一部分,它们从网络获 取请求的响应内容。

以下仅仅分析一下 handler 模块和 filter 模块的注冊和调用逻辑。

handler 模块

Nginx 将请求的处理阶段分为了以下列出的11个 phase 。假设某个 handler 模块须要在某 个 phase 中被调用时,须要在 postconfiguration 时将 handler 模块的入口函数注冊到 Nginx 中。

 -----------http/ngx_http_core_module.h:86------------- typedef enum { NGX_HTTP_POST_READ_PHASE = 0, NGX_HTTP_SERVER_REWRITE_PHASE, NGX_HTTP_FIND_CONFIG_PHASE, NGX_HTTP_REWRITE_PHASE, NGX_HTTP_POST_REWRITE_PHASE, NGX_HTTP_PREACCESS_PHASE, NGX_HTTP_ACCESS_PHASE, NGX_HTTP_POST_ACCESS_PHASE, NGX_HTTP_TRY_FILES_PHASE, NGX_HTTP_CONTENT_PHASE, NGX_HTTP_LOG_PHASE } ngx_http_phases;

一个请求相应的 phase 会随着程序的运行发生变化。

同一时候,在请求的实际处理过程中。 会因等待事件或者子请求等导致请求在不同的 phase 重复处理,可是在随意时刻。对某个 指定的client请求而言。它总是处于某个确定的 phase 中。这里先临时将这个 phase 的转 化过程称为 phase machine。整个 phase machine 的退出点就是请求的全然处理结束。

处理函数注冊

全部的 phase 和在各 phase 注冊的入口函数。都暂时保存在 ngx_http_core_modulemain conf 中的配置结构体 ngx_http_core_main_conf_tphases 成员中:

 ----------http/ngx_http_core_module.h:125------------- typedef struct { ngx_array_t handlers; } ngx_http_phase_t; typedef struct { ... ngx_http_phase_engine_t phase_engine; ... ngx_http_phase_t phases[NGX_HTTP_LOG_PHASE + 1] } ngx_http_core_main_conf_t;

ngx_http_rewrite_module 举例,其模块的 postconfiguration 相应回调函数 ngx_http_rewrite_init

 -----------http/modules/ngx_http_rewrite_module.c:104----- static ngx_http_module_t ngx_http_rewrite_module_ctx = { NULL, /* preconfiguration */ ngx_http_rewrite_init, /* postconfiguration */ NULL, /* create main configuration */ NULL, /* init main configuration */ NULL, /* create server configuration */ NULL, /* merge server configuration */ ngx_http_rewrite_create_loc_conf, /* create location configuration */ ngx_http_rewrite_merge_loc_conf, /* merge location configuration */ };

ngx_http_rewrite_init 中,将 ngx_http_rewrite_module 的入口函数注冊到了 NGX_HTTP_SERVER_REWRITE_PHASENGX_HTTP_REWRITE_PHASE 两个 phase 中:

 -----------http/modules/ngx_http_rewrite_module.c:266------- static ngx_int_t ngx_http_rewrite_init(ngx_conf_t *cf) { ... cmcf = ngx_http_conf_get_module_main_conf(cf, ngx_http_core_module); h = ngx_array_push(&cmcf->phases[NGX_HTTP_SERVER_REWRITE_PHASE].handlers; ... *h = ngx_http_rewrite_handler; h = ngx_array_push(&cmcf->phases[NGX_HTTP_REWRITE_PHASE].handlers; ... *h = ngx_http_rewrite_handler; ... }

然后,在全部 handler 模块的入口函数都注冊完成后,ngx_http_core_module 会将全部 入口函数封装成 ngx_http_phase_handler_t 类型变量后,线性化存储到 cmcf->phase_engine 中,同一时候在连续内存基础上。使用 next 成员再次生成一个链表 (通过数组索引链接)。

ngx_http_phase_handler_t 类型变量的 checker 成员函数,决 定一个请求在 phase machine 中。在当前 phase 的当前 handler 函数处理完后,是该 调用同一 phase 中的下一个 handler 函数处理,还是直接进行下一个 phase (checker 能够觉得是 phase 的调度函数)。

同一时候。在线性化过程中,还增加了 Nginx 内建 phase (find_config, post_rewrite, post_access, try_files)的 checker 函数,这些 phase 原本身并不和不论什么模块的 handler 处理函数相相应 。

 ---------http/ngx_http_core_module.h:111-------------- sturct ngx_http_phase_handler_s { ngx_http_phase_handler_pt checker; ngx_http_handler_pt handler; ngx_uint_t next; }; typedef struct { ngx_http_phase_handler_t *handlers; ngx_uint_t server_rewrite_index; ngx_uint_t location_rewrite_index; } ngx_http_phase_engine_t;

线性化处理由函数 ngx_http_init_phase_handlers 完毕,它在全部 http 模块的 postconfiguration 被调用完毕后运行:

 ---------http/ngx_http.c:328------ for (m = 0; ngx_modules[m]; m++) { ... if (module->postconfiguration) { if (module->postconfiguration(cf) != NGX_OK) { return NGX_CONF_ERROR; } } } ... if (ngx_http_init_phase_handlers(cf, cmcf) != NGX_OK) { return NGX_CONF_ERROR; }

ngx_http_init_phase_handlers 运行完后,各 phase 中注冊的回调函数被封装成 ngx_http_phase_handler_t 类型的变量,其字段的 checker 和 next 终于值总结例如以下:

 phase checker next ------------------------------------------------------------------------ POST_READ ngx_http_core_generic_phase 下一个 phase SERVER_REWRITE ngx_http_core_generic_phase 下一个 phase FIND_CONFIG ngx_http_core_find_config_phase 0 REWRITE ngx_http_core_generic_phase 下一个 phase POST_REWRITE ngx_http_core_post_rewrite_phase FIND_CONFIG phase PREACCESS ngx_http_core_generic_phase 下一个 phase ACCESS ngx_http_core_access_phase 下下一个 phase (跳过 post_access phrase) POST_ACCESS ngx_http_core_post_access_phase 下一个 phase TRY_FILES ngx_http_core_try_files_phase 0 CONTENT ngx_http_core_content_phase NULL ------------------------------------------------------------------------

当中。各个 phase 的 checker 的行为例如以下:

 checker behavior ------------------------------------------------------------------------ ngx_http_core_generic_phase NGX_OK时,进入下一个 phase, NGX_DECLINED时,下一个 handler ngx_http_core_find_config_phase 下一个 handler ngx_http_core_post_rewrite_phase 下一个 phase。即 FIND_CONFIG_PHASE ngx_http_core_access_phase NGX_OK时,进入下一个 phase NGX_DECLINED, NGX_HTTP_FORBIDDEN, NGX_HTTP_UNAUTHORIZED时。下一个 handler ngx_http_core_post_access_phase r->access_code 不为0时。结束请求 否则。继续下一个 handler ngx_http_core_try_files_phase 下一个 handler ngx_http_core_content_phase 下一个 handler。或者结束请求 ------------------------------------------------------------------------

另外一个须要注意的地方是。在 ngx_http_init_phase_handlers 中,仅仅给 cmcf->phase_engine.handlers 分配了多余的 sizeof(void *) 个字节用于存储 handlers 结束标识 NULL:

 ---------http/ngx_http.c:488--------------- n = use_rewrite + use_access + cmcf->try_files + 1 /* find config phase */; for (i = 0; i < NGX_HTTP_LOG_PHASE; i++) { n += cmcf->phases[i].handlers.nelts; } ph = ngx_pcalloc(cf->pool, n * sizeof(ngx_http_phase_handler_t) + sizeof(void *));

而在随后的使用中,仅仅检查了 ngx_http_phase_handler_t 的第一个字段,即 checker。 来推断是否到了 ngx_http_phase_handler_t 数组的末尾。这是有意为之,还是疏忽的地 方? 尽管代码能够正常执行,可是…

 --------http/ngx_http_core_module.c:836--------- void ngx_http_core_run_phases(ngx_http_request_t *r) { ... while (ph[r->phase_handler].checker) { rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]); ... } } 

处理函数调用

在 Nginx 正常启动后,開始处理client请求。

在处理client请求的过程中。就会依据请求 处于的 phase 。调用已注冊到对应 phase 的回调函数,对请求进行处理。

当一个 HTTP 请求到达 Nginx 后。Nginx 会依次调用以下的处理函数 (先简单列出,等专 门再辟出一文对 HTTP 请求的“一生”进行具体描写叙述):

 - ngx_http_init_connection - ngx_http_init_request - ngx_http_process_request_line - ngx_http_process_request_headers - ngx_http_process_request - ngx_http_handler - ngx_http_core_run_phasess

最后一个函数 ngx_http_core_run_phases 就是这个 phase machine 的驱动函数:

 -----------http/ngx_http_core_module.c:836-------- void ngx_http_core_run_phases(ngx_http_request_t *r) { ... cmcf = ngx_http_get_module_main_conf(r, ngx_http_core_module); ph = cmcf->phase_engine.handlers; while (ph[r->phase_handler].checker) { rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]); if (rc == NGX_OK) { return; } } }

随后,整个请求处理的主要逻辑都是在这个 phase machine 中完毕的。具体的处理逻辑 以后再分析,这篇关注的是 handler 模块的注冊和调用逻辑。

filter 模块

filter 模块的初始化时间和 handler 模块一样,都是在模块的 postconfiguration 回 调函数中完毕。可是,与 handler 模块函数的注冊方式不同的时,filter 模块的入口函数 不须要区分 phase。同一时候,全部的 filter 入口函数组成 output filter chain

每一个请 求的响应数据都经过 output filter chain 中的每一个 filter 入口函数进行处理,然后 才会发向网络。

响应数据由响应头和响应体两部分组成,分别经过响应头相应的 header output filter chain 和响应体相应的 body output filter chain 处理。

处理函数注冊

output filter chain。使用两个全局变量 ngx_http_top_header ngx_http_top_body_filter 分别保存第一个 header filter 和 body filter 入口函数 的地址。

每一个 filter 模块的局部变量 ngx_http_next_header_filterngx_http_next_body_filter 保存当前 filter 模块运行完后须要调用的下一个 filter 模块的入口函数地址。这个 filter 链条在 Nginx初始化模块时完毕。 比方ngx_http_addition_filter 模块的初始化函数例如以下:

 static ngx_int_t ngx_http_addition_filter_init(ngx_conf_t *cf) { ngx_http_next_header_filter = ngx_http_top_header_filter; ngx_http_top_header_filter = ngx_http_addition_header_filter; ngx_http_next_body_filter = ngx_http_top_body_filter; ngx_http_top_body_filter = ngx_http_addition_body_filter; return NGX_OK; }

header output filter chain 为例,Nginx在開始返回响应数据时,调用 ngx_http_top_header_filterngx_http_top_header_filter 指向的第一个 filter 模块的入口函数,第一个 filter 模块的入口函数处理完毕以后。会调用其模块局部变量 ngx_http_next_header_filterngx_http_next_header_filter 指向的下一个 filter 模块的入口函数,以此类推,直到 ngx_http_header_filterngx_http_write_filter 模块将数据发回client。这个处理过程就完毕了。

filter 模块入口函数的调用顺序由 filter 模块的初始化顺序决定,而且方向相反。模块 初始化顺序在 objs/ngx_modules.c 中定义:

 34 extern ngx_module_t ngx_http_write_filter_module; 35 extern ngx_module_t ngx_http_header_filter_module; 36 extern ngx_module_t ngx_http_chunked_filter_module; 37 extern ngx_module_t ngx_http_range_header_filter_module; 38 extern ngx_module_t ngx_http_gzip_filter_module; 39 extern ngx_module_t ngx_http_postpone_filter_module; 40 extern ngx_module_t ngx_http_charset_filter_module; 41 extern ngx_module_t ngx_http_ssi_filter_module; 42 extern ngx_module_t ngx_http_userid_filter_module; 43 extern ngx_module_t ngx_http_headers_filter_module; 44 extern ngx_module_t ngx_http_copy_filter_module; 45 extern ngx_module_t ngx_http_range_body_filter_module; 46 extern ngx_module_t ngx_http_not_modified_filter_module;

可见,ngx_http_header_filter_modulengx_http_write_filter_module 最先被初 始化。那么,其提供的filter处理函数在整个响应处理过程中被最后调用。

body output filter chain 的生成方式和 header output filter chain 类似。

处理函数调用

在请求的响应内容准备完成,開始向client发送响应数据时。Nginx 会使用 ngx_http_send_header将响应包头数据交给 header output filter chain 处理。

包头 数据发送完毕后,再使用 ngx_http_output_filter 将响应包体数据交给 body output filter chain 处理。

 -----------http/ngx_http_core_module.c:1702----------- ngx_int_t ngx_http_send_header(ngx_http_request_t *r) { if (r->err_status) { r->headers_out.status = r->err_status; r->headers_out.status_line.len = 0; } return ngx_http_top_header_filter(r); } ----------http/ngx_http_core_module.c:1713------------- ngx_int_t ngx_http_output_filter(ngx_http_request_t *r, ngx_chain_t *in) { ... rc = ngx_http_top_body_filter(r, in); }

随后的处理流程。就是依照 处理函数注冊 中构造的 output filter chain 的顺序调用 各个 filter 模块的入口函数一步一步完毕的。

详细的逻辑,就和各个 filter 模块本身的 功能相关了。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/116306.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • vs2017当前页面的脚本发生错误_win10当前页面脚本发生错误

    vs2017当前页面的脚本发生错误_win10当前页面脚本发生错误今天使用金山卫士对IE8进行组件升级,此后再此使用VS2008查看项目界面中的控件变量类型,或者添加变量,都弹出“当前页面脚本错误”。在网上进行查找。解决办法如下:1、进入到注册表编辑器。2、按照以下路径“HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Internet  Settings\Zones”查看是否存在

    2022年8月30日
    1
  • 记一次某网站实战

    记一次某企业实战0x00前言近段时间来也没怎么更新过博客,在这里就来水篇文章吧。前段时间一直在做项目,也来分享并且记录一下自己的一些成果,和一些小思路。0x01信息收集渗透的第一步肯定是

    2021年12月11日
    48
  • Quartz中时间表达式的设置—–corn表达式

    Quartz中时间表达式的设置—–corn表达式

    2021年12月1日
    36
  • 【TCP/IP】IP地址分类和特殊IP地址

    【TCP/IP】IP地址分类和特殊IP地址IP地址是因特网技术中的一个非常重要的概念,IP地址在IP层实现了底层网络地址的统一,使因特网的网络层地址具有全局唯一性和一致性。IP地址含有位置信息,反映了主机的网络连接,使因特网进行寻址和路由选择的依据。 IP地址概述地址是标识对象所处位置的标识符。传输中的信息带有源地址和目的地址,分别标识通信的源结点和目的结点,即信源和信宿。目的地址是传输设备为信息进行寻址的依据。不同的物理…

    2022年4月29日
    69
  • 如何查看centos版本信息_怎么查看ie浏览器的版本

    如何查看centos版本信息_怎么查看ie浏览器的版本详细讲解查看CentOS版本信息的命令。   (一)查看已经安装的CentOS版本信息   1.cat/etc/issue查看版本  cat 缩写concatenate cat命令可以用来显示、合并文件。  CentOSrelease6.6(Final)  CentOS发行版6.6    etc 初期etc的英文名…

    2022年4月19日
    59
  • 在线用户数与并发用户数的区别和比例关系[通俗易懂]

    在线用户数与并发用户数的区别和比例关系[通俗易懂]在线用户数与并发用户数的区别和比例关系在线用户数:用户同时在一定时间段的在线数量并发用户数:某一时刻同时向服务器发送请求的用户数一般而言,我们习惯以5-20的比率来推算并发用户与在线用户之间的关系。即,并发与在线的比例约为5%-20%比如,某网站存在注册用户数为10W人,但同时在线最多1W人,但这1W个人,可能只有500人会浏览帖子,500人会进行发帖,只有这1000个人对服务

    2022年5月14日
    63

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号