nginx源代码分析–模块分类

nginx源代码分析–模块分类

大家好,又见面了,我是全栈君。

ngx-modules

Nginx 基本的模块大致能够分为四类:

  • handler – 协同完毕client请求的处理、产生响应数据。比方模块, ngx_http_rewrite_module, ngx_http_log_module, ngx_http_static_module

  • filter – 对 handler 产生的响应数据做各种过滤处理。

    比方模块, ngx_http_not_modified_filter_module, ngx_http_header_filter_module

  • upstream – upstream 模块使 Nginx 能够充当反向代理,仅仅对client请求进行转发。

    比 如,ngx_http_proxy_module, ngx_http_fastcgi_module

  • loadbalance – 在 Nginx 充当反向代理时,通过 loadbalance 模块的策略选择处理某次 请求的后端server节点。

比方。对一个普通的訪问本地静态文件的请求处理,从 Nginx 收到请求并開始处理。到处 理结果的响应包体发送到网络上结束,整个过程的两个步骤 – 请求处理和响应处理 – 分别 由 handler 和 filter 处理完毕。

严格来说,upstream 模块 (proxy, fastcgi 等),也是请求处理的一部分,它们从网络获 取请求的响应内容。

以下仅仅分析一下 handler 模块和 filter 模块的注冊和调用逻辑。

handler 模块

Nginx 将请求的处理阶段分为了以下列出的11个 phase 。假设某个 handler 模块须要在某 个 phase 中被调用时,须要在 postconfiguration 时将 handler 模块的入口函数注冊到 Nginx 中。

 -----------http/ngx_http_core_module.h:86------------- typedef enum { NGX_HTTP_POST_READ_PHASE = 0, NGX_HTTP_SERVER_REWRITE_PHASE, NGX_HTTP_FIND_CONFIG_PHASE, NGX_HTTP_REWRITE_PHASE, NGX_HTTP_POST_REWRITE_PHASE, NGX_HTTP_PREACCESS_PHASE, NGX_HTTP_ACCESS_PHASE, NGX_HTTP_POST_ACCESS_PHASE, NGX_HTTP_TRY_FILES_PHASE, NGX_HTTP_CONTENT_PHASE, NGX_HTTP_LOG_PHASE } ngx_http_phases;

一个请求相应的 phase 会随着程序的运行发生变化。

同一时候,在请求的实际处理过程中。 会因等待事件或者子请求等导致请求在不同的 phase 重复处理,可是在随意时刻。对某个 指定的client请求而言。它总是处于某个确定的 phase 中。这里先临时将这个 phase 的转 化过程称为 phase machine。整个 phase machine 的退出点就是请求的全然处理结束。

处理函数注冊

全部的 phase 和在各 phase 注冊的入口函数。都暂时保存在 ngx_http_core_modulemain conf 中的配置结构体 ngx_http_core_main_conf_tphases 成员中:

 ----------http/ngx_http_core_module.h:125------------- typedef struct { ngx_array_t handlers; } ngx_http_phase_t; typedef struct { ... ngx_http_phase_engine_t phase_engine; ... ngx_http_phase_t phases[NGX_HTTP_LOG_PHASE + 1] } ngx_http_core_main_conf_t;

ngx_http_rewrite_module 举例,其模块的 postconfiguration 相应回调函数 ngx_http_rewrite_init

 -----------http/modules/ngx_http_rewrite_module.c:104----- static ngx_http_module_t ngx_http_rewrite_module_ctx = { NULL, /* preconfiguration */ ngx_http_rewrite_init, /* postconfiguration */ NULL, /* create main configuration */ NULL, /* init main configuration */ NULL, /* create server configuration */ NULL, /* merge server configuration */ ngx_http_rewrite_create_loc_conf, /* create location configuration */ ngx_http_rewrite_merge_loc_conf, /* merge location configuration */ };

ngx_http_rewrite_init 中,将 ngx_http_rewrite_module 的入口函数注冊到了 NGX_HTTP_SERVER_REWRITE_PHASENGX_HTTP_REWRITE_PHASE 两个 phase 中:

 -----------http/modules/ngx_http_rewrite_module.c:266------- static ngx_int_t ngx_http_rewrite_init(ngx_conf_t *cf) { ... cmcf = ngx_http_conf_get_module_main_conf(cf, ngx_http_core_module); h = ngx_array_push(&cmcf->phases[NGX_HTTP_SERVER_REWRITE_PHASE].handlers; ... *h = ngx_http_rewrite_handler; h = ngx_array_push(&cmcf->phases[NGX_HTTP_REWRITE_PHASE].handlers; ... *h = ngx_http_rewrite_handler; ... }

然后,在全部 handler 模块的入口函数都注冊完成后,ngx_http_core_module 会将全部 入口函数封装成 ngx_http_phase_handler_t 类型变量后,线性化存储到 cmcf->phase_engine 中,同一时候在连续内存基础上。使用 next 成员再次生成一个链表 (通过数组索引链接)。

ngx_http_phase_handler_t 类型变量的 checker 成员函数,决 定一个请求在 phase machine 中。在当前 phase 的当前 handler 函数处理完后,是该 调用同一 phase 中的下一个 handler 函数处理,还是直接进行下一个 phase (checker 能够觉得是 phase 的调度函数)。

同一时候。在线性化过程中,还增加了 Nginx 内建 phase (find_config, post_rewrite, post_access, try_files)的 checker 函数,这些 phase 原本身并不和不论什么模块的 handler 处理函数相相应 。

 ---------http/ngx_http_core_module.h:111-------------- sturct ngx_http_phase_handler_s { ngx_http_phase_handler_pt checker; ngx_http_handler_pt handler; ngx_uint_t next; }; typedef struct { ngx_http_phase_handler_t *handlers; ngx_uint_t server_rewrite_index; ngx_uint_t location_rewrite_index; } ngx_http_phase_engine_t;

线性化处理由函数 ngx_http_init_phase_handlers 完毕,它在全部 http 模块的 postconfiguration 被调用完毕后运行:

 ---------http/ngx_http.c:328------ for (m = 0; ngx_modules[m]; m++) { ... if (module->postconfiguration) { if (module->postconfiguration(cf) != NGX_OK) { return NGX_CONF_ERROR; } } } ... if (ngx_http_init_phase_handlers(cf, cmcf) != NGX_OK) { return NGX_CONF_ERROR; }

ngx_http_init_phase_handlers 运行完后,各 phase 中注冊的回调函数被封装成 ngx_http_phase_handler_t 类型的变量,其字段的 checker 和 next 终于值总结例如以下:

 phase checker next ------------------------------------------------------------------------ POST_READ ngx_http_core_generic_phase 下一个 phase SERVER_REWRITE ngx_http_core_generic_phase 下一个 phase FIND_CONFIG ngx_http_core_find_config_phase 0 REWRITE ngx_http_core_generic_phase 下一个 phase POST_REWRITE ngx_http_core_post_rewrite_phase FIND_CONFIG phase PREACCESS ngx_http_core_generic_phase 下一个 phase ACCESS ngx_http_core_access_phase 下下一个 phase (跳过 post_access phrase) POST_ACCESS ngx_http_core_post_access_phase 下一个 phase TRY_FILES ngx_http_core_try_files_phase 0 CONTENT ngx_http_core_content_phase NULL ------------------------------------------------------------------------

当中。各个 phase 的 checker 的行为例如以下:

 checker behavior ------------------------------------------------------------------------ ngx_http_core_generic_phase NGX_OK时,进入下一个 phase, NGX_DECLINED时,下一个 handler ngx_http_core_find_config_phase 下一个 handler ngx_http_core_post_rewrite_phase 下一个 phase。即 FIND_CONFIG_PHASE ngx_http_core_access_phase NGX_OK时,进入下一个 phase NGX_DECLINED, NGX_HTTP_FORBIDDEN, NGX_HTTP_UNAUTHORIZED时。下一个 handler ngx_http_core_post_access_phase r->access_code 不为0时。结束请求 否则。继续下一个 handler ngx_http_core_try_files_phase 下一个 handler ngx_http_core_content_phase 下一个 handler。或者结束请求 ------------------------------------------------------------------------

另外一个须要注意的地方是。在 ngx_http_init_phase_handlers 中,仅仅给 cmcf->phase_engine.handlers 分配了多余的 sizeof(void *) 个字节用于存储 handlers 结束标识 NULL:

 ---------http/ngx_http.c:488--------------- n = use_rewrite + use_access + cmcf->try_files + 1 /* find config phase */; for (i = 0; i < NGX_HTTP_LOG_PHASE; i++) { n += cmcf->phases[i].handlers.nelts; } ph = ngx_pcalloc(cf->pool, n * sizeof(ngx_http_phase_handler_t) + sizeof(void *));

而在随后的使用中,仅仅检查了 ngx_http_phase_handler_t 的第一个字段,即 checker。 来推断是否到了 ngx_http_phase_handler_t 数组的末尾。这是有意为之,还是疏忽的地 方? 尽管代码能够正常执行,可是…

 --------http/ngx_http_core_module.c:836--------- void ngx_http_core_run_phases(ngx_http_request_t *r) { ... while (ph[r->phase_handler].checker) { rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]); ... } } 

处理函数调用

在 Nginx 正常启动后,開始处理client请求。

在处理client请求的过程中。就会依据请求 处于的 phase 。调用已注冊到对应 phase 的回调函数,对请求进行处理。

当一个 HTTP 请求到达 Nginx 后。Nginx 会依次调用以下的处理函数 (先简单列出,等专 门再辟出一文对 HTTP 请求的“一生”进行具体描写叙述):

 - ngx_http_init_connection - ngx_http_init_request - ngx_http_process_request_line - ngx_http_process_request_headers - ngx_http_process_request - ngx_http_handler - ngx_http_core_run_phasess

最后一个函数 ngx_http_core_run_phases 就是这个 phase machine 的驱动函数:

 -----------http/ngx_http_core_module.c:836-------- void ngx_http_core_run_phases(ngx_http_request_t *r) { ... cmcf = ngx_http_get_module_main_conf(r, ngx_http_core_module); ph = cmcf->phase_engine.handlers; while (ph[r->phase_handler].checker) { rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]); if (rc == NGX_OK) { return; } } }

随后,整个请求处理的主要逻辑都是在这个 phase machine 中完毕的。具体的处理逻辑 以后再分析,这篇关注的是 handler 模块的注冊和调用逻辑。

filter 模块

filter 模块的初始化时间和 handler 模块一样,都是在模块的 postconfiguration 回 调函数中完毕。可是,与 handler 模块函数的注冊方式不同的时,filter 模块的入口函数 不须要区分 phase。同一时候,全部的 filter 入口函数组成 output filter chain

每一个请 求的响应数据都经过 output filter chain 中的每一个 filter 入口函数进行处理,然后 才会发向网络。

响应数据由响应头和响应体两部分组成,分别经过响应头相应的 header output filter chain 和响应体相应的 body output filter chain 处理。

处理函数注冊

output filter chain。使用两个全局变量 ngx_http_top_header ngx_http_top_body_filter 分别保存第一个 header filter 和 body filter 入口函数 的地址。

每一个 filter 模块的局部变量 ngx_http_next_header_filterngx_http_next_body_filter 保存当前 filter 模块运行完后须要调用的下一个 filter 模块的入口函数地址。这个 filter 链条在 Nginx初始化模块时完毕。 比方ngx_http_addition_filter 模块的初始化函数例如以下:

 static ngx_int_t ngx_http_addition_filter_init(ngx_conf_t *cf) { ngx_http_next_header_filter = ngx_http_top_header_filter; ngx_http_top_header_filter = ngx_http_addition_header_filter; ngx_http_next_body_filter = ngx_http_top_body_filter; ngx_http_top_body_filter = ngx_http_addition_body_filter; return NGX_OK; }

header output filter chain 为例,Nginx在開始返回响应数据时,调用 ngx_http_top_header_filterngx_http_top_header_filter 指向的第一个 filter 模块的入口函数,第一个 filter 模块的入口函数处理完毕以后。会调用其模块局部变量 ngx_http_next_header_filterngx_http_next_header_filter 指向的下一个 filter 模块的入口函数,以此类推,直到 ngx_http_header_filterngx_http_write_filter 模块将数据发回client。这个处理过程就完毕了。

filter 模块入口函数的调用顺序由 filter 模块的初始化顺序决定,而且方向相反。模块 初始化顺序在 objs/ngx_modules.c 中定义:

 34 extern ngx_module_t ngx_http_write_filter_module; 35 extern ngx_module_t ngx_http_header_filter_module; 36 extern ngx_module_t ngx_http_chunked_filter_module; 37 extern ngx_module_t ngx_http_range_header_filter_module; 38 extern ngx_module_t ngx_http_gzip_filter_module; 39 extern ngx_module_t ngx_http_postpone_filter_module; 40 extern ngx_module_t ngx_http_charset_filter_module; 41 extern ngx_module_t ngx_http_ssi_filter_module; 42 extern ngx_module_t ngx_http_userid_filter_module; 43 extern ngx_module_t ngx_http_headers_filter_module; 44 extern ngx_module_t ngx_http_copy_filter_module; 45 extern ngx_module_t ngx_http_range_body_filter_module; 46 extern ngx_module_t ngx_http_not_modified_filter_module;

可见,ngx_http_header_filter_modulengx_http_write_filter_module 最先被初 始化。那么,其提供的filter处理函数在整个响应处理过程中被最后调用。

body output filter chain 的生成方式和 header output filter chain 类似。

处理函数调用

在请求的响应内容准备完成,開始向client发送响应数据时。Nginx 会使用 ngx_http_send_header将响应包头数据交给 header output filter chain 处理。

包头 数据发送完毕后,再使用 ngx_http_output_filter 将响应包体数据交给 body output filter chain 处理。

 -----------http/ngx_http_core_module.c:1702----------- ngx_int_t ngx_http_send_header(ngx_http_request_t *r) { if (r->err_status) { r->headers_out.status = r->err_status; r->headers_out.status_line.len = 0; } return ngx_http_top_header_filter(r); } ----------http/ngx_http_core_module.c:1713------------- ngx_int_t ngx_http_output_filter(ngx_http_request_t *r, ngx_chain_t *in) { ... rc = ngx_http_top_body_filter(r, in); }

随后的处理流程。就是依照 处理函数注冊 中构造的 output filter chain 的顺序调用 各个 filter 模块的入口函数一步一步完毕的。

详细的逻辑,就和各个 filter 模块本身的 功能相关了。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/116306.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • C语言实现学生信息管理系统

    C语言实现学生信息管理系统使用C语言对学生管理系统进行优化

    2022年6月20日
    28
  • java拦截器_Java拦截器[通俗易懂]

    java拦截器_Java拦截器[通俗易懂]拦截器,主要用于拦截前端请求,常用于登录检查。下面是演示使用拦截器拦截未登录的用户访问需要登录的模块情景,使用配置方式实现和注解方式实现代码:配置方式:1、web.xml中配置监听器,对于所有的/admin开头的请求,都走com.blog.interceptor.LoginInterceptor这个拦截器。2、再看com.blog.interceptor.LoginInterceptor的实现代码…

    2022年4月29日
    187
  • java怎么判断对象不为空_java判断对象是否为空的方法

    java怎么判断对象不为空_java判断对象是否为空的方法java判断对象是否为空的方法发布时间:2020-06-2514:39:17来源:亿速云阅读:134作者:Leah这篇文章将为大家详细讲解有关java判断对象是否为空的方法,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。首先来看一下工具StringUtils的判断方法:一种是org.apache.commons.lang3包下的;另一种是org.s…

    2022年6月3日
    111
  • 《JavaScript 模式》读书笔记(6)— 代码复用模式2「建议收藏」

    上一篇讲了最简单的代码复用模式,也是最基础的,我们普遍知道的继承模式,但是这种继承模式却有不少缺点,我们下面再看看其它可以实现继承的模式。四、类式继承模式#2——借用构造函数本模式解决了从子构造函

    2022年3月25日
    38
  • 从TCP协议的原理来谈谈rst复位攻击[通俗易懂]

    从TCP协议的原理来谈谈rst复位攻击[通俗易懂]在谈RST攻击前,必须先了解TCP:如何通过三次握手建立TCP连接、四次握手怎样把全双工的连接关闭掉、滑动窗口是怎么传输数据的、TCP的flag标志位里RST在哪些情况下出现。下面我会画一些尽量简化的图来表达清楚上述几点,之后再了解下RST攻击是怎么回事。1、TCP是什么?TCP是在IP网络层之上的传输层协议,用于提供port到port面向连接的可靠的字节流传输。我来用土语解释下上

    2022年9月27日
    3
  • Idea激活码最新教程2020.2.1版本,永久有效激活码,亲测可用,记得收藏

    Idea激活码最新教程2020.2.1版本,永久有效激活码,亲测可用,记得收藏Idea 激活码教程永久有效 2020 2 1 激活码教程 Windows 版永久激活 持续更新 Idea 激活码 2020 2 1 成功激活

    2025年5月23日
    9

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号