Nginx 基本数据结构

最后更新于:2022-04-01 20:35:39

### 概述       在学习 Nginx 之前首先了解其基本的数据结构是非常重要的,这是入门必须了解的一个步骤。本节只是简单介绍了 Nginx 对基本数据的一种封装,包括 基本整型数据类型、字符串数据类型、缓冲区类型以及 chain 数据类型。 ### 基本数据类型 #### 整型数据 ~~~ /* 基本数据结构 */ /* Nginx 简单数据类型 */ /* 在文件 src/core/ngx_config.h 定义了基本的数据映射 */ typedef intptr_t ngx_int_t; typedef uintptr_t ngx_uint_t; typedef intptr_t ngx_flag_t; /* 其中 intptr_t uintptr_t 定义在文件 /usr/include/stdint.h 文件中*/ /* Types for `void *' pointers. */ #if __WORDSIZE == 64 # ifndef __intptr_t_defined typedef long int intptr_t; # define __intptr_t_defined # endif typedef unsigned long int uintptr_t; #else # ifndef __intptr_t_defined typedef int intptr_t; # define __intptr_t_defined # endif typedef unsigned int uintptr_t; /* 因此,Nginx 的简单数据类型的操作和整型或指针类型类似 */ ~~~ #### 字符串类型 ~~~ /* Nginx 字符串数据类型 */ /* Nginx 字符串类型是对 C 语言字符串类型的简单封装, * 其定义在 core/ngx_string.h 或 core/ngx_string.c 中 * 定义了 ngx_str_t, ngx_keyval_t, ngx_variable_value_t */ /* ngx_str_t 在 u_char 的基础上增加了字符串长度的信息,即len变量 */ typedef struct { size_t len; /* 字符串的长度 */ u_char *data; /* 指向字符串的第一个字符 */ } ngx_str_t; typedef struct { ngx_str_t key; ngx_str_t value; } ngx_keyval_t; typedef struct { unsigned len:28; unsigned valid:1; unsigned no_cacheable:1; unsigned not_found:1; unsigned escape:1; u_char *data; } ngx_variable_value_t; /* Nginx 字符串的初始化使用 ngx_string 或 ngx_null_string ,这两个宏定义如下 */ #define ngx_string(str) {sizeof(str)-1, (u_char *) str} #define ngx_null_string {0, NULL} /* 若已经定义了 Nginx 字符串变量之后再赋值,则必须使用 ngx_str_set, ngx_str_null 宏定义*/ #define ngx_str_set(str, text) (str)->len = sizeof(text)-1; (str)->data = (u_char *)text #define ngx_str_null(str) (str)->len = 0; (str)->data = NULL /* 例如:*/ /* 正确写法*/ ngx_str_t str1 = ngx_string("hello nginx"); ngx_str_t str2 = ngx_null_string; /* 错误写法*/ ngx_str_t str1, str2; str1 = ngx_string("hello nginx"); /* 编译出错 */ str2 = ngx_null_string; /* 编译出错 */ /* 正确写法*/ ngx_str_t str1, str2; ngx_str_set(&str1, "hello nginx"); ngx_str_null(&str2); /* 注意:ngx_string 和 ngx_str_set 字符串参数必须是常量字符串,不能是变量字符串 */ ~~~ #### 内存池类型 内存池类型即是 ngx_pool_t ,有关内存池的讲解可参考前文《[Nginx 内存池管理](http://blog.csdn.net/chenhanzhun/article/details/42365605)》 ~~~ /* 内存池结构 */ /* 文件 core/ngx_palloc.h */ typedef struct {/* 内存池数据结构模块 */ u_char *last; /* 当前内存分配的结束位置,即下一段可分配内存的起始位置 */ u_char *end; /* 内存池的结束位置 */ ngx_pool_t *next; /* 指向下一个内存池 */ ngx_uint_t failed;/* 记录内存池内存分配失败的次数 */ } ngx_pool_data_t; /* 维护内存池的数据块 */ struct ngx_pool_s {/* 内存池的管理模块,即内存池头部结构 */ ngx_pool_data_t d; /* 内存池的数据块 */ size_t max; /* 内存池数据块的最大值 */ ngx_pool_t *current;/* 指向当前内存池 */ ngx_chain_t *chain;/* 指向一个 ngx_chain_t 结构 */ ngx_pool_large_t *large;/* 大块内存链表,即分配空间超过 max 的内存 */ ngx_pool_cleanup_t *cleanup;/* 析构函数,释放内存池 */ ngx_log_t *log;/* 内存分配相关的日志信息 */ }; /* 文件 core/ngx_core.h */ typedef struct ngx_pool_s ngx_pool_t; typedef struct ngx_chain_s ngx_chain_t; ~~~ #### 缓冲区数据类型 缓冲区 ngx_buf_t 的定义如下: ~~~ /* 缓冲区结构 */ typedef void * ngx_buf_tag_t; typedef struct ngx_buf_s ngx_buf_t; struct ngx_buf_s { u_char *pos; /* 缓冲区数据在内存的起始位置 */ u_char *last; /* 缓冲区数据在内存的结束位置 */ /* 这两个参数是处理文件时使用,类似于缓冲区的pos, last */ off_t file_pos; off_t file_last; /* 由于实际数据可能被包含在多个缓冲区中,则缓冲区的start和end指向 * 这块内存的开始地址和结束地址, * 而pos和last是指向本缓冲区实际包含的数据的开始和结尾 */ u_char *start; /* start of buffer */ u_char *end; /* end of buffer */ ngx_buf_tag_t tag; ngx_file_t *file; /* 指向buffer对应的文件对象 */ /* 当前缓冲区的一个影子缓冲区,即当一个缓冲区复制另一个缓冲区的数据, * 就会发生相互指向对方的shadow指针 */ ngx_buf_t *shadow; /* 为1时,表示该buf所包含的内容在用户创建的内存块中 * 可以被filter处理变更 */ /* the buf's content could be changed */ unsigned temporary:1; /* 为1时,表示该buf所包含的内容在内存中,不能被filter处理变更 */ /* * the buf's content is in a memory cache or in a read only memory * and must not be changed */ unsigned memory:1; /* 为1时,表示该buf所包含的内容在内存中, * 可通过mmap把文件映射到内存中,不能被filter处理变更 */ /* the buf's content is mmap()ed and must not be changed */ unsigned mmap:1; /* 可回收,即这些buf可被释放 */ unsigned recycled:1; unsigned in_file:1; /* 表示buf所包含的内容在文件中 */ unsigned flush:1; /* 刷新缓冲区 */ unsigned sync:1; /* 同步方式 */ unsigned last_buf:1;/* 当前待处理的是最后一块缓冲区 */ unsigned last_in_chain:1;/* 在当前的chain里面,该buf是最后一个,但不一定是last_buf */ unsigned last_shadow:1; unsigned temp_file:1; /* STUB */ int num; }; ~~~ #### chain 数据类型 ngx_chain_t 数据类型是与缓冲区类型 ngx_buf_t 相关的链表结构,定义如下: ~~~ struct ngx_chain_s { ngx_buf_t *buf; /* 指向当前缓冲区 */ ngx_chain_t *next; /* 指向下一个chain,形成chain链表 */ }; typedef struct { ~~~ 链表图如下: ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-09-01_57c7edcf34cf2.jpg) 参考资料: 《深入理解 Nginx 》 《[Nginx 从入门到精通](http://tengine.taobao.org/book/chapter_02.html#id3)》 《[Nginx 代码研究](https://code.google.com/p/nginxsrp/wiki/NginxCodeReview#ngx的内存池)》
';