状态机与插件

最后更新于:2022-04-01 15:57:14

Lighttpd启动时完成了一系列初始化操作后,就进入了一个包含11个状态的有限状态机中。 每个连接都是一个connection实例(con),状态的切换取决于con->state。 lighttpd经过初步处理后将con的基本信息初始化,而插件对事件的处理就是针对con进行的,它拿到con后按照业务需要进行相应处理,然后再交还给lighttpd,lighttpd根据con中的信息完成响应。 状态定义如下: ~~~ typedef enum { CON_STATE_CONNECT, //connect 连接开始 CON_STATE_REQUEST_START, //reqstart 开始读取请求 CON_STATE_READ, //read 读取并解析请求 CON_STATE_REQUEST_END, //reqend 读取请求结束 CON_STATE_READ_POST, //readpost 读取post数据 CON_STATE_HANDLE_REQUEST, //handelreq 处理请求 CON_STATE_RESPONSE_START, //respstart 开始回复 CON_STATE_WRITE, //write 回复写数据 CON_STATE_RESPONSE_END, //respend 回复结束 CON_STATE_ERROR, //error 出错 CON_STATE_CLOSE //close 连接关闭 } connection_state_t; ~~~ 下面就是lighttpd的状态机: ![这里写图片描述](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-02-25_56ceaefa9d729.jpg "") 在每个连接中都会保存这样一个状态机,用以表示当前连接的状态。 在连接建立以后,在connections.c/connection_accpet()函数中,lighttpd调用connection_set_state()函数,将新建立的连接的状态设置为CON_STATE_REQUEST_START。在这个状态中,lighttpd记录连接建立的时间等信息。 整个状态机的核心函数是connections.c/ connection_state_machine()函数。 函数的主体部分删减之后如下: ~~~ int connection_state_machine(server * srv, connection * con) { int done = 0, r; while (done == 0) { size_t ostate = con -> state; int b; //根据当前状态机的状态进行相应的处理和状态转换。 switch (con->state) { case CON_STATE_REQUEST_START: /* transient */ //do something case CON_STATE_REQUEST_END: /* transient */ //do something case CON_STATE_HANDLE_REQUEST: //do something case CON_STATE_RESPONSE_START: //do something case CON_STATE_RESPONSE_END: /* transient */ //do something case CON_STATE_CONNECT: //do something case CON_STATE_CLOSE: //do something case CON_STATE_READ_POST: //do something case CON_STATE_READ: //do something case CON_STATE_WRITE: //do something case CON_STATE_ERROR: /* transient */ //do something default: //do something break; }//end of switch(con -> state) ... if (done == -1) { done = 0; } else if (ostate == con->state) { done = 1; } } /* something else */ /* 将fd加入到fdevent系统中,等待IO事件。 * 当有数据可读的时候,在main函数中,lighttpd调用这个fd对应的handle函数, * 这里就是connection_handle_fdevent()函数。 * 这个函数一开始将连接加入到了joblist(作业队列)中。 */ switch (con->state) { case CON_STATE_READ_POST: case CON_STATE_READ: case CON_STATE_CLOSE: fdevent_event_add(srv->ev, &(con->fde_ndx), con->fd, FDEVENT_IN); break; case CON_STATE_WRITE: /* request write-fdevent only if we really need it * - if we have data to write * - if the socket is not writable yet */ if (!chunkqueue_is_empty(con->write_queue) && (con->is_writable == 0)&& (con->traffic_limit_reached == 0)) { fdevent_event_add(srv->ev, &(con->fde_ndx), con->fd, FDEVENT_OUT); } else { fdevent_event_del(srv->ev, &(con->fde_ndx), con->fd); } break; default: fdevent_event_del(srv->ev, &(con->fde_ndx), con->fd); break; } return 0; } ~~~ 这个函数首先根据当前的状态进入对应的switch分支执行相应的动作,然后根据情况进入下一个状态。 跳出switch语句之后,如果连接的状态没有改变,说明连接读写数据还没有结束,但是需要等待IO事件,这时跳出循环,等待IO事件。 如果在处理的过程中不需要等待IO事件,那么在while循环中,连接将被处理完毕并关闭。 在我们的main函数中,之前讨论过,在一个while循环中,处理超时,处理IO时间,之后有下面这段代码: ~~~ for (ndx = 0; ndx < srv->joblist->used; ndx++) { connection *con = srv->joblist->ptr[ndx]; handler_t r; connection_state_machine(srv, con); switch(r = plugins_call_handle_joblist(srv, con)) { case HANDLER_FINISHED: case HANDLER_GO_ON: break; default: log_error_write(srv, __FILE__, __LINE__, "d", r); break; } con->in_joblist = 0; } ~~~ 这段代码对joblist中的所有连接依次调用connection_state_machine()函数进行处理。 下面说明下各状态的主要内容: ~~~ CON_STATE_CONNECT 清除待读取队列中的数据-chunkqueue_reset(con->read_queue); 置con->request_count = 0。(本次连接还未处理过请求) CON_STATE_REQUEST_START /*transient */ 记录事件起始时间; con->request_count++(一次长连接最多可以处理的请求数量是有限制的); 转移到CON_STATE_READ状态。 CON_STATE_READ和CON_STATE_READ_POST connection_handle_read_state(srv,con); CON_STATE_REQUEST_END /*transient */ http_request_parse(srv, con); 解析请求,若是POST请求则转移到CON_STATE_READ_POST状态, 否则转移到CON_STATE_HANDLE_REQUEST状态。 CON_STATE_HANDLE_REQUEST http_response_prepare(srv, con); 函数中调用 handle_uri_raw; handle_uri_clean; handle_docroot; handle_physical; handle_subrequest_start; handle_subrequest。 如果函数返回了HANDLER_FINISHED,且con->mode!=DIRECT(事件已经被我们的业务插件接管), 则直接进入CON_STATE_RESPONSE_START。 否则lighttpd会做一些处理后再进入CON_STATE_RESPONSE_START状态。 如果函数返回了HANDLER_WAIT_FOR_FD或 HANDLER_WAIT_FOR_EVENT, 状态依旧会停留在CON_STATE_HANDLE_REQUEST,等待事件或数据。 如果函数返回了HANDLER_ERROR,进入到CON_STATE_ERROR状态。 CON_STATE_RESPONSE_START connection_handle_write_prepare(srv,con); CON_STATE_WRITE connection_handle_write(srv,con); CON_STATE_RESPONSE_END 调用插件的handle_request_done接口。 如果是长连接,重新回到CON_STATE_REQUEST_START;否则调用插件的handle_connection_close接口。 执行connection_close(srv, con);和connection_reset(srv, con);将连接关闭。 CON_STATE_ERROR /* transient */ 调用插件handle_request_done; 调用插件handle_connection_close; 执行connection_close将连接关闭。 CON_STATE_CLOSE connection_close(srv, con);将连接关闭。 ~~~ 以上是状态机的概况。 总览了状态机,我们知道状态机会针对相应的阶段对事件进行处理,那么状态机是如何处理这些事件的? 事实上,对于事件的处理,一部分是由lighttpd完成的,而一部分是由插件完成的。插件中那些负责事件处理的接口分布在某几个状态中。我们只需在插件的各个阶段完成指定工作并返回相应的返回值,就可以促使状态机完成状态切换,完成事件的整套处理流程,并最终由lighttpd完成事件的响应。 在插件中,我们可以编写代码来注册lighttpd提供的回调接口,lighttpd在初始化阶段、状态机执行阶段、退出阶段会分别调用这些回调函数,完成插件的实例化,初始化,连接重置,事件处理,插件释放等功能。 要了解lighttpd对插件的调用方式,需要明白一个概念:事件接管。 对于每个事件,都有一个mode字段(con->mode)。该字段的定义: ~~~ typedef enum { DIRECT, EXTERNAL } connection_type; ~~~ 连接对象有一个字段mode用来标识该连接是最初由服务器accept产生的客户端连接还是插件产生的其他辅助连接,当mode=DIRECT时表示对应连接由lighttpd服务器accept产生,mode!=DIRECT时表示对应连接是由插件产生的。 事件(con)初始化时mode是DIRECT;connection_reset(srv,con); lighttpd在大部分流程中会在入口检查到mode != DIRECT时直接返回GO_ON。即:此事件由用户插件接管,lighttpd不参与。 用户编写的插件应通过将mode置为插件自身的ID达到接管的作用。插件ID是在插件加载时由插件的加载顺序确定的,是插件的唯一标识。 用户编写插件在每个接口的一开始应该判断mode是否等于自身的ID,若相等才能继续执行,否则直接退出,返回GO_ON。 了解了以上概念之后,我们就可以理解lighttpd对插件的调用方式了: 在lighttpd需要调用插件某一个阶段的接口函数时,会对所有插件注册在该处的接口顺序调用,顺序与插件加载顺序相同。例如:调用uri_raw接口,会先调用A插件的mod_A_uri_raw,然后调用B插件的mod_B_uri_raw,直到将所有已加载插件这个位置的接口全部调用完成。但实际处理这次事件通常只有一个插件,即插件ID与mode相同的那个插件。 因此,假设在CON_STATE_HANDLE_REQUEST状态,lighttpd调用了插件的handle_uri_raw接口,但是我们有多个插件,每个插件都注册了handle_uri_raw这个接口,lighttpd也能辨别出要使用哪个插件。 如果插件在处理事件的过程中,想让lighttpd接管,还需要把mode置为DIRECT才行。 以上是lighttpd状态机和插件的总览概况。
';