4.3 循环结构
最后更新于:2022-04-02 05:17:43
## 4.3 循环结构
实际应用中有许多具有规律性的重复操作,因此在程序中就需要重复执行某些语句。循环结构是在一定条件下反复执行某段程序的流程结构,被反复执行的程序被称为循环体。循环语句是由循环体及循环的终止条件两部分组成的。
PHP中的循环结构有4种:while、for、foreach、do while,接下来我们分析下这几个结构的具体的实现。
### 4.3.1 while循环
while循环的语法:
```php
while(expression)
{
statement;//循环体
}
```
while的结构比较简单,由两部分组成:expression、statement,其中expression为循环判断条件,当expression为true时重复执行statement,具体的语法规则:
```c
statement:
...
| T_WHILE '(' expr ')' while_statement { $$ = zend_ast_create(ZEND_AST_WHILE, $3, $5); }
...
;
while_statement:
statement { $$ = $1; }
| ':' inner_statement_list T_ENDWHILE ';' { $$ = $2; }
;
```
从while语法规则可以看出,在解析时会创建一个`ZEND_AST_WHILE`节点,expression、statement分别保存在两个子节点中,其AST如下:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/900d7edc466058e56803d180ac97b024_363x201.png)
while编译的过程也比较简单,比较特别的是while首先编译的是循环体,然后才是循环判断条件,更像是do while,编译过程大致如下:
* __(1)__ 首先编译一条ZEND_JMP的opcode,这条opcode用来跳到循环判断条件expression的位置,由于while是先编译循环体再编译循环条件,所以此时还无法确定具体的跳转值;
* __(2)__ 编译循环体statement;编译完成后更新步骤(1)中ZEND_JMP的跳转值;
* __(3)__ 编译循环判断条件expression;
* __(4)__ 编译一条ZEND_JMPNZ的opcode,这条opcode用于循环判断条件执行完以后跳到循环体的,如果循环条件成立则通过此opcode跳到循环体开始的位置,否则继续往下执行(即:跳出循环)。
具体的编译过程:
```c
void zend_compile_while(zend_ast *ast)
{
zend_ast *cond_ast = ast->child[0];
zend_ast *stmt_ast = ast->child[1];
znode cond_node;
uint32_t opnum_start, opnum_jmp, opnum_cond;
//(1)编译ZEND_JMP
opnum_jmp = zend_emit_jump(0);
zend_begin_loop(ZEND_NOP, NULL);
//(2)编译循环体statement,opnum_start为循环体起始位置
opnum_start = get_next_op_number(CG(active_op_array));
zend_compile_stmt(stmt_ast);
//设置ZEND_JMP opcode的跳转值
opnum_cond = get_next_op_number(CG(active_op_array));
zend_update_jump_target(opnum_jmp, opnum_cond);
//(3)编译循环条件expression
zend_compile_expr(&cond_node, cond_ast);
//(4)编译ZEND_JMPNZ,用于循环条件成立时跳回循环体开始位置:opnum_start
zend_emit_cond_jump(ZEND_JMPNZ, &cond_node, opnum_start);
zend_end_loop(opnum_cond);
}
```
编译后opcode整体如下:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/c5c054e86943e0c61b55245569b37154_378x367.png)
运行时首先执行`ZEND_JMP`,跳到while条件expression处开始执行,然后由`ZEND_JMPNZ`对条件的执行结果进行判断,如果条件成立则跳到循环体statement起始位置开始执行,如果条件不成立则继续向下执行,跳出while,第一次循环执行以后将不再执行`ZEND_JMP`,后续循环只有靠`ZEND_JMPNZ`控制跳转,循环体执行完成后接着执行循环判断条件,进行下一轮循环的判断。
> __Note:__ 实际执行时可能会省略`ZEND_JMPNZ`这一步,这是因为很多while条件expression执行完以后会对下一条opcode进行判断,如果是`ZEND_JMPNZ`则直接根据条件成立与否进行快速跳转,不需要再由`ZEND_JMPNZ`判断,比如:
>
> $a = 123;
> while($a > 100){
> echo "yes";
> }
> `$a > 100`对应的opcode:ZEND_IS_SMALLER,执行时发现$a与100类型可以直接比较(都是long),则直接就能知道循环条件的判断结果,这种情况下将会判断下一条opcode是否为ZEND_JMPNZ,是的话直接设置下一条要执行的opcode,这样就不需要再单独执行依次ZEND_JMPNZ了。
>
> 上面的例子如果`$a = '123';`就不会快速进行处理了,而是按照正常的逻辑调用ZEND_JMPNZ。
### 4.3.2 do while循环
do while与while非常相似,唯一的区别在于do while第一次执行时不需要判断循环条件。
do while循环的语法:
```php
do{
statement;//循环体
}while(expression)
```
do while编译过程与while的基本一致,不同的地方在于do while没有`ZEND_JMP`这条opcode:
```c
void zend_compile_do_while(zend_ast *ast)
{
zend_ast *stmt_ast = ast->child[0];
zend_ast *cond_ast = ast->child[1];
znode cond_node;
uint32_t opnum_start, opnum_cond;
//(1)编译循环体statement,opnum_start为循环体起始位置
opnum_start = get_next_op_number(CG(active_op_array));
zend_compile_stmt(stmt_ast);
//(2)编译循环判断条件expression
opnum_cond = get_next_op_number(CG(active_op_array));
zend_compile_expr(&cond_node, cond_ast);
//(3)编译ZEND_JMPNZ
zend_emit_cond_jump(ZEND_JMPNZ, &cond_node, opnum_start);
}
```
编译后的结果:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/449874d21b056771b06a075a3dd80c55_410x339.png)
运行时首先执行循环体statement,然后执行循环判断条件,如果条件成立跳到循环体起始位置,否则结束循环。
### 4.3.3 for循环
for循环语法:
```php
for (init expr; condition expr; loop expr){
statement
}
```
init expr在循环开始前无条件执行一次,后面循环不再执行;condition expr在每次循环开始前运算,是循环的判断条件,如果值为true,则继续循环,执行循环体,如果值为false,则终止循环;loop expr在每次循环体执行完以后被执行。
for的语法规则:
```c
statement:
...
| T_FOR '(' for_exprs ';' for_exprs ';' for_exprs ')' for_statement
{ $$ = zend_ast_create(ZEND_AST_FOR, $3, $5, $7, $9); }
...
;
```
从语法规则可以看出,for被编译为`ZEND_AST_FOR`节点,包含4个子节点,分别为:expr1、expr2、expr3、statement。
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/4fc2a7a02bd01fae2fc48230b858ace3_708x283.png)
for的编译与while类似,只是多了init expr、loop expr两部分,编译过程大致如下:
* __(1)__ 首先编译初始化表达式:init expr;
* __(2)__ 编译一条`ZEND_JMP`的opcode,此opcode用于跳到条件expression位置,具体跳转值需要后面才能确定;
* __(3)__ 编译循环体statement;
* __(4)__ 编译loop expr;然后设置步骤(2)中`ZEND_JMP`的跳转值;
* __(5)__ 编译循环条件:condition expr;
* __(6)__ 编译一条`ZEND_JMPNZ`,此opcode用于循环条件成立时跳到循环体起始位置。
具体编译过程:
```c
void zend_compile_for(zend_ast *ast)
{
zend_ast *init_ast = ast->child[0];
zend_ast *cond_ast = ast->child[1];
zend_ast *loop_ast = ast->child[2];
zend_ast *stmt_ast = ast->child[3];
znode result;
uint32_t opnum_start, opnum_jmp, opnum_loop;
//(1)编译init expression
zend_compile_expr_list(&result, init_ast);
zend_do_free(&result);
//(2)编译ZEND_JMP
opnum_jmp = zend_emit_jump(0);
//opnum_start是循环体起始位置
opnum_start = get_next_op_number(CG(active_op_array));
//(3)编译循环体
zend_compile_stmt(stmt_ast);
//(4)编译loop expression
opnum_loop = get_next_op_number(CG(active_op_array));
zend_compile_expr_list(&result, loop_ast);
zend_do_free(&result);
//设置ZEND_JMP跳转值
zend_update_jump_target_to_next(opnum_jmp);
//(5)编译循环条件expression
zend_compile_expr_list(&result, cond_ast);
zend_do_extended_info();
//(6)编译ZEND_JMPNZ
zend_emit_cond_jump(ZEND_JMPNZ, &result, opnum_start);
}
```
最终编译结果:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/e257f55e77a2b723a420c0140d503609_424x474.png)
运行时首先执行初始化表达式:init expression,然后执行`ZEND_JMP`跳到循环条件expression处,如果条件成立则执行`ZEND_JMPNZ`跳到循环体起始位置依次执行循环体、loop expression,如果条件不成立则终止循环,第一次循环之后就是:`循环条件->ZEND_JMPNZ->循环体->loop expression`之间循环了。
### 4.3.4 foreach循环
foreach是PHP针对数组、对象提供的一种遍历方式,foreach语法:
```php
foreach (array_expression as $key => $value){
statement
}
```
遍历arraiy_expression时每次循环会把当前单元的值赋给$value,当前单元的键值赋给$key,其中$key可以省略,$value前也可以加"&"表示引用单元的值。
foreach的语法规则:
```c
statement:
...
//省略key的规则: foreach($array as $v){ ... }
| T_FOREACH '(' expr T_AS foreach_variable ')' foreach_statement
{ $$ = zend_ast_create(ZEND_AST_FOREACH, $3, $5, NULL, $7); }
//有key的规则: foreach($array as $k=>$v){ ... }
| T_FOREACH '(' expr T_AS foreach_variable T_DOUBLE_ARROW foreach_variable ')' foreach_statement
{ $$ = zend_ast_create(ZEND_AST_FOREACH, $3, $7, $5, $9); }
...
;
```
foreach在编译阶段解析为`ZEND_AST_FOREACH`节点,包含4个子节点,分别表示:遍历的数组或对象、遍历的value、遍历的key以及循环体,生成的AST类似这样:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/3e3ac2b9c5592bc1ac658d0dbb1622c9_613x240.png)
如果value是指向数组或对象成员的引用,则value对应的节点类型为`ZEND_AST_REF`。
相对上面几种常规的循环结构,foreach的实现略显复杂:$key、$value实际就是两个普通的局部变量,遍历的过程就是对两个局部变量不断赋值、更新的过程,以数组为例,首先将数组拷贝一份用于遍历(只拷贝zval,value还是指向同一份),从arData第一个元素开始,把Bucket.zval.value值赋值给$value,把Bucket.key(或Bucket.h)赋值给$key,然后更新迭代位置:将下一个元素的位置记录在`zval.u2.fe_iter_idx`中,这样下一轮遍历时直接从这个位置开始,这也是遍历前为什么要拷贝一份zval用于遍历的原因,如果发现`zval.u2.fe_iter_idx`已经到达arData末尾了则结束遍历,销毁一开始拷贝的zval。举个例子来看:
```php
$arr = array(1,2,3);
foreach($arr as $k=>$v){
echo $v;
}
```
局部变量对应的内存结构:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/58dfcbbf26b84c0fa1b5e26b4d402fd4_733x413.png)
如果value是引用则在循环前首先将原数组或对象重置为引用类型,然后新分配一个zval指向这个引用,后面的过程就与上面的一致了,仍以上面的例子为例,如果是:`foreach($arr as $k=>&$v){ ... }`则:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/533a8a2476e3d816b3eea1f557ff6069_845x408.png)
了解了foreach的实现、运行机制我们再回头看下其编译过程:
* __(1)__ 编译"拷贝"数组/对象操作的opcode:`ZEND_FE_RESET_R`,如果value是引用则是`ZEND_FE_RESET_RW`,执行时如果发现数组或对象属性为空则直接跳出遍历,所以这条opcode还需要知道跳出的位置,这个位置需要编译完foreach以后才能确定;
* __(2)__ 编译fetch数组/对象当前单元key、value的opcode:`ZEND_FE_FETCH_R`,如果是引用则是`ZEND_FE_FETCH_RW`,此opcode还需要知道当遍历已经到达数组末尾时跳出遍历的位置,与步骤(1)的opcode相同,另外还有一个关键操作,前面已经说过遍历的key、value实际就是普通的局部变量,它们的内存存储位置正是在这一步分配确定的,分配过程与普通局部变量的过程完全相同,如果value不是一个CV变量(比如:foreach($arr as $v["xx"]){...})则还会编译其它操作的opcode;
* __(3)__ 如果foreach定义了key则编译一条赋值opcode,此操作是对key进行赋值;
* __(4)__ 编译循环体statement;
* __(5)__ 编译跳回遍历开始位置的opcode:`ZEND_JMP`,一次遍历结束时会跳回步骤(2)编译的opcode处进行下次遍历;
* __(6)__ 设置步骤(1)、(2)两条opcode跳过的opcode数;
* __(7)__ 编译`ZEND_FE_FREE`,此操作用于释放步骤(1)"拷贝"的数组。
最终编译后的结构:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/4f7917762af318aa95eb04d1509832f2_426x440.png)
运行时的步骤:
* __(1)__ 执行`ZEND_FE_RESET_R`,过程上面已经介绍了;
* __(2)__ 执行`ZEND_FE_FETCH_R`,此opcode的操作主要有三个:检查遍历位置是否到达末尾、将数组元素的value赋值给$value、将数组元素的key赋值给一个临时变量(注意与value不同);
* __(3)__ 如果定义了key则执行`ZEND_ASSIGN`,将key的值从临时变量赋值给$key,否则跳到步骤(4);
* __(4)__ 执行循环体的statement;
* __(5)__ 执行`ZEND_JMPNZ`跳回步骤(2);
* __(6)__ 遍历结束后执行`ZEND_FE_FREE`释放数组。
PHP中还有几个与遍历相关的函数:
* current() - 返回数组中的当前单元
* each() - 返回数组中当前的键/值对并将数组指针向前移动一步
* end() - 将数组的内部指针指向最后一个单元
* next() - 将数组中的内部指针向前移动一位
* prev() - 将数组的内部指针倒回一位
';