探索Lua5.2内部实现:虚拟机指令(4) Table

最后更新于:2022-04-01 07:09:47

  # 探索Lua5.2内部实现:虚拟机指令(4) Table | name | args | desc | |---|---|---| | OP_NEWTABLE | A B C | R(A) := {} (size = B,C) | NEWTABLE在寄存器A处创建一个table对象。B和C分别用来存储这个table数组部分和hash部分的初始大小。初始大小是在编译期计算出来并生成到这个指令中的,目的是使接下来对table的初始化填充不会造成rehash而影响效率。B和C使用“floating point byte”的方法来表示成(eeeeexxx)的二进制形式,其实际值为(1xxx) * 2^(eeeee-1)。 ` local a = {};  ` ~~~ 1   [1] NEWTABLE    0 0 0   2   [1] RETURN      0 1    ~~~ 上面代码生成一个空的table,放入local变量a,B和C参数都为0。 | name | args | desc | |---|---|---| | OP_SETLIST | A B C | R(A)[(C-1)*FPF+i] := R(A+i), 1 <= i <= B | SETLIST用来配合NEWTABLE,初始化表的数组部分使用的。A为保存待设置表的寄存器,SETLIST要将A下面紧接着的寄存器列表(1--B)中的值逐个设置给表的数组部分。 当表需要初始化数组元素数量比较小的情况下,例如: ` local a = {1,1,1};  ` ~~~     1   [1] NEWTABLE    0 3 0       2   [1] LOADK       1 -1    ; 1       3   [1] LOADK       2 -1    ; 1       4   [1] LOADK       3 -1    ; 1       5   [1] SETLIST     0 3 1   ; 1       6   [1] RETURN      0 1   constants (1) for 0x80048eb0:       1   1    ~~~ 第1行先用NEWTABLE构建一个具有3个数组元素的表,让到寄存器0中;然后使用3个LOADK向下面3个寄存器装入常量1;最后使用SETLIST设置表的1~3为寄存器1~寄存器3。 如果需要创建一个很大的表,其中包含很多的数组元素,使用如上方法就会遇到一个问题。将这些指按顺序放到寄存器时,会超出寄存器的范围。解决的办法就是按照一个固定大小,将这些数组元素分批进行设置。在Lua中,每批的数量由lopcodes.h中的LFIELDS_PER_FLUSH定义,数量为50。所以,大数量的设置会按照50个一批,先将值设置到表下面的寄存器,然后设置给对应的表项。C代表的就是这一次调用SETLIST设置的是第几批。回到上面的例子,因为只有3个表项,所以1批就搞定了,C的值为1。 下面是一个大表的设置: ~~~ local a =    {       1,2,3,4,5,6,7,8,9,0,       1,2,3,4,5,6,7,8,9,0,       1,2,3,4,5,6,7,8,9,0,       1,2,3,4,5,6,7,8,9,0,       1,2,3,4,5,6,7,8,9,0,       1,2,3   };   ~~~ ~~~     1   [1] NEWTABLE    0 30 0       2   [3] LOADK       1 -1    ; 1       3   [3] LOADK       2 -2    ; 2    ...       50  [7] LOADK       49 -9   ; 9       51  [7] LOADK       50 -10  ; 0       52  [7] SETLIST     0 50 1  ; 1       53  [8] LOADK       1 -1    ; 1       54  [8] LOADK       2 -2    ; 2       55  [9] LOADK       3 -3    ; 3       56  [9] SETLIST     0 3 2   ; 2       57  [9] RETURN      0 1   constants (10) for 0x80048eb0:       1   1       2   2       3   3       4   4       5   5       6   6       7   7       8   8       9   9       10  0    ~~~ 可以看到,这个表的初始化使用了两个SETLIST指令。第一个处理前50个,C为1,设置id从(C-1)*50 + 1开始,也就是1。第二个处理余下的3个,C为2,设置的id从(C-1)*50 + 1开始,也就是51。 如果数据非常大,导致需要的批次超出了C的表示范围,那么C会被设置成0,然后在SETLIST指令后面生成一个EXTRAARG指令,并用其Ax来存储批次。这与前面说到的LOADKX的处理方法一样,都是为处理超大数据服务的。 如果使用核能产生多个返回值的表达式(... 和 函数调用)初始化数组项,如果这个初始化不是表构造的最后一项,那么只有第一个返回值会被设置到数组项;如果是最后一项,那么SETLIST中的B会被设置为0,表示从A+1到当前栈顶都用来设置。 SETLIST只负责初始化表的数组部分,对于hash部分,还是通过SETTABLE来初始化。 | name | args | desc | |---|---|---| | OP_GETTABLE | A B C | R(A) := R(B)[RK(C)] | | OP_SETTABLE | A B C | R(A)[RK(B)] := RK(C) | GETTABLE使用C表示的key,将寄存器B中的表项值获取到寄存器A中。SETTABLE设置寄存器A的表的B项为C代表的值。 ~~~ local a = {};   a.x = 1;   local b = a.x;   ~~~ ~~~ 1   [1] NEWTABLE    0 0 0   2   [2] SETTABLE    0 -1 -2 ; "x" 1   3   [3] GETTABLE    1 0 -1  ; "x"   ~~~
';