探索Lua5.2内部实现:虚拟机指令(4) Table

# 探索Lua5.2内部实现:虚拟机指令(4) Table | name | args | desc | |---|---|---| | OP_NEWTABLE | A B C | R(A) := {} (size = B,C) | NEWTABLE在寄存器A处创建一个table对象。B和C分别用来存储这个table数组部分和hash部分的初始大小。初始大小是在编译期计算出来并生成到这个指令中的，目的是使接下来对table的初始化填充不会造成rehash而影响效率。B和C使用“floating point byte”的方法来表示成(eeeeexxx)的二进制形式，其实际值为(1xxx) * 2^(eeeee-1)。 ` local a = {}; ` ~~~ 1 [1] NEWTABLE 0 0 0 2 [1] RETURN 0 1 ~~~ 上面代码生成一个空的table，放入local变量a，B和C参数都为0。 | name | args | desc | |---|---|---| | OP_SETLIST | A B C | R(A)[(C-1)*FPF+i] := R(A+i), 1 <= i <= B | SETLIST用来配合NEWTABLE，初始化表的数组部分使用的。A为保存待设置表的寄存器，SETLIST要将A下面紧接着的寄存器列表(1--B)中的值逐个设置给表的数组部分。当表需要初始化数组元素数量比较小的情况下，例如: ` local a = {1,1,1}; ` ~~~ 1 [1] NEWTABLE 0 3 0 2 [1] LOADK 1 -1 ; 1 3 [1] LOADK 2 -1 ; 1 4 [1] LOADK 3 -1 ; 1 5 [1] SETLIST 0 3 1 ; 1 6 [1] RETURN 0 1 constants (1) for 0x80048eb0: 1 1 ~~~ 第1行先用NEWTABLE构建一个具有3个数组元素的表，让到寄存器0中；然后使用3个LOADK向下面3个寄存器装入常量1；最后使用SETLIST设置表的1~3为寄存器1~寄存器3。如果需要创建一个很大的表，其中包含很多的数组元素，使用如上方法就会遇到一个问题。将这些指按顺序放到寄存器时，会超出寄存器的范围。解决的办法就是按照一个固定大小，将这些数组元素分批进行设置。在Lua中，每批的数量由lopcodes.h中的LFIELDS_PER_FLUSH定义，数量为50。所以，大数量的设置会按照50个一批，先将值设置到表下面的寄存器，然后设置给对应的表项。C代表的就是这一次调用SETLIST设置的是第几批。回到上面的例子，因为只有3个表项，所以1批就搞定了，C的值为1。下面是一个大表的设置： ~~~ local a = { 1,2,3,4,5,6,7,8,9,0, 1,2,3,4,5,6,7,8,9,0, 1,2,3,4,5,6,7,8,9,0, 1,2,3,4,5,6,7,8,9,0, 1,2,3,4,5,6,7,8,9,0, 1,2,3 }; ~~~ ~~~ 1 [1] NEWTABLE 0 30 0 2 [3] LOADK 1 -1 ; 1 3 [3] LOADK 2 -2 ; 2 ... 50 [7] LOADK 49 -9 ; 9 51 [7] LOADK 50 -10 ; 0 52 [7] SETLIST 0 50 1 ; 1 53 [8] LOADK 1 -1 ; 1 54 [8] LOADK 2 -2 ; 2 55 [9] LOADK 3 -3 ; 3 56 [9] SETLIST 0 3 2 ; 2 57 [9] RETURN 0 1 constants (10) for 0x80048eb0: 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 0 ~~~ 可以看到，这个表的初始化使用了两个SETLIST指令。第一个处理前50个，C为1，设置id从(C-1)*50 + 1开始，也就是1。第二个处理余下的3个，C为2，设置的id从(C-1)*50 + 1开始，也就是51。如果数据非常大，导致需要的批次超出了C的表示范围，那么C会被设置成0，然后在SETLIST指令后面生成一个EXTRAARG指令，并用其Ax来存储批次。这与前面说到的LOADKX的处理方法一样，都是为处理超大数据服务的。如果使用核能产生多个返回值的表达式（... 和函数调用）初始化数组项，如果这个初始化不是表构造的最后一项，那么只有第一个返回值会被设置到数组项；如果是最后一项，那么SETLIST中的B会被设置为0，表示从A+1到当前栈顶都用来设置。 SETLIST只负责初始化表的数组部分，对于hash部分，还是通过SETTABLE来初始化。 | name | args | desc | |---|---|---| | OP_GETTABLE | A B C | R(A) := R(B)[RK(C)] | | OP_SETTABLE | A B C | R(A)[RK(B)] := RK(C) | GETTABLE使用C表示的key，将寄存器B中的表项值获取到寄存器A中。SETTABLE设置寄存器A的表的B项为C代表的值。 ~~~ local a = {}; a.x = 1; local b = a.x; ~~~ ~~~ 1 [1] NEWTABLE 0 0 0 2 [2] SETTABLE 0 -1 -2 ; "x" 1 3 [3] GETTABLE 1 0 -1 ; "x" ~~~