探索Lua5.2内部实现:虚拟机指令(2) MOVE & LOAD
最后更新于:2022-04-01 07:09:43
# 探索Lua5.2内部实现:虚拟机指令(2) MOVE & LOAD
| name | args | desc |
|---|---|---|
| OP_MOVE | A B | R(A) := R(B) |
OP_MOVE用来将寄存器B中的值拷贝到寄存器A中。由于Lua是register based vm,大部分的指令都是直接对寄存器进行操作,而不需要对数据进行压栈和弹栈,所以需要OP_MOVE指令的地方并不多。最直接的使用之处就是将一个local变量复制给另一个local变量时:
~~~
local a;
local b = a;
~~~
~~~
1 [1] LOADNIL 0 0
2 [2] MOVE 1 0
3 [2] RETURN 0 1
~~~
在编译过程中,Lua会将每个local变量都分配到一个指定的寄存器中。在运行期,lua使用local变量所对应的寄存器id来操作local变量,而local变量的名字除了提供debug信息外,没有其他作用。
在这里a被分配给register 0,b被分配给register 1。第二行的MOVE表示将a(register 0)的值赋给b(register 1)。其他使用的地方基本都是对寄存器的位置有特殊要求的地方,比如函数参数的传递等等。
| name | args | desc |
|---|---|---|
| OP_LOADK | A Bx | R(A) := Kst(Bx) |
LOADK将Bx表示的常量表中的常量值装载到寄存器A中。很多其他指令,比如数学操作指令,其本身可以直接从常量表中索引操作数,所以可以不依赖于LOADK指令。
~~~
local a=1;
local b="foo";
~~~
~~~
1 [1] LOADK 0 -1 ; 1
2 [2] LOADK 1 -2 ; "foo"
3 [2] RETURN 0 1
onstants (2) for 0x80048eb0:
1 1
2 "foo"
~~~
| name | args | desc |
|---|---|---|
| OP_LOADKX | A | R(A) := Kst(extra arg) |
LOADKX是lua5.2新加入的指令。当需要生成LOADK指令时,如果需要索引的常量id超出了Bx所能表示的有效范围,那么就生成一个LOADKX指令,取代LOADK指令,并且接下来立即生成一个EXTRAARG指令,并用其Ax来存放这个id。5.2的这个改动使得一个函数可以处理超过262143个常量。
| name | args | desc |
|---|---|---|
| OP_LOADBOOL | A B C | R(A) := (Bool)B; if (C) pc++ |
LOADBOOL将B所表示的boolean值装载到寄存器A中。B使用0和1分别代表false和true。C也表示一个boolean值,如果C为1,就跳过下一个指令。
` local a = true; `
~~~
1 [1] LOADBOOL 0 1 0
2 [1] RETURN 0 1
~~~
C在这里的作用比较特殊。要了解C的具体用处,首先要知道lua中对于逻辑和关系表达式是如何处理的,比如:
` local a = 1 `
对于上面的代码,一般我们会认为lua应该先对1<2求出一个boolean值,然后放入到a中。然而实际上产生出来的代码为:
~~~
1 [1] LT 1 -1 -2 ; 1 2
2 [1] JMP 0 1 ; to 4
3 [1] LOADBOOL 0 0 1
4 [1] LOADBOOL 0 1 0
5 [1] RETURN 0 1
onstants (2) for 0x80048eb0:
1 1
2 2
~~~
可以看到,lua生成了LT和JMP指令,另外再加上两个LOADBOOL对于a赋予不同的boolean值。LT(后面会详细讲解)指令本身并不产生一个boolean结果值,而是配合后面紧跟的JMP实现true和false的不同跳转。如果LT评估为true,就继续执行,也就是执行到JMP,然后调转到4,对a赋予true;否则就跳过下一条指令到达第三行,对a赋予false,并且跳过下一个指令。所以上面的代码实际的意思被转化为:
~~~
local a;
if 1
a = true;
else
a = false;
end
~~~
逻辑或者关系表达式之所以被设计成这个样子,主要是为if语句和循环语句所做的优化。不用将整个表达式估值成一个boolean值后再决定跳转路径,而是评估过程中就可以直接跳转,节省了很多指令。
C的作用就是配合这种使用逻辑或关系表达式进行赋值的操作,他节省了后面必须跟的一个JMP指令。
| name | args | desc |
|---|---|---|
| OP_LOADNIL | A B | R(A), R(A+1), ..., R(A+B) := nil |
LOADNIL将使用A到B所表示范围的寄存器赋值成nil。用范围表示寄存器主要为了对以下情况进行优化:
~~~
local a,b,c;
~~~
~~~
1 [1] LOADNIL 0 2
2 [1] RETURN 0 1
~~~
对于连续的local变量声明,使用一条LOADNIL指令就可以完成,而不需要分别进行赋值。
对于一下情况
~~~
local a;
local b = 0;
local c;
~~~
~~~
1 [1] LOADNIL 0 0
2 [2] LOADK 1 -1 ; 0
3 [3] LOADNIL 2 0
~~~
在Lua5.2中,a和c不能被合并成一个LOADNIL指令。所以以上写法理论上会生成更多的指令,应该予以避免,而改写成
~~~
local a,c;
local b = 0;
~~~