第001篇：猎豹移动反病毒工程师part1

我在2014年7月1日参加了猎豹移动（原金山网络）反病毒工程师的电话面试，但是很遗憾，由于我当时准备不足，加上自身水平不够，面试官向我提出的很多技术问题我都没能答出来（这里面既有基础类的问题，也有比较高深的问题），结果没能通过那次的面试。痛定思痛，我认认真真总结出了当时向我提出的所有问题，一共是十多条，我会分为几篇文章来进行剖析。并且根据问题的难易程度，由浅入深进行排序。参考了大量的相关资料，给出了业界较为权威的书籍上的答案，可能对于某些问题，会同时摘录几本书的内容，并且给出知识扩展，以更为全面地看待这个问题。猎豹移动的反病毒工程师（珠海）职位分为社会招聘和校园招聘，其中社会招聘要求如下： **工作职责：** 1、样本鉴定； 2、分析病毒样本并提供解决方案； 3、信息安全技术研究。 **任职要求：** 1、热爱底层工作，对反病毒、逆向工程、系统漏洞等有强烈兴趣； 2、熟悉x86系列汇编语言，能熟练读懂汇编代码； 3、熟练使用IDA、OD等工具进行反汇编； 4、有一定C/C++程序功底； 5、有良好的团队合作意识、善于沟通、有耐心、责任心强； 6、工作细心、积极主动、推动力强、有较快、较好的学习新技术能力。校园招聘的要求如下： **工作职责：** 1、样本鉴定； 2、分析病毒样本并提供解决方案； 3、信息安全技术研究。 **任职要求：** 1、热爱底层开发工作，对反病毒、逆向工程、系统漏洞等有强烈兴趣； 2、熟悉x86系列汇编语言，能熟练读懂汇编代码； 3、具有C/C++程序开发经验者优先。这次所讨论的是三个基础问题，主要关于汇编一些指令的用法。那么接下来就是我所总结的技术面试问题：**1、请解释一下汇编中的ADC和REP指令。** 答：（以下内容均选自软件“**汇编指令助手 V1.1**”）带进位加法指令ADC（Addition Carry）格式：ADC OPRD1,OPRD2 功能：OPRD1←OPRD1+OPRD2+CF 说明：（1）OPRD1为任一通用寄存器或存储器操作数，可以是任意一个通用寄存器，而且还可以是任意一个存储器操作数。OPRD2为立即数，也可以是任意一个通用寄存器操作数。立即数只能用于源操作数。（2）OPRD1和OPRD2均为寄存器是允许的，一个为寄存器而另一个为存储器也是允许的，但不允许两个都是存储器操作数。（3）加法指令运算的结果对CF、SF、OF、PF、ZF、AF都会有影响。以上标志也称为结果标志。（4）该指令对标志位的影响同ADD指令。重复前缀的说明格式：REP ; CX<>0重复执行字符串指令 REPZ/REPE ; CX<>0且ZF=1重复执行字符串指令 REPNZ/REPNE ; CX<>0且ZF=0重复执行字符串指令功能：在串操作指令前加上重复前缀，可以对字符串进行重复处理。由于加上重复前缀后，对应的指令代码是不同的，所以指令的功能便具有重复处理的功能，重复的次数存放在CX寄存器中。说明：（1）REP与MOVS或STOS串操作指令相结合使用，完成一组字符的传送或建立一组相同数据的字符串。（2）REPZ/REPE常用与CMPS串操作指令结合使用，可以完成两组字符串的比较。（3）REPZ/REPE常与SCAS指令结合使用，可以完成在一个字符串中搜索一个关键字。（4）REPNZ/REPNE与CMPS指令结合使用，表示当串未结束（CX=1）且当对应串元素不相同（ZF=0）时，继续重复执行串比较指令。 **知识扩展：** 带借位减去指令SBB（SuBtraction with Borrow）格式：SBB OPRD1,OPRD2 功能：是进行两个操作数的相减再减去CF进位标志位，即从OPRD1←OPRD1-OPRD2-CF，其结果放在OPRD1中。循环控制指令LOOP 格式：LOOP 标号功能：（CX）←（CX）−1，（CX）<>0，则转移至标号处循环执行，直至（CX）=0，继续执行后继指令。说明：（1）本指令是用CX寄存器作为计数器，来控制程序的循环。（2）它属于段内SHORT短类型转移，目的地址必须距本指令在-128到+127个字节的范围内。（以下内容选自**《IDA Pro代码破解揭秘》**第2.4节） EFLAGS寄存器是32位寄存器，包含一组状态、系统标志及控制标志。每个标志由寄存器里一位代表，从0位到31位我们有下面这些标志。 CF：进位标志，指示在算术运算中是否带有进位或借位。用于无符号算术运算。 PF：奇偶标志，为机器中传送信息时可能出错提供校验。当目的操作数中1的个数为偶数时置1（PE），否则置0（PO）。 AF：辅助进位标志，记录运算时低4位（半个字节）产生的进位值。有进位时置1（AC），否则置0（NA）。 ZF：零标志。运算结果为0时置1（ZR），否则置0（NZ）。 SF：符号标志，记录运算结果的符号。结果为负时置1（NG），否则置0（PL）。 TF：陷阱标志，用于单步方式操作。当TF为1时，每条指令执行完后产生陷阱，由系统控制计算机；当TF为0时，CPU正常工作，不产生陷阱。 IF：允许中断标志。当IF为1（EI）时，允许中断；IF为0（DI）时关闭中断。 DF：方向标志，在串处理指令中控制处理信息的方向。当DF置1（DN）时每次操作后，变址寄存器SI和DI减量，这样就使串处理从高地址向低地址方向处理；当DF置0（UP）时，则反之。 OF：溢出标志。在运算过程中，若操作数超出了机器能表示的范围则称为溢出，此时OF标志位为1（OV）；否则置0（NV）。 IOPL（12位到13位）：I/O特权级标志。指出当前运行任务的I/O端口的特权级。 NF：嵌套任务标志。只在当前任务是前一任务的子任务时设置。 RF：回复标志。控制处理器对调试异常的响应。 VM：虚拟8086标志。控制是否启用虚拟8086模式。 AC：对齐检查标志。设置为启用存储器的对齐检查的参考。 VIF：虚拟中断标志。IF的虚拟映像，与VIP标志联合使用。 VIP：虚拟中断标志。确定是否有中断被挂起。 ID：标识标志，确定CPU是否支持CPUID指令。第22到31位当前被保留。（以下内容选自**《黑客免杀攻防》**第9.3节） ~~~ 013A13CC lea edi,dword ptr ss:[ebp-0xC0] 013A13D2 mov ecx,0x30 013A13D7 mov eax,0xCCCCCCCC 013A13DC rep stos dword ptr es:[edi] ;向EDI指向的地址处依次填入EAX中的内容，循环ECX次（也就是填0xCC操作）。这是因为汇编指令 ;“int 3”的OpCode就是0xCC，很显然这样做会大大提高程序的排错能力，如果由于某些不可知的原 ;因导致代码跑到了不该去的地方，那么这些成排的“int 3”指令会马上将其断下来。 ~~~ **2、请说明寄存器EBP与ESP的功能，并解释在大多数函数入口点处的反汇编代码中，这两个寄存器的作用。** 答：（以下内容选自**《0day安全：软件漏洞分析技术第2版》**第2.1.4节）每一个函数都独占自己的栈帧空间。当前正在运行的函数的栈帧总是在栈顶。Win32系统提供两个特殊的寄存器用于标识位于系统顶端的栈帧。（1）ESP：栈指针寄存器（extended stack pointer），其内存放着一个指针，该指针永远指向系统栈最上面一个栈帧的栈顶。（2）EBP：基址指针寄存器（extended base pointer），其内存放着一个指针，该指针永远指向系统栈最上面一个栈帧的底部。注意：EBP指向当前位于系统栈最上边一个栈帧的底部，而不是系统栈的底部。严格说来，“栈帧底部”和“栈底”是不同的概念，本书在叙述中将坚持使用“栈帧底部”这一提法以示区别；ESP所指的栈帧顶部和系统栈的顶部是同一个位置，所以后面的叙述中并不严格区分“栈帧顶部”和“栈顶”的概念。请您注意这里的差异，不要产生概念混淆。函数栈帧：ESP和EBP之间的内存空间为当前栈帧，EBP标识了当前栈帧的底部，ESP标识了当前栈帧的顶部。（以下内容选自**《0day安全：软件漏洞分析技术第2版》**第2.1.5节）函数调用大致包括以下几个步骤 …… （4）栈帧调整：具体包括。保存当前栈帧状态值，以备后面恢复本栈帧时使用（EBP入栈）；将当前栈帧切换到新栈（将ESP值装入EBP，更新栈帧底部）；给新栈帧分配空间（把ESP减去所需空间的大小，抬高栈帧）； …… ~~~ push ebp ;保存旧栈帧的底部 mov ebp,esp ;设置新栈帧的底部（栈帧切换） sub esp,xxx ;设置新栈帧的顶部（抬高栈帧，为新栈帧开辟空间） ~~~ （以下内容选自**《黑客免杀攻防》**第9.3节） ~~~ 013A13C0 >push ebp ;EBP入栈保存（一般情况下将某个寄存器入栈保存的目的只有两个，一个 013A13C0 ;是需要将其通过栈传递给某个函数或代码使用，另外一种情况就是后面的 013A13C0 ;代码要使用到这个寄存器，因此要将其原始的值保存起来， 013A13C0 ;以备恢复） 013A13C1 mov ebp,esp ;然后将堆栈指针ESP的值传递给EBP，如此一来在这个函数内只需要使用 013A13C1 ;EBP就可以对栈进行操作了。这样做的好处是不需要对ESP做过多的操 013A13C1 ;作，从而更好地保证了程序的健壮性（也增加了易读性） 013A13C3 sub esp,0xC0 ;将ESP减0xC0，也就是将栈顶抬高0xC0。这里有一个专业名词叫做 013A13C3 ;“打开栈帧”。但是通过源代码我们知道根本用不了这么大的空间，这 013A13C3 ;是编译器在编译Debug版本时为了增强程序的健壮性与可调试性而做 013A13C3 ;的一件事 ~~~ **3、请说明CALL与RET指令的实现原理。** 答：（以下内容选自**《汇编语言第二版》**王爽著，第10章，仅针对16位系统，而32位及64位系统也可参考） call和ret指令都是转移指令，它们都修改IP，或同时修改CS和IP。它们经常被共同用来实现子程序的设计。 ret指令用栈中数据，修改IP的内容，从而实现近转移； retf指令用栈中的数据，修改CS和IP的内容，从而实现远转移。 CPU执行ret指令时，进行下面两步操作：（1）(IP)=((ss)*16+(sp)) （2）(sp)=(sp)+2 CPU执行retf指令时，进行下面4步操作：（1）(IP)= ((ss)*16+(sp)) （2）(sp)=(sp)+2 （3）(CS)= ((ss)*16+(sp)) （4）(sp)=(sp)+2 可以看出，如果我们用汇编语法来解释ret和retf指令，则： CPU执行ret指令时，相当于进行： ~~~ pop IP ~~~ CPU执行retf指令时，相当于进行： ~~~ pop IP pop CS ~~~ CPU执行call指令时，进行两步操作：（1）将当前的IP或CS和IP压入栈中；（2）转移。 call指令不能实现短转移，除此之外，call指令实现转移的方法和jmp指令的原理相同。（以下内容选自**《0day安全：软件漏洞分析技术第2版》**第2.1.5节）函数调用大致包括以下几个步骤。（1）参数入栈：将参数从右向左依次压入系统栈中。（2）返回地址入栈：将当前代码区调用指令的下一条指令地址压入栈中，供函数返回时继续执行。（3）代码区跳转：处理器从当前代码区跳转到被调用函数的入口处。 …… ~~~ call函数地址 ;call指令将同时完成两项工作：a）向栈中压入当前指令在内存中的位置即保存返回 ;地址。b）跳转到所调用函数的入口地址函数入口处 ~~~ …… 类似地，函数返回的步骤如下。（1）保存返回值：通常将函数的返回值保存在寄存器EAX中。（2）弹出当前栈帧，恢复上一个栈帧。具体包括： ● 在堆栈平衡的基础上，给ESP加上栈帧的大小，降低栈帧，回收当前栈帧的空间。 ● 将当前栈帧底部保存的前栈帧EBP值弹入EBP寄存器，恢复出上一个栈帧。 ● 将函数返回地址弹给EIP寄存器。（3）跳转：按照函数返回地址跳回母函数中继续执行。还是以C语言和Win32平台为例，函数返回时的相关的指令序列如下。 ~~~ add esp,xxx ;降低栈帧，回收当前的栈帧 pop ebp ;将上一个栈帧底部恢复到ebp retn ;这条指令有两个功能：a）弹出当前栈顶元素，即弹出栈帧中的返回地址。 ;至此，栈帧恢复工作完成。b）让处理器跳转到弹出的返回地址，恢复调用前 ;的代码区 ~~~ **本篇文章参考资料：** 1、林文龙，“**汇编指令助手 V1.1**”，小龙软件工作室。 2、[美]DanKaminsky、Justin Ferguson、Jason Larsen、Luis Miras、Walter Pearce（著），看雪论坛翻译小组（译），**《IDA Pro代码破解揭秘》**，人民邮电出版社。 3、任晓珲，**《黑客免杀攻防》**，机械工业出版社。 4、王清（主编），张东辉、周浩、王继刚、赵双（编著），**《0day安全：软件漏洞分析技术（第2版）》**，电子工业出版社。 5、王爽，**《汇编语言（第2版）》**，清华大学出版社。