unidbg逆向工程:原理与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 unidbg的符号调用与地址调用

这一节,我们来学习unidbg提供的两种模拟调用方式:符号调用和地址调用。

2.2.1 unidbg主动调用前置准备

首先重新编译一下APK,使它生成全架构的so文件,如图2-11所示。

将Android Studio左侧项目结构图切换为Project视图,然后找到项目中编译出来的app-debug.apk,如图2-12所示。

图2-11 编译APK操作

图2-12 app-debug.apk目录

接着使用终端进入相应目录,使用以下命令解压APK文件。

unzip app-debug.apk

使用IDEA打开之前的unidbg项目,在unidbg-android/src/test/java下依照引用so文件的全类名来编写相同的类。然后将上面解压的APK中的lib/arm64-v8a中的so及APK文件都复制到该目录下,最终效果如图2-13所示。

图2-13 代码编写准备界面

2.2.2 unidbg主动调用so函数

首先编写MainActivity构造方法来模拟so执行所需的环境。

由代码可知,前4行将常用的变量存储为成员变量,以便在不同的成员函数间使用。

初始化环境的代码与1.3.3节的代码大致相同。只是在创建vm虚拟机时,传入了原本的APK文件,使unidbg可以依据APK为模拟环境做一些初始化工作。同时通过加载so文件得到的dalvikModule对象的getModule()方法,得到操作so的对象并将其保存到成员变量中备用。

unidbg支持两种调用so中函数的方式:符号调用和地址调用。

符号调用方式的代码示例如下:

public void callMd5(){

DvmObject obj=ProxyDvmObject.createObject(vm,this);

String data="dta";

DvmObject dvmObject=obj.callJniMethodObject(emulator,"md5(Ljava/lang/

String;)Ljava/lang/String;",data);

String result=(String)dvmObject.getValue();

System.out.println("[symble]Call the so md5 function result is==>"+result);

}

相关代码与1.3.3节的示例代码区别不大。先根据传入的this参数生成一个调用so的代理对象obj,该处传入的this参数即com.dta.lesson2.MainActivity对象,如果全类名无法与原APK中调用so的java类对应,则unidbg将无法补全相应的函数名。

由于md5()方法的返回值为String类型,所以应当使用callJniMethodObject()方法来调用md5()方法,同时使用DvmObject对象来接收该返回值。除了基本类型之外,其余的类型都要返回Object对象,相关的API如图2-14所示。

图2-14 unidbg支持的callJniMethod相关的API

对于得到的md5()方法的结果DvmObject对象,我们可以通过调用它的getValue()方法来获得相应的值。由于我们已知函数的返回值为String类型,因此可以将其强制转换为String类型,之后将获得的值输出。

unidbg中另一种常用的函数调用方式是地址调用。一般情况下,我们所需的函数可能没有导出,所以无法进行符号调用。

地址调用方式的代码示例如下:

在使用符号调用方式时,unidbg帮助我们完成了很多操作,例如拼接函数名、填充参数等。但在使用地址调用方式时,这些操作需要我们自己来完成。

根据函数的原型md5(_JNIEnv*env,jobject thiz,jstring str),我们需要手动构造参数列表,补全相应参数,才能对相关函数进行调用。

首先通过getJNIEnv()方法获取JNIEnv,并使用指针类型来存储。然后使用与符号调用相同的方式创建一个调用so函数的代理对象,并将其作为所需的第二个参数jobject。对于第三个参数需要注意的是,在unidbg中,当传入参数为非指针和Number类型时,都需要先将其定义为DvmObject对象并添加到VM中,才能够使用该参数。而对于常用的String类,unidbg对其做了相应的封装,这里新建了一个StringObject对象来作为第三个参数。

之后定义一个List<Object>参数列表,并将构造的三个参数添加到其中。然后使用module.callFunction()方法来对函数进行调用,该方法需要三个参数,分别为模拟器对象、函数的相对偏移地址和参数数组。

对于函数偏移的获取,我们需要使用IDA载入该so函数以找到相应的获取函数,如图2-15所示。

可以看到md5()方法的偏移为0x8E80,但由于该汇编指令的格式为thumb,所以需要对函数地址进行加1操作,最终此处填入的参数的值为0x8E81。对于arm指令与thumb指令,可以通过指令长度来区分:thumb的指令长度为2字节,而arm指令长度为4字节。此外,arm指令中是没有PUSH指令的,这也可以作为区分的依据。

调用函数后获得的返回值为Number类型,这与函数的实际返回值String类型是不相符的。不过不用着急,我们可以用两种方案来处理:对于基本数值类型或者布尔类型,可以直接通过Number获取相应的值;而对于Object对象来说,Number中实际存储的是Object对象的hash值,因此需要先通过vm.getObject()方法来获取DvmObject对象(传入的参数为number.intValue(),即Object对象的hash值),之后即可通过getValue()方法来获取对象中存储的值,并将其强制转换为String类型后输出。

图2-15 使用IDA获取函数偏移

main()方法就比较简单了,仅仅是实例化MainActivity对象后使用了符号调用和地址调用这两个方式来完成so中函数的调用。

public static void main(String[]args){

long start=System.currentTimeMillis();

MainActivity mainActivity=new MainActivity();

System.out.println("load the vm"+(System.currentTimeMillis()-start)+"ms");

mainActivity.callMd5();

mainActivity.call_address();

}

输出如下,可以发现函数的输出是正确计算出来的。

Picked up_JAVA_OPTIONS:-Dawt.useSystemAAFontSettings=on-Dswing.aatext=true

load the vm 16020ms

[symble]Call the so md5 function result is==>36072180305f072a2e2c7ea96eedf034

[addr]Call the so md5 function result is==>36072180305f072a2e2c7ea96eedf034

Process finished with exit code 0

2.2.3 unidbg部分API简单讲解

在上述代码中,我们接触到几个常用的接口,如AndroidEmulator、Memory、VM等。

AndroidEmulator是一个抽象的Android模拟器接口。它作为一个枢纽,协调unidbg中大多数模块的工作,至关重要。我们的大多数操作需要借助它完成。

而AndroidEmulatorBuilder可以帮助我们快速创建AndroidEmulator实例。例如:

AndroidEmulator emulator=AndroidEmulatorBuilder

// 指定32位处理器

.for32Bit()

// 指定64位处理器

// .for64bit()

// 添加后端工厂

.addBackendFactory(new DynarmicFactory(true))

// 指定进程名,推荐以Android包名作为进程名

.setProcessName("com.github.unidbg")

// 设置根路径,此路径相当于Android中的根目录

.setRootDir(new File("target/rootfs/default"))

// 生成AndroidEmulator实例

.build();

我们也可以通过AndroidEmulator实例来获取内存操作接口Memory实例:

Memory memory=emulator.getMemory();

创建DalvikVM虚拟机:

// 创建虚拟机

VM dalvikVM=emulator.createDalvikVM();

// 创建虚拟机并指定APK文件

VM dalvikVM=emulator.createDalvikVM(new File("apk file path"));

Memory内存接口主要提供内存管理和ELF文件加载两个功能。

对于ELF文件的加载,我们一般用加载APK的形式实现,因为unidbg会帮助我们进行一些解析处理,可以节省很多时间。

Module module=emulator.loadLibrary(new File("file path"),true);

而VM对象的主要作用就是代理一套JNI,帮助用户借助JNI来操作Java层。

VM的实际功能是调用JNI_OnLoad函数。某些JNI方法在JNI_OnLoad函数进行动态绑定时需调用此函数才能够调用JNI方法,所以这里推荐在加载模块后再执行此方法。

// 参数一:模拟器实例

// 参数二:要执行JNI_OnLoad函数的模块

dalvikVM.callJNI_OnLoad(emulator,module);

或者控制JNI交互的详细日志输出:

// 设置是否输出JNI运行日志

vm.setVerbose(true);

对于CallMethod系列的方法,第二个参数是方法签名,我们只需传入部分名称即可,这是因为unidbg在底层逻辑中进行了相应的处理。

对于上面的项目,按住Ctrl后单击callJniMethodObject()方法,可以跟进相应的实现,之后跟进其内部的callJniMethod()方法,再跟进findNativeFunction()方法,可以查看unidbg找到相应函数的过程,如图2-16所示。

图2-16 unidbg findNativeFunction()实现

可以看到,在第239行unidbg根据对传入对象的全类名与函数名进行拼接来得到最终的函数名。

而使用callFunction()方法时需要传入参数,除了基本数据类型之外,其余数据类型都要封装为DvmObject并传入VM虚拟机后才能够使用,具体后文会有详细的案例。