iOS安装包瘦身的那些事儿
在我们提交安装包到App Store的时候,如果安装包过大,有可能会收到类似如下内容的一封邮件:
收到这封邮件的时候,意味着安装包在App Store上下载的时候,有的设备下载的安装包大小会超过100M。对于超过100M的安装包,只能在WIFI环境下下载,不能直接通过4G网络进行下载。
在这里,我们提交App Store的安装包大小为67.6MB,在App Store上显示的下载大小和实际下载下来的大小,我们通过下表做一个对比:
iPhone型号
|
系统
|
AppStore 显示大小
|
下载到设备大小
|
---|---|---|---|
iPhone6 | 10.2.1 | 91.5MB | 88.9MB |
iPhone6 | 10.1.1 | 91.5MB | 88.9MB |
iPhone6 | 9.3.5 | 91.5MB | 84.8MB |
iPhone 5 | 9.2 | 91.5MB | 84.8MB |
iPhone6 plus | 10.0.2 | 95.7MB | 93.2MB |
iPhone7 plus | 10.3.0 | 95.7MB | 93.2MB |
iPhone5C | 9.2 | 83.9MB | 76MB |
iPhone5S | 7.1.1 | 147MB | 144MB |
iPhone5C | 7.1.2 | 147MB | 未知 |
iPhone5C 越狱 | 8.1.1 | 83.9MB | 144MB |
从上表可以看到:
- 在 iOS 9 系统以上的手机上,App Store 上的大小都是做了 App Thinning 操作的。
- 在 iOS 9 以上系统的基础上,plus 手机在 AppStore size 上比其他手机大了 4.2MB,猜测是因为 @3x 图的原因。
- iOS 9 和 iOS 10 虽然在 AppStore 显示的包大小一致,但是最终下载到手机上,大小有区别。
- iOS 9 以下的手机,是直接下载整个安装包的。
【App Thinning】:对于iOS应用来说,应用瘦身仅支持最新版本的iTunes,以及运行iOS 9.0或者更高系统的设备,否则的话,App Store将会为用户分发统一的安装包。iOS 9 在发布时隐含一个 Bug , App Thinning ( App 瘦身)无法正确运作。随着 iOS 9.0.2 的发布,此 Bug 已被修复, App 瘦身终于可以运作如常。从 App Store 下载 App 时请谨记这点。App Thinning 会自动检测用户的设备类型(即型号名称)并且只下载当前设备所适用的内容。换句话说,如果使用的是 iPad Mini 1(1x分辨率且非 retina 显示屏)那么只会下载 1x分辨率所使用的文件。更强大和更高分辨率的 ipad(如iPad Mini 3或 4)所使用的资源将不会被下载。因为用户仅需下载自己当前使用的特定设备所需的内容,这不仅加快了下载速度,还节约了设备的存储空间。
在邮件内容中,苹果建议删除一些无用的执行代码或资源文件。下面我们分别从这两方面来分析安装包瘦身的一些方法和工具。
1.资源文件
资源文件包括图片、声音、配置文件、文本文件(例如rtf文件)、xib(在安装包中后缀名为nib)、storyboard等。对于声音、配置文件、文本文件这三类资源文件,一般在安装包中数量不多,可自行在工程中根据实际情况,进行删除或保留。声音文件过大的话,可以考虑用如下命令做压缩:
//tritone.caf为声音文件 afconvert -f AIFC -d ima4 tritone.caf
xib和storyboard文件实际上是一个xml文件,如果某个页面没有使用,可直接删除。这里主要说一下对图片资源的处理方式。
对图片资源类文件,一般采取的方法是这几种:
- 删除无用的资源文件;
- 对资源文件进行压缩;
- 变更图片文件的导入方式;
- 处理1x图片。
1.1删除无用的资源文件
首先,使用python脚本搜索工程中没有使用的图片资源,脚本代码示例如下:
#!/bin/sh PROJ=`find . -name '*.xib' -o -name '*.[mh]'` for png in `find . -name '*.png'` do name=`basename $png` if ! grep -qhs "$name" "$PROJ"; then echo "$png is not referenced" fi done
但上面的脚本具有如下缺点:不够智能,不够通用,速度太慢,结果不正确。
在这里推荐使用工具LSUnusedResources。它在脚本的基础上,做了两个改进:
- 提高匹配速度。LSUnusedResources不是对每个资源文件名都做一次全文搜索匹配,因为加入项目的资源太多,这里会导致性能快速下降。它只是针对源码、Xib、Storyboard 和 plist 等文件,先全文搜索其中可能是引用了资源的字符串,然后用资源名和字符串做匹配。
- 优化匹配结果。比如说脚本会把大量实际上有使用的资源,当做未使用的资源输出(例如拼接的图片名称),而LSUnusedResources不会。
接下来,打开工具LSUnusedResources,点击“Browse...”按钮,选择工程所在目录,点击"Search"按钮,即可开始搜索,如下图所示:
搜索结果出来之后,选中某行,点击“Delete”按钮即可直接删除资源。
1.2对资源文件进行压缩
压缩工具有很多,这里介绍两个好用的:
- 无损压缩工具ImageOptiom(推荐)。这是一款非常好的图片压缩工具,可以进行无损压缩,能够对 png 和 jpeg 图片文件进行优化,它能找到最佳的压缩参数(在设置中可以设置压缩比例,80% 及以上是无损压缩,推荐使用),并通过消除不必要的信息(如文件的 EXIF 标签和颜色配置文件等),优化后达到减小文件大小的效果。
- 有损压缩工具TinyPNG。它使用聪明的有损压缩技术,能有效减少PNG文件的大小。通过选择性地降低图像中颜色的数量,需要更少的字节来存储数据。
【建议】:对于较大尺寸的图片,可以和设计沟通,在不失真和影响效果的前提下,使用TinyPNG进行压缩;较小尺寸的图片,建议使用ImageOptiom。
1.3变更图片文件的导入方式
我们都知道,图片资源的导入方式有如下几种:
1. Assets.xcassets。
-
- 只支持png格式的图片;
- 图片只支持[UIImage imageNamed]的方式实例化,但是不能从Bundle中加载;
- 在编译时,Images.xcassets中的所有文件会被打包为Assets.car的文件。
2. CreateGroup
-
- 黄色文件夹图标;Xcode中分文件夹,Bundle中都在同一个文件夹下,因此,不能出现文件重名的情况;
- 可以直接使用[NSBundle mainBundle]作为资源路径,效率高;
- 可以使用[UIImage imageNamed:]加载图像。
3. CreateFolderRefences
-
- 蓝色文件夹;Xcode中分文件夹,Bundle中同样分文件夹,因此,可以出现文件重名的情况;
- 需要在[NSBundle mainBundle]的基础上拼接实际的路径,效率较差;
- 不能使用[UIImage imageNamed:]加载图像。
【说明】:蓝色文件夹只是将文件单纯的创建了引用,这些文件不会被编译,所以在使用的时候需要加入其路径。
4. PDFs矢量图(Xcode6+)
5. Bundle(包)
对于上面这几种不同的导入方式,会对打出的包的大小有影响么?
经过测试得知:CreateGroup、CreateFolderRefences两种方式打出来的包,图片都会直接放在.app文件中,所以打包前后,图片的大小不会改变。而加入到Assets.xcassets中的方法则不同,打包后,在.app中会生成Assets.car文件来存储Assets.xcassets中的图片,并且文件大小也大大降低。
测试 |
打包前Assets.xcassets文件夹 |
打包后的Assets.car文件夹 |
第一次 |
32.7MB |
16.3MB |
第二次 | 33.5MB | 26.1MB |
从表格数据可以看到,使用Assets.xcassets来管理图片也可以达到ipa瘦身的效果。
值得留意的是,在将图片资源移到Assets.xcassets管理的时候,一般情况下会自动生成与图片名称相同的,比如loading@2x.png和loading@3x.png会自动放置到一个同名的loading文件夹中。然而有一些不规则命名的图片,会出现一些奇怪的问题:
- 图片名称为ios-f2-8-004的图片,放到Images.xcassets中,会自动生成调用的图片名是ios-f2-8-4,最后一位的004,被替换成4,然而在类文件中引用的是[UIImage imageNamed:@"ios-f2-8-004.png"],这样会找不到图片;
- 图片名称为ios-f6-的图片,放到Images.xcassets中,会自动生成调用的图片名是ios-f6,这样也会找不到图片。
因此在移动的时候,一定要细致对比。
1.4处理1x图片
我们知道,iPhone设备目前主要有四种尺寸:3.5英寸、4英寸、4.7英寸、5.5英寸,对于这几个尺寸的设备,我们来看一下具体的设备型号和屏幕相关信息:
机型 | 屏幕宽高(point) | 渲染像素(pixel) | 物理像素(pixel) | 屏幕对角线长度(英寸) | 屏幕模式 |
iPhone 2G, 3G, 3GS | 320 * 480 | 320 * 480 | 320 * 480 | 3.5(163PPI) | 1x |
iPhone 4, 4s | 320 * 480 | 640 * 960 | 640 * 960 | 3.5 (326PPI) | 2x |
iPhone 5, 5s | 320 * 568 | 640 * 1136 | 640 * 1136 | 4 (326PPI) | 2x |
iPhone 6, 6s, 7 | 375 * 667 | 750 * 1334 | 750 * 1334 | 4.7 (326PPI) | 2x |
iPhone 6 Plus, 6s Plus, 7 Plus | 414 * 736 | 1242 * 2208 | 1080 * 1920 | 5.5 (401PPI) |
3x |
iPhone X | 375 * 812 | 1125 * 2436 | 1125 * 2436 |
3x |
对于上表中的几个概念,这里做一下说明:
- Points: 是iOS开发中引入的抽象单位,称作点。开发过程中所有基于坐标系的绘制都是以 point 作为单位,在iPhone 2G,3G,3GS的年代,point 和屏幕上的像素是完全一一对应的,即 320 * 480 (points), 也是 320 * 480 (pixels);
- Rendered Pixels: 渲染像素, 以 point 为单位的绘制最终都会渲染成 pixels,这个过程被称为光栅化。基于 point 的坐标系乘以比例因子可以得到基于像素的坐标系,高比例因子会使更多的细节展示,目前的比例因子会是 1x,2x,3x
- Physical Pixels: 物理像素,就是设备屏幕实际的像素。
- Physical Device: 设备屏幕的物理长度,使用英寸作为单位。比如iPhone 4屏幕是3.5英寸,iPhone 5 是4英寸,iphone 6是4.7英寸,这里的数字是指手机屏幕对角线的物理长度。实际上会是Physical Pixels的像素值(而不是Rendered Pixels的像素值)会渲染到该屏幕上, 屏幕会有 PPI(pixels-per-inch) 的特性,PPI 的值告诉你每英寸会有多少像素渲染。
- 屏幕模式: 描述的是屏幕中一个点有多少个 Rendered Pixels 渲染,对于2倍屏(又称 Retina 显示屏),会有 2 * 2 = 4 个像素的面积渲染,对于3倍屏(又称 Retina HD 显示屏),会有 3 * 3 = 9 个像素的面积渲染。
在实际的开发中,所有控件的坐标以及控件大小都是以点为单位的,假如屏幕上需要展示一张 20 * 20 (单位:point)大小的图片,那么设计师应该怎么给图呢?这里就会用到屏幕模式的概念,如果屏幕是 2x,那么就需要提供 40 * 40 (单位: pixel)大小的图片,如果屏幕是 3x,那么就提供 60 * 60 大小的图片,且图片的命名需要遵守以下规范:
- Standard:
<ImageName><device_modifier>.<filename_extension>
- High resolution:
<ImageName>@2x<device_modifier>.<filename_extension>
- High HD resolution:
<ImageName>@3x<device_modifier>.<filename_extension>
其中:
- ImageName: 图片名字,根据场景命名
- device_modifier: 可选,可以是
~ipad
或者~iphone
, 当需要为 iPad 和 iPhone 分别指定一套图时需要加上此字段 - filename_extension: 图片后缀名,iOS中使用 png 图片
2x屏幕的设备会自动加载 xxx@2x.png 命名的图片资源,3x屏幕的设备会自动加载 xxx@3x.png 的图片。从友盟统计数据可以看到,现在基本没有 1x屏幕的设备了,所以可以不用提供这个分辨率的图片。
至于开发中,技术人员和设计人员关于设计和切图的工作流程和规范,可以参看知乎上的这篇文章介绍。
2.Mach-O 可执行文件
我们用 Xcode 构建一个程序的过程中,会把源文件 (.m
和 .h
) 文件转换为一个可执行文件。这个可执行文件中包含的字节码会被 CPU (iOS 设备中的 ARM 处理器或 Mac 上的 Intel 处理器) 执行。对于这个可执行文件,我们可以用工具MachOView来查看。
2.1MachOView
Mach-O为Mach Object文件格式的缩写,是mac上可执行文件的格式,类似于windows上的PE格式 (Portable Executable )或 linux上的elf格式 (Executable and Linking Format)。Mach-O文件分为这几类:
- Executable:应用的主要二进制;
- Dylib Library:动态链接库;
- Static Library:静态链接库;
- Bundle:不能被链接的Dylib,只能在运行时使用dlopen( )加载,可当做macOS的插件;
- Relocatable Object File :可重定向文件类型。
对于这几种类型的Mach-O文件,我们可以使用MachOView进行查看。MachOView是一个开源的工具,源码在GitHub上:https://github.com/gdbinit/MachOView,感兴趣的可以研究一下。
下面我们用MachOView来打开一个静态链接库文件看看,了解Mach-O文件的结构:
首先,我们来看一下“Fat Header”里面的内容:它是对各种架构文件的组装,可以看到每种类型的CPU架构信息,从上图可以看到支持的架构,图中显示的支持ARM_V7 、i386 、 X86_64、ARM_64。
接下来我们点开一个Static Library看看:
从上图可以看到,Static Library有很多.o文件,每个.o文件都对应一个类编译后的文件,展开查看“Mach Header”信息,可以看到每个类的CPU架构信息、Load Commands数量 、Load Commands Size 、File Type等信息。
当然,我们也可以在Xcode中,开启编译选项Write Link Map File,编译之后来查看可执行文件的全貌。
2.2LinkMap
LinkMap文件是Xcode产生可执行文件的同时生成的链接信息,用来描述可执行文件的构造成分,包括代码段(__TEXT)和数据段(__DATA)的分布情况。
在Xcode中,选择XCode -> Target -> Build Settings -> 搜map -> 把Write Link Map File选项设为YES,并指定好linkMap的存储位置,如下图所示:
编译后,到编译目录里找到该txt文件,文件名和路径就是上述的Path to Link Map File。这个LinkMap里展示了整个可执行文件的全貌,列出了编译后的每一个.o目标文件的信息(包括静态链接库.a里的),以及每一个目标文件的代码段,数据段存储详情。下面来简单分析一下这个文件的结构。
2.2.1目标文件列表
打开LinkMap文件,首先看到的就是编译后的每一个.o目标文件的信息,如下图所示:
前面中括号里的是这个文件的编号,后面会用到。包括工程中用到的库和Framework,都会在这里列出来。
2.2.2段表
接着是一个段表,描述各个段在最后编译成的可执行文件中的偏移位置及大小,包括了代码段(__TEXT,保存程序代码段编译后的机器码)和数据段(__DATA,保存变量值)。
首列是数据在文件的偏移位置,第二列是这一段占用大小,第三列是段类型,代码段和数据段,第四列是段名称。
每一行的数据都紧跟在上一行后面,如第二行__stubs的地址0x1000099AC就是第一行__text的地址0x1000051B4加上大小0x000047F8,整个可执行文件大致数据分布就是这样。
这里可以清楚看到各种类型的数据在最终可执行文件里占的比例,例如__text表示编译后的程序执行语句,__data表示已初始化的全局变量和局部静态变量,__bss表示未初始化的全局变量和局部静态变量,__cstring表示代码里的字符串常量,等等。
2.2.3符号表(Symbols)
Symbols 是对 Sections 进行了再划分,这里会描述所有的 methods、ivar 和字符串,以及它们对应的地址、大小、文件编号信息。
同样首列是数据在文件的偏移地址,第二列是占用大小,第三列是所属文件序号,对应2.2.1中的文件编号,最后是名字。
例如第70行代表了文件序号为3(反查上面就是GofObject.o)的gofName方法占用了48byte大小。
计算某个.o文件在最终安装包中占用的大小,主要是解析目标文件和符号表两个部分,从目标文件读取出每个.o文件名和对应的序号,然后对Symbols中序号相同的文件的Size字段相加,即可得到每个.o文件在最终包的大小。
2.3编译过程
在上面两节中,我们初步接触了可执行文件的内容,本节我们来分析一下编译过程,以便更深入的熟悉可执行文件。
2.3.1编译器
Xcode 的默认编译器是Clang,Clang 的功能是首先对 Objective-C 代码做分析检查,然后将其转换为低级的类汇编代码:LLVM Intermediate Representation(LLVM 中间表达码)。接着 LLVM 会执行相关指令将 LLVM IR 编译成目标平台上的本地字节码,这个过程的完成方式可以是即时编译 (Just-in-time),或在编译的时候完成。
LLVM是一个模块化和可重用的编译器和工具链技术的集合,Clang 是 LLVM 的子项目,是 C、C++ 和 Objective-C 编译器,目的是提供惊人的快速编译,比 GCC 快3倍,其中的 clang static analyzer 主要是进行语法分析、语义分析和生成中间代码,当然这个过程会对代码进行检查,出错的和需要警告的会标注出来。LLVM 核心库提供一个优化器,对流行的 CPU 做代码生成支持。lld 是 Clang / LLVM 的内置链接器,clang 必须调用链接器来产生可执行文件。
LLVM 的优点主要得益于它的三层式架构。 第一层支持多种语言作为输入(例如 C, ObjectiveC, C++ 和 Haskell),第二层是一个共享式的优化器(对 LLVM IR 做优化处理),第三层是许多不同的目标平台(例如 Intel, ARM 和 PowerPC)。在这三层式的架构中,如果想要添加一门语言到 LLVM 中,那么可以把重要精力集中到第一层上,如果想要增加另外一个目标平台,那么没必要过多的考虑输入语言。
目前LLVM包含的主要子项目包括:
- LLVM Core:包含一个现在的源代码/目标设备无关的优化器,一集一个针对很多主流(甚至于一些非主流)的CPU的汇编代码生成支持。
- Clang:一个C/C++/Objective-C编译器,致力于提供令人惊讶的快速编译,极其有用的错误和警告信息,提供一个可用于构建很棒的源代码级别的工具.
- dragonegg:gcc插件,可将GCC的优化和代码生成器替换为LLVM的相应工具。
- LLDB:基于LLVM提供的库和Clang构建的优秀的本地调试器。
- libc++、libc++ ABI: 符合标准的,高性能的C++标准库实现,以及对C++11的完整支持。
- compiler-rt:针对
__fixunsdfdi
和其他目标机器上没有一个核心IR(intermediate representation)对应的短原生指令序列时,提供高度调优过的底层代码生成支持。 - OpenMP: Clang中对多平台并行编程的runtime支持。
- vmkit:基于LLVM的Java和.NET虚拟机实
- polly: 支持高级别的循环和数据本地化优化支持的LLVM框架。
- libclc: OpenCL标准库的实现
- klee: 基于LLVM编译基础设施的符号化虚拟机
- SAFECode:内存安全的C/C++编译器
- lld: clang/llvm内置的链接器
【说明】:从功能的角度来说,微观的LLVM可以认为是一个编译器的后端,而Clang是一个编译器的前端。关于Clang和LLVM的关系,可以看一下这篇文章。
从一个简单的例子开始:
#include <stdio.h> #define YEAR 2017 int main(int argc, const char * argv[]) { printf("Hello, %d!\n", YEAR); return 0; }
在编译一个源文件时,编译器的处理过程分为几个阶段。要想查看编译 main.m 源文件需要几个不同的阶段,我们可以让通过 clang 命令观察:
clang -ccc-print-phases main.m
结果如下:
0: input, "main.m", objective-c 1: preprocessor, {0}, objective-c-cpp-output 2: compiler, {1}, ir 3: backend, {2}, assembler 4: assembler, {3}, object 5: linker, {4}, image 6: bind-arch, "x86_64", {5}, image
从结果可以看到,从源文件到可执行文件,经过了这么几个过程:预处理、编译、汇编、链接,最终生成可执行文件。
当程序执行时,操作系统将可执行文件拷贝到内存中。那么我们的程序最终是怎么执行的呢?程序的执行是在进程中进行的,程序转化为进程大致分为这么几个步骤:
- 1.内核将程序读入内存,为程序镜像分配内存空间。程序镜像的内存布局分为如下部分(可通过size指令查看代码段、数据段、BSS段的大小以及这3个段大小之和的十进制和十六进制表示):
- 代码段:即机器码,只读,可共享(多个进程共享代码段);
- 数据段:储存已被初始化了的静态数据;
- BSS段(未初始化的数据段):储存未始化的静态数据;
- 堆:储存动态分配的内存;
- 栈:储存函数调用的上下文,动态数据。
- 2.内核为该进程分配进程标志符(PID)。
- 3.内核为该进程保存PID及相应的进程状态信息。
经过上面几个步骤,操作系统向内核数据结构中添加了适当的信息,并为运行程序代码分配了必要的资源之后,程序就变成了进程。下面我们来分析编译的几个阶段。
2.3.2预处理
执行指令,我们看一下预处理阶段都做了哪些事情:
clang -fmodules -E main.m | open -f
【说明】:目前预处理中引入了模块 - modules功能,这使预处理变得更加的高级。
通过上面的指令,我们看一下输出的结果:
# 1 "main.m" # 1 "<built-in>" 1 # 1 "<built-in>" 3 # 342 "<built-in>" 3 # 1 "<command line>" 1 # 1 "<built-in>" 2 # 1 "main.m" 2 @import Darwin.C.stdio; /* clang -E: implicit import for "/usr/include/stdio.h" */ int main() { printf("Hello, %d!\n", 2017); return 0; }
从结果可以看到,预处理阶段,会进行宏的替换,头文件的导入,以及类似#if的处理。
在Xcode中,可以通过这样的方式查看任意文件的预处理结果:Product -> Perform Action -> Preprocess。如下图所示:
在预处理完成之后,会进行词法分析,这里会把代码切成一个个 Token,比如大小括号,等于号还有字符串等。我们可以通过指令看一下词法分析:
clang -fmodules -fsyntax-only -Xclang -dump-tokens main.m
输出结果如下:
annot_module_include '#include <stdio.h> #define YEAR 2017 int main() { printf("Hello, %d!\n", YEAR); // NSLog(@"hello, %@", @"world"); return 0; } ' Loc=<main.m:9:1> int 'int' [StartOfLine] Loc=<main.m:12:1> identifier 'main' [LeadingSpace] Loc=<main.m:12:5> l_paren '(' Loc=<main.m:12:9> r_paren ')' Loc=<main.m:12:10> l_brace '{' [LeadingSpace] Loc=<main.m:12:12> identifier 'printf' [StartOfLine] [LeadingSpace] Loc=<main.m:13:5> l_paren '(' Loc=<main.m:13:11> string_literal '"Hello, %d!\n"' Loc=<main.m:13:12> comma ',' Loc=<main.m:13:26> numeric_constant '2017' [LeadingSpace] Loc=<main.m:13:28 <Spelling=main.m:11:14>> r_paren ')' Loc=<main.m:13:32> semi ';' Loc=<main.m:13:33> return 'return' [StartOfLine] [LeadingSpace] Loc=<main.m:15:5> numeric_constant '0' [LeadingSpace] Loc=<main.m:15:12> semi ';' Loc=<main.m:15:13> r_brace '}' [StartOfLine] Loc=<main.m:16:1> eof '' Loc=<main.m:16:2>
然后进行语法分析,验证语法是否正确,然后将所有节点组成抽象语法树 AST:
clang -fmodules -fsyntax-only -Xclang -ast-dump main.m
结果如下:
TranslationUnitDecl 0x7fbdb7020cd0 <<invalid sloc>> <invalid sloc> |-TypedefDecl 0x7fbdb7021218 <<invalid sloc>> <invalid sloc> implicit __int128_t '__int128' | `-BuiltinType 0x7fbdb7020f40 '__int128' |-TypedefDecl 0x7fbdb7021278 <<invalid sloc>> <invalid sloc> implicit __uint128_t 'unsigned __int128' | `-BuiltinType 0x7fbdb7020f60 'unsigned __int128' |-TypedefDecl 0x7fbdb7021308 <<invalid sloc>> <invalid sloc> implicit SEL 'SEL *' | `-PointerType 0x7fbdb70212d0 'SEL *' | `-BuiltinType 0x7fbdb7021180 'SEL' |-TypedefDecl 0x7fbdb70213e8 <<invalid sloc>> <invalid sloc> implicit id 'id' | `-ObjCObjectPointerType 0x7fbdb7021390 'id' | `-ObjCObjectType 0x7fbdb7021360 'id' |-TypedefDecl 0x7fbdb70214c8 <<invalid sloc>> <invalid sloc> implicit Class 'Class' | `-ObjCObjectPointerType 0x7fbdb7021470 'Class' | `-ObjCObjectType 0x7fbdb7021440 'Class' |-ObjCInterfaceDecl 0x7fbdb7021518 <<invalid sloc>> <invalid sloc> implicit Protocol |-TypedefDecl 0x7fbdb7021878 <<invalid sloc>> <invalid sloc> implicit __NSConstantString 'struct __NSConstantString_tag' | `-RecordType 0x7fbdb7021680 'struct __NSConstantString_tag' | `-Record 0x7fbdb70215e0 '__NSConstantString_tag' |-TypedefDecl 0x7fbdb7021908 <<invalid sloc>> <invalid sloc> implicit __builtin_ms_va_list 'char *' | `-PointerType 0x7fbdb70218d0 'char *' | `-BuiltinType 0x7fbdb7020d60 'char' |-TypedefDecl 0x7fbdb78049e8 <<invalid sloc>> <invalid sloc> implicit __builtin_va_list 'struct __va_list_tag [1]' | `-ConstantArrayType 0x7fbdb7804990 'struct __va_list_tag [1]' 1 | `-RecordType 0x7fbdb7804800 'struct __va_list_tag' | `-Record 0x7fbdb7021958 '__va_list_tag' |-ImportDecl 0x7fbdb7805230 <main.m:9:1> col:1 implicit Darwin.C.stdio |-FunctionDecl 0x7fbdb78052b8 <line:12:1, line:16:1> line:12:5 main 'int ()' | `-CompoundStmt 0x7fbdb8861140 <col:12, line:16:1> | |-CallExpr 0x7fbdb88610a0 <line:13:5, col:32> 'int' | | |-ImplicitCastExpr 0x7fbdb8861088 <col:5> 'int (*)(const char *, ...)' <FunctionToPointerDecay> | | | `-DeclRefExpr 0x7fbdb7805798 <col:5> 'int (const char *, ...)' Function 0x7fbdb78053c0 'printf' 'int (const char *, ...)' | | |-ImplicitCastExpr 0x7fbdb88610f0 <col:12> 'const char *' <BitCast> | | | `-ImplicitCastExpr 0x7fbdb88610d8 <col:12> 'char *' <ArrayToPointerDecay> | | | `-StringLiteral 0x7fbdb8861000 <col:12> 'char [12]' lvalue "Hello, %d!\n" | | `-IntegerLiteral 0x7fbdb8861038 <line:11:14> 'int' 2017 | `-ReturnStmt 0x7fbdb8861128 <line:15:5, col:12> | `-IntegerLiteral 0x7fbdb8861108 <col:12> 'int' 0 `-<undeserialized declarations>
2.3.3编译
我们可以用下面的命令让 clang
输出汇编代码:
clang -S -o - main.m | open -f
结果如下:
//.section 指令指定接下来会执行哪一个段 .section __TEXT,__text,regular,pure_instructions .macosx_version_min 10, 12 //.globl 指令说明 _main 是一个外部符号。这就是我们的 main() 函数。这个函数对于二进制文件外部来说是可见的,因为系统要调用它来运行可执行文件。 .globl _main //.align 指令指出了后面代码的对齐方式。在我们的代码中,后面的代码会按照 16(2^4) 字节对齐,如果需要的话,用 0x90 补齐。 .p2align 4, 0x90 //main 函数的头部: //_main 函数真正开始的地址。这个符号会被 export。二进制文件会有这个位置的一个引用。 _main: ## @main //.cfi_startproc 指令通常用于函数的开始处。CFI 是调用帧信息 (Call Frame Information) 的缩写。这个调用 帧 以松散的方式对应着一个函数。当开发者使用 debugger 和 step in 或 step out 时,实际上是 stepping in/out 一个调用帧。在 C 代码中,函数有自己的调用帧,当然,别的一些东西也会有类似的调用帧。.cfi_startproc 指令给了函数一个 .eh_frame 入口,这个入口包含了一些调用栈的信息(抛出异常时也是用其来展开调用帧堆栈的)。这个指令也会发送一些和具体平台相关的指令给 CFI。它与后面的 .cfi_endproc 相匹配,以此标记出 main() 函数结束的地方。 .cfi_startproc ## BB#0: //ABI ( 应用二进制接口 application binary interface) 指定了函数调用是如何在汇编代码层面上工作的。在函数调用期间,ABI 会让 rbp 寄存器 (基础指针寄存器 base pointer register) 被保护起来。当函数调用返回时,确保 rbp 寄存器的值跟之前一样,这是属于 main 函数的职责。pushq %rbp 将 rbp 的值 push 到栈中,以便我们以后将其 pop 出来。 pushq %rbp Ltmp0: //和.cfi_offset %rbp, -16一起,会输出一些关于生成调用堆栈展开和调试的信息。我们改变了堆栈和基础指针,而这两个指令可以告诉编译器它们都在哪儿,或者更确切的,它们可以确保之后调试器要使用这些信息时,能找到对应的东西。 .cfi_def_cfa_offset 16 Ltmp1: .cfi_offset %rbp, -16 //把局部变量放置到栈上 movq %rsp, %rbp Ltmp2: .cfi_def_cfa_register %rbp //将栈指针移动 16 个字节,也就是函数会调用的位置 subq $16, %rsp //leaq 会将 L_.str 的指针加载到 rdi 寄存器中。 leaq L_.str(%rip), %rdi movl $2017, %esi ## imm = 0x7E1 movl $0, -4(%rbp) //把使用来存储参数的寄存器数量存储在寄存器 al 中 movb $0, %al //调用 printf() 函数 callq _printf //下面的代码将 ecx 寄存器设置为 0,并把 eax 寄存器的值保存至栈中,然后将 ect 中的 0 拷贝至 eax 中。ABI 规定 eax 将用来保存一个函数的返回值 xorl %esi, %esi movl %eax, -8(%rbp) ## 4-byte Spill movl %esi, %eax //把堆栈指针 rsp 上移 32 字节 addq $16, %rsp //把之前存储至 rbp 中的值从栈中弹出来 popq %rbp //返回调用者, ret 会读取出栈的返回地址 retq .cfi_endproc //.section 指令指出下面将要进入的段 .section __TEXT,__cstring,cstring_literals //L_.str 标记运行在实际的代码中获取到字符串的一个指针 L_.str: ## @.str //.asciz 指令告诉编译器输出一个以 ‘\0’ (null) 结尾的字符串。 .asciz "Hello, %d!\n" .section __DATA,__objc_imageinfo,regular,no_dead_strip L_OBJC_IMAGE_INFO: .long 0 .long 64 //.subsections_via_symbols 指令是静态链接编辑器使用的 .subsections_via_symbols
关于汇编指令的资料,可以在 苹果的 OS X Assembler Reference 中进行查看和学习。
在Xcode中,可以通过这样的方式查看任意文件的汇编输出结果:Product -> Perform Action -> Assemble。如下图所示:
2.3.4汇编器
汇编器将可读的汇编代码转换为机器代码。它会创建一个目标对象文件,一般简称为 对象文件。这些文件以 .o
结尾。如果用 Xcode 构建应用程序,可以在工程的 derived data 目录中,Objects-normal
文件夹下找到这些文件。
我们也可以通过如下指令来生成:
clang -fmodules -c main.m -o main.o
2.3.5链接器
链接器解决了目标文件和库之间的链接。 如上面的汇编代码:
callq _printf
printf()
是 libc 库中的一个函数。无论怎样,最后的可执行文件需要能需要知道 printf()
在内存中的具体位置:例如,_printf
的地址符号是什么。链接器会读取所有的目标文件 (此处只有一个) 和库 (此处是 libc),并解决所有未知符号 (此处是 _printf
) 的问题。然后将它们编码进最后的可执行文件中 (可以在 libc 中找到符号 _printf
),接着链接器会输出可以运行的执行文件。
这里我们讲一个复杂点的可执行文件。
//main.m #import "GofClass.h" int main() { GofClass *gofClass = [[GofClass alloc] init]; [gofClass doSomethingWithName:@"写代码"]; return 0; } //GofClass.h #import <Foundation/Foundation.h> @interface GofClass : NSObject /** 做某项事情 @param workName 事情名称 */ - (void)doSomethingWithName:(NSString *)workName; @end //GofClass.m #import "GofClass.h" @implementation GofClass - (void)doSomethingWithName:(NSString *)workName { NSLog(@"开始%@", workName); } @end
通过如下指令来分别生成各个类的目标文件,并最终生成可执行文件:
clang -fmodules -c main.m -o main.o clang -fmodules -c GofClass.m -o GofClass.o //生成可执行文件 clang main.o GofClass.o -o GofMachOFile
可执行文件和目标文件都有一个符号表,这个符号表规定了它们的符号。如果我们用 nm(1)
工具观察一下 main.o
目标文件,可以看到如下内容:
//指令 xcrun nm -nm main.o //结果 (undefined) external _OBJC_CLASS_$_GofClass (undefined) external ___CFConstantStringClassReference (undefined) external _objc_msgSend 0000000000000000 (__TEXT,__text) external _main 00000000000000b0 (__TEXT,__ustring) non-external l_.str
external _OBJC_CLASS_$_GofClass是GofClass Objective-C 类的符号。该符号是 undefined, external 。External 的意思是指对于这个目标文件该类并不是私有的,相反,non-external
的符号则表示对于目标文件是私有的。我们的 helloworld.o
目标文件引用了类 Foo
,不过这并没有实现它。因此符号表中将其标示为 undefined。
同样的我们也看一下GofClass.o:
//指令 xcrun nm -nm GofClass.o //结果 (undefined) external _NSLog (undefined) external _OBJC_CLASS_$_NSObject (undefined) external _OBJC_METACLASS_$_NSObject (undefined) external ___CFConstantStringClassReference (undefined) external __objc_empty_cache 0000000000000000 (__TEXT,__text) non-external -[GofClass doSomethingWithName:] 0000000000000030 (__TEXT,__ustring) non-external l_.str 0000000000000070 (__DATA,__objc_const) non-external l_OBJC_METACLASS_RO_$_GofClass 00000000000000b8 (__DATA,__objc_const) non-external l_OBJC_$_INSTANCE_METHODS_GofClass 00000000000000d8 (__DATA,__objc_const) non-external l_OBJC_CLASS_RO_$_GofClass 0000000000000120 (__DATA,__objc_data) external _OBJC_METACLASS_$_GofClass 0000000000000148 (__DATA,__objc_data) external _OBJC_CLASS_$_GofClass
接下来我们看一下可执行文件:
//指令 xcrun nm -nm GofMachOFile //结果 (undefined) external _NSLog (from Foundation) (undefined) external _OBJC_CLASS_$_NSObject (from CoreFoundation) (undefined) external _OBJC_METACLASS_$_NSObject (from CoreFoundation) (undefined) external ___CFConstantStringClassReference (from CoreFoundation) (undefined) external __objc_empty_cache (from libobjc) (undefined) external _objc_msgSend (from libobjc) (undefined) external dyld_stub_binder (from libSystem) 0000000100000000 (__TEXT,__text) [referenced dynamically] external __mh_execute_header 0000000100000ea0 (__TEXT,__text) external _main 0000000100000f10 (__TEXT,__text) non-external -[GofClass doSomethingWithName:] 0000000100001140 (__DATA,__objc_data) external _OBJC_METACLASS_$_GofClass 0000000100001168 (__DATA,__objc_data) external _OBJC_CLASS_$_GofClass
可以看到所有的 Foundation 和 Objective-C 运行时符号依旧是 undefined,不过现在的符号表中已经多了如何解析它们的信息,例如在哪个动态库中可以找到对应的符号。
在运行时,动态链接器 dyld
也可以解析这些 undefined 符号,并指向它们在 Foundation 中的实现等。
当构建一个程序时,将会链接各种各样的库。它们又会依赖其他一些 framework 和 动态库。需要加载的动态库会非常多。而对于相互依赖的符号就更多了。可能将会有上千个符号需要解析处理,这将花费很长的时间:一般是好几秒钟。
为了缩短这个处理过程所花费时间,在 OS X 和 iOS 上的动态链接器使用了共享缓存,共享缓存存于 /var/db/dyld/
。对于每一种架构,操作系统都有一个单独的文件,文件中包含了绝大多数的动态库,这些库都已经链接为一个文件,并且已经处理好了它们之间的符号关系。当加载一个 Mach-O 文件 (一个可执行文件或者一个库) 时,动态链接器首先会检查 共享缓存 看看是否存在其中,如果存在,那么就直接从共享缓存中拿出来使用。每一个进程都把这个共享缓存映射到了自己的地址空间中。这个方法大大优化了 OS X 和 iOS 上程序的启动时间。
2.4可执行文件的瘦身
上面介绍了可执行文件的结构以及整个编译过程,介绍这些内容是为了对可执行文件以及它的来历有一个了解,下面我们分析一下对可执行文件的瘦身都有哪些方法。
我们知道,可执行文件是由我们编写的代码产生的。通过脚本分析前面说的LinkMap文件,我们可以更加清晰的知道具体的某个类在可执行文件中的大小。
#!usr/bin/python ## -*- coding: UTF-8 -*- # #使用简介:python linkmap.py XXX-LinkMap-normal-xxxarch.txt 或者 python linkmap.py XXX-LinkMap-normal-xxxarch.txt | open -f #使用参数-g会统计每个模块.o的统计大小 # __author__ = "zmjios" __date__ = "2017-05-05" import os import re import shutil import sys class SymbolModel: file = "" size = 0 def verify_linkmapfile(args): if len(sys.argv) < 2: print("请输入linkMap文件") return False path = args[1] if not os.path.isfile(path): print("请输入文件") return False file = open(path) content = file.read() file.close() #查找是否存在# Object files: if content.find("# Object files:") == -1: print("输入linkmap文件非法") return False #查找是否存在# Sections: if content.find("# Sections:") == -1: print("输入linkmap文件非法") return False #查找是否存在# Symbols: if content.find("# Symbols:") == -1: print("输入linkmap文件非法") return False return True def symbolMapFromContent(): symbolMap = {} reachFiles = False reachSections = False reachSymblos = False file = open(sys.argv[1]) for line in file.readlines(): if line.startswith("#"): if line.startswith("# Object files:"): reachFiles = True if line.startswith("# Sections:"): reachSections = True if line.startswith("# Symbols:"): reachSymblos = True else: if reachFiles == True and reachSections == False and reachSymblos == False: #查找 files 列表,找到所有.o文件 location = line.find("]") if location != -1: key = line[:location+1] if symbolMap.get(key) is not None: continue symbol = SymbolModel() symbol.file = line[location + 1:] symbolMap[key] = symbol elif reachFiles == True and reachSections == True and reachSymblos == True: #'\t'分割成三部分,分别对应的是Address,Size和 File Name symbolsArray = line.split('\t') if len(symbolsArray) == 3: fileKeyAndName = symbolsArray[2] #16进制转10进制 size = int(symbolsArray[1],16) location = fileKeyAndName.find(']') if location != -1: key = fileKeyAndName[:location + 1] symbol = symbolMap.get(key) if symbol is not None: symbol.size = symbol.size + size file.close() return symbolMap def sortSymbol(symbolList): return sorted(symbolList, key=lambda s: s.size,reverse = True) def buildResultWithSymbols(symbols): results = ["文件大小\t文件名称\r\n"] totalSize = 0 for symbol in symbols: results.append(calSymbol(symbol)) totalSize += symbol.size results.append("总大小: %.2fM" % (totalSize/1024.0/1024.0)) return results def buildCombinationResultWithSymbols(symbols): #统计不同模块大小 results = ["库大小\t库名称\r\n"] totalSize = 0 combinationMap = {} for symbol in symbols: names = symbol.file.split('/') name = names[len(names) - 1].strip('\n') location = name.find("(") if name.endswith(")") and location != -1: component = name[:location] combinationSymbol = combinationMap.get(component) if combinationSymbol is None: combinationSymbol = SymbolModel() combinationMap[component] = combinationSymbol combinationSymbol.file = component combinationSymbol.size = combinationSymbol.size + symbol.size else: #symbol可能来自app本身的目标文件或者系统的动态库 combinationMap[symbol.file] = symbol sortedSymbols = sortSymbol(combinationMap.values()) for symbol in sortedSymbols: results.append(calSymbol(symbol)) totalSize += symbol.size results.append("总大小: %.2fM" % (totalSize/1024.0/1024.0)) return results def calSymbol(symbol): size = "" if symbol.size / 1024.0 / 1024.0 > 1: size = "%.2fM" % (symbol.size / 1024.0 / 1024.0) else: size = "%.2fK" % (symbol.size / 1024.0) names = symbol.file.split('/') if len(names) > 0: size = "%s\t%s" % (size,names[len(names) - 1]) return size def analyzeLinkMap(): if verify_linkmapfile(sys.argv) == True: print("**********正在开始解析*********") symbolDic = symbolMapFromContent() symbolList = sortSymbol(symbolDic.values()) if len(sys.argv) >= 3 and sys.argv[2] == "-g": results = buildCombinationResultWithSymbols(symbolList) else: results = buildResultWithSymbols(symbolList) for result in results: print(result) print("***********解析结束***********") if __name__ == "__main__": analyzeLinkMap()
执行脚本之后,输出结果示例如下:
从结果看到,不仅是我们编写的类的大小可以统计出来,第三方的也可以。在实际工程中,我们可以对一些可执行文件中过大的第三方库,思考其存在的必要性,对于不需要存在或者有替换方案的,可以考虑替换或删除。
2.4.1清理无用代码--AppCode
AppCode是一种智能的Objective-C集成开发环境,由专业的开发收费IDE的公司Jetbrains开发,具有这些特点:
- 最好的代码助手:IDE深入的了解代码结构,编辑器能提供准确的代码实现选择。通过代码生成节省了不必要的输入,减少了日常任务。
- 可靠的代码重构:安全、准确和可靠的代码重构允许我们随时修改和提升代码质量。
- 快速项目导航:通过类继承可以从方法导航到它的声明或使用处,或者直接从一个文件链接到另一个文件。支持即时跳转到项目中的任何文件、类、标号处,或者查看标号的实际使用者,并不仅仅是文本匹配那么简单。
- 代码质量追踪:支持对Objective-C、C、C++、JavaScript、CSS、HTML、XML和Xpath等进行动态代码分析。AppCode能让您避免潜在的错误,提示您哪些代码可以改善。此外,它还集成了Clang Static Analyzer。
- 强大的代码调试器:使用便携调试器中灵活的断点、窗口、框架视图和求值表达式调整您的应用或单元测试。
- 无缝集成:AppCode完美地集成大部分流行的版本控制系统,如Git, Mercurial、Perforce等,还集成了Kiwi测试框架、Dash和成分文档工具以及很多问题追踪器,提供与Xcode100%的互操作性。
在这里,我们可以用它的inspect code来扫描无用代码,包括无用的类、函数、宏定义、value、属性等,而safe delete功能使得删除一些由于runtime被调用到的代码时更加安全智能。扫描结果示例:
【说明】:如果工程很大,这个扫描的时间可能会比较长。我们现在的工程中,大概有2700个类,扫描时间在一个半小时。
2.4.2清理无用类
实际上,在2.4.1的扫描结果中,包含无用类,但2.4.1的扫描时间会比较长,另外扫描出来的内容也较多。如果只是需要清理无用类的话,可以用如下脚本:
#!/usr/bin/env python # 使用方法:python py文件 Xcode工程文件目录 # -*- coding:UTF-8 -*- import sys import os import re if len(sys.argv) == 1: print '请在.py文件后面输入工程路径' sys.exit() projectPath = sys.argv[1] print '工程路径为%s' % projectPath resourcefile = [] totalClass = set([]) unusedFile = [] pbxprojFile = [] def Getallfile(rootDir): for lists in os.listdir(rootDir): path = os.path.join(rootDir, lists) if os.path.isdir(path): Getallfile(path) else: ex = os.path.splitext(path)[1] if ex == '.m' or ex == '.mm' or ex == '.h': resourcefile.append(path) elif ex == '.pbxproj': pbxprojFile.append(path) Getallfile(projectPath) print '工程中所使用的类列表为:' for ff in resourcefile: print ff for e in pbxprojFile: f = open(e, 'r') content = f.read() array = re.findall(r'\s+([\w,\+]+\.[h,m]{1,2})\s+',content) see = set(array) totalClass = totalClass|see f.close() print '工程中所引用的.h与.m及.mm文件' for x in totalClass: print x print '--------------------------' for x in resourcefile: ex = os.path.splitext(x)[1] if ex == '.h': #.h头文件可以不用检查 continue fileName = os.path.split(x)[1] print fileName if fileName not in totalClass: unusedFile.append(x) for x in unusedFile: resourcefile.remove(x) print '未引用到工程的文件列表为:' writeFile = [] for unImport in unusedFile: ss = '未引用到工程的文件:%s\n' % unImport writeFile.append(ss) print unImport unusedFile = [] allClassDic = {} for x in resourcefile: f = open(x,'r') content = f.read() array = re.findall(r'@interface\s+([\w,\+]+)\s+:',content) for xx in array: allClassDic[xx] = x f.close() print '所有类及其路径:' for x in allClassDic.keys(): print x,':',allClassDic[x] def checkClass(path,className): f = open(path,'r') content = f.read() if os.path.splitext(path)[1] == '.h': match = re.search(r':\s+(%s)\s+' % className,content) else: match = re.search(r'(%s)\s+\w+' % className,content) f.close() if match: return True ivanyuan = 0 totalIvanyuan = len(allClassDic.keys()) for key in allClassDic.keys(): path = allClassDic[key] index = resourcefile.index(path) count = len(resourcefile) used = False offset = 1 ivanyuan += 1 print '完成',ivanyuan,'共:',totalIvanyuan,'path:%s'%path while index+offset < count or index-offset > 0: if index+offset < count: subPath = resourcefile[index+offset] if checkClass(subPath,key): used = True break if index - offset > 0: subPath = resourcefile[index-offset] if checkClass(subPath,key): used = True break offset += 1 if not used: str = '未使用的类:%s 文件路径:%s\n' %(key,path) unusedFile.append(str) writeFile.append(str) for p in unusedFile: print '未使用的类:%s' % p filePath = os.path.split(projectPath)[0] writePath = '%s/未使用的类.txt' % filePath f = open(writePath,'w+') f.writelines(writeFile) f.close()
同样的工程,这个脚本执行速度大概是三分钟,结果如下:
2.4.3清理无用方法
以往C++在链接时,没有被用到的类和方法是不会编进可执行文件里。但Objctive-C不同,由于它的动态性,它可以通过类名和方法名获取这个类和方法进行调用,所以编译器会把项目里所有OC源文件编进可执行文件里,哪怕该类和方法没有被使用到。
结合LinkMap文件的__TEXT.__text,通过正则表达式([+|-][.+\s(.+)]),我们可以提取当前可执行文件里所有objc类方法和实例方法(SelectorsAll)。再使用otool命令otool -v -s __DATA __objc_selrefs逆向__DATA.__objc_selrefs段,提取可执行文件里引用到的方法名(UsedSelectorsAll),我们可以大致分析出SelectorsAll里哪些方法是没有被引用的(SelectorsAll-UsedSelectorsAll)。
2.4.4编译选项优化
- Build Settings->Optimization Level:release版应该选择Fastest, Smalllest,这个选项会开启那些不增加代码大小的全部优化,并让可执行文件尽可能小。
- Build Settings->Strip Debug Symbols During Copy: release版应该设置为YES,可以去除不必要的调试符号。
- Build Settings->Symbols Hidden by Default:release版应该设置为YES,会把所有符号都定义成”private extern”。
2.4.5其他项
- 类/方法命名长度 :从LinkMap可以发现每个类和方法名都在__cstring段里都存了相应的字符串值,所以类和方法名的长短也是对可执行文件大小是有影响的,原因还是Objective-C的动态特性,因为需要通过类/方法名反射找到这个类/方法进行调用,Objective-C对象模型会把类名,方法名列表都保存下来。实际上这部分占用的长度比较小,中型项目也就几百K,可以忽略。
- ARC->MRC:ARC代码会在某些情况多出一些retain和release的指令,例如调用一个方法,它返回的对象会被retain,退出作用域后会被release,MRC就不需要,汇编指令变多,机器码变多,可执行文件就变大了。ARC对可执行文件大小的影响几乎都是在代码段,通过实验,结论是ARC大概会使代码段增加10%的size,考虑代码段占可执行文件大约有80%,估计对整个可执行文件的影响会是8%。但考虑到它的可实施性,可以忽略。
3.参考资料