携程是如何做React Native优化的

【作者简介】赵辛贵,携程无线开发高级技术经理,目前主要负责React Native框架在携程内部的使用推广和性能优化。

本文来自赵辛贵在携程技术中心主办的React Natvie Meetup中的分享。现场视频戳这里,文末可下载PPT。原文在:http://techshow.ctrip.com/archives/1459.html 

————————————————————————

ReactNative(下文简称RN)开源已经一年多时间,国内各大互联网公司都在使用,携程也在今年5月份投入资源开始引入,并推广给多个业务团队使用,本文将会分享我们遇到的一些问题以及我们的优化方案。

一、背景和使用情况介绍

为什么会引入ReactNative?

1. AppSize占用

携程旅行App从11年开始开发,至今已有5年多时间,随着各项业务功能的全面移动化,以及公司mobile first策略的指引下,App功能越来越多,越来越臃肿,Size达到将近100MB,而同样功能,使用RN开发,Size远远小于Native开发,RN的引入,可以支持我们App的可持续健康的发展。

2. 用户体验佳

RN通过JavascriptCore解析Javascript模块,转换成原生native组件渲染,相比H5页面不再局限于WebView、渲染性能长足提升,运行用户体验可以媲美native。

3. 相对成熟

Android和iOS的RN都已经开源,原生提供的组件和API相对丰富,且跨平台基本一致,对外接口也趋于稳定,适合业务开发。

4. 支持动态更新

纯原生的开发,android上通过插件化框架,可以实现动态加载远端代码。但是在iOS上,因为系统限制,不能动态执行远端下载的Native代码,而RN完全满足该需求。

5. 跨平台

RN提供的API和组件,大多能跨平台使用,对少数不支持的组件,我们再做二次封装抹平,可以让业务开发人员开发一份代码,运行在iOS&Android 两个平台上。这样能够大大提供开发效率,降低开发维护成本。

如何引入?

基于RN 0.30版本,开发了支持携程业务团队快速便捷开发的CRN框架,框架主要从以下几个方面着手。

1. 工具

  • cli工具,负责CRN工程创建,运行;

  • pack工具,负责打包;

2. 控件

  • 对RN官方提供的API和组件,实现跨平台支持;

  • 新增携程业务相关的API和组件,方便业务接入;

4. 稳定性、性能优化

  • RN页面加载提速,实现秒开;

  • 稳定性提升,消除RN导致的crash;

3. 发布

  • 统一管理所有RN业务的相关发布;

  • 差分增量支持,尽可能减小文件大小;

除此之外,我们还从文档以及技术支持等方面,支撑其作为一个完整的产品开发框架。

业务的使用

下面一幅图说明了RN在携程业务中的使用情况,总共4个版本的开发时间,每个版本大约1个月时间。

1

前面2个版本主要是CRN基础功能完成和线上验证,后面2个版本稳定性优化和API跨平台抹平基本完成,业务数和页面数量猛增。

二、遇到的问题和优化

RN常见问题介绍

所有做ReactNative开发的团队,或多或少都面临着以下4个问题需要解决。

1. 打包出来的JSBundle过大;

2. 首次进入RN页面加载缓慢;

3. 稳定性不够,有大量因为RN导致的crash;

4. 大数据量时候listview加载卡顿;

接下来,我们就这四个问题来一一探讨。

2

从这张图中可以看出,最大的瓶颈在JS init+Require,这块时间就是JSBundle的执行时间,为了提升页面加载速度,这块时间我们需要想办法优化。

JSBundle文件过大&页面加载慢

先来说一组数据,一个Helloorld的App,如果使用0.30 RN 官方命令react-native bundle打包出来的JSBundle文件大小大约为531KB,RN框架JavaScript本身占了530KB, zip压缩之后也有148KB。

如果只有一两个业务使用,这点大小算不了什么,但是对于我们这种动辄几十个业务的场景,如果每个业务的JSBundle都需要这么大的一个RN框架本身,那将是不可接受的。

因此,我们需要对RN官方的打包脚本做改造,将框架代码拆分出来,让所有业务使用一份框架代码。

开始拆分之前, 我们先以HelloWorld的RNApp为基础介绍几个背景知识。

3

上述是一个HelloWorld RNApp代码的结构,基本分为3部分

头部:各依赖模块引用部分;

中间:入口模块和各业务模块定义部分;

尾部:入口模块注册部分;

4

上述是HelloWorld RNApp打包之后JSBundle文件的结构,基本分为3部分 头部:全局定义,主要是define,require等全局模块的定义; 中间:模块定义,RN框架和业务的各个模块定义; 尾部:引擎初始化和入口函数执行;

__d是RN自定义的define,符合CommonJS规范,__d后面的数字是模块的id,是在RN打包过程中,解析依赖关系,自增长生成的。

如果所有业务代码,都遵照一个规则:入口JS文件首先require的都是react/react-native, 则打包生成的JSBundle里面react/react-native相关的模块id都是固定的。

拆分方案一

基于上面2点背景知识介绍,我们很容易发现,如果将打包之后的JSBundle文件,拆分成2部分(框架部分+业务模块部分),使用的时候合并起来,然后去加载,即可实现拆分功能。

具体实现步骤:

  1. 创建一个空工程,入口文件只需要2行代码,require react/react-native即可;

  2. 使用react-native bundle命令,打包该入口文件,生成common.js;

  3. 使用react-native bundle打包业务工程(有一点要保证,业务工程入口文件前面2行代码也是require react/react-native), 生成business_all.js;

  4. 开发工具,从business_all.js里面删除common.js的内容,剩下的就是business.js;

  5. App加载的时候将common.js和business.js合并在一起,然后加载;

貌似功能完成,可是回到Dive into React Native performance, 这么做还是优化不了JSBundle的执行时间,因为我们不能把拆分开的2个文件分别执行,因为加载common.js会提示找不到RNApp的入口,先执行business.js,会提示一堆依赖的RN模块找不到。

显然,这种拆分方式不能满足我们这种需要。

那这个方案就完全没有价值吗?不是的,如果你做的是一个纯RNApp,native只是一个壳,里面业务全是RN开发的,完全可以使用这种方式做拆分,这种方案简单,无侵入,实现成本低,不需要修改任何RN打包代码和RN Runtime代码。

拆分方案二

RN框架部分文件(common.js)大小530KB,如此大的js文件,占用了绝大部分的JS执行时间,这块时间如果能放到后台预先做完,进入业务也只需执行业务页面的几个JS文件,将可以大大提升页面加载速度,参考上面的RN性能瓶颈图,预估可以提升100%。

按照这个思路,能后台加载的JS文件, 实际上是就是一个RNApp,因此 我们设计了一个空白页面的FakeApp,这个FakeApp做一件事情,就是监听要显示的真实的业务JS模块,收到监听之后,渲染业务模块,显示页面。

FakeApp设计如下:

5

为了实现该拆包方案,需要改造react-native的打包命令;

  1. 基于FakeApp打common.js包的时候, 需要记录RN各个模块名和模块id之间的mapping关系;

  2. 打业务模块包的时候,判断,如果已经在mapping文件里面的模块,不要打包到业务包中

改造页面加载流程:

  1. 因为要能够后台加载,所以需分离UI和JS加载引擎<iOS-RCTBridge, Android-ReactInstanceManager>;

  2. 进入业务RN页面时候,获取预加载好的JS引擎,然后发送消息给FakeApp,告知该渲染的业务JS模块;

通过后台预加载,省去了绝大部分的JS加载时间,似乎问题已经完美解决。

但是,如果随着业务不断膨胀,一个RN业务JS代码也达到500KB,进入这个业务页面,500多KB JS文件读取出来,执行,整个JS执行的时间瓶颈会再次出现。

拆分方案三

正在此时,我们研究RN在Facebook App里面的使用情况,发现了Unbundle,简单点说,就是将所有的JS模块都拆分成独立的文件。

下面截图就是unbundle打包的文件格式:

6

  1. entry.js就是global部分定义+RNApp入口;

  2. UNBUNDLE文件是用于标识这是一个unbundle包的flag;

  3. 12.js,13.js就是各个模块,文件名就是模块id;

  4. 在业务执行,需要加载模块(require)的时候,就去磁盘查找该文件,读取、执行。

RN里面加载模块流程说明,以require(66666)模块为例:

  1. 首先从__d<就是前文提到的define>的缓存列表里面查找是否有定义过模块66666,如果有,直接返回,如果没有走到下面第二步的nativeRequire;

  2. nativeRequire根据模块id,查找文件所在路径,读取文件内容;

  3. 定义模块,_d(66666)=eval(JS文件内容),会将这个模块ID和JS代码执行结果记录在define的缓存列表里面;

打包通过react-native unbundle 命令,可以给android平台打出这样的unbundle包。

顺便提一下,这个unbundle方案,只在android上有效,打ios平台的unbundle包,是打不出来的,在RN的打包脚本上有一行注释,大致意思是在iOS上众多小文件读取,文件IO效率不够高,android上没这样的问题,然后判断如果是打iOS的unbundle包的时候,直接return了。

相对应的,iOS开发了一个prepack的打包模式,简单点说,就是把所有的JS模块打包到一个文件里面,打包成一个二进制文件,并固定0xFB0BD1E5为文件开始,这个二进制文件里面有个meta-table,记录各个模块在文件中的相对位置,在加载模块(require)的时候,通过fseek,找到相应的文件开始,读取,执行。

在Unbundle的启发下,我们修改打包工具,开发了CRNUnbunle,做了简单的优化,把众多零散的JS文件做了简单的合并。

7

将common部分的JS文件,合并成一个common_ios(android).js.

_crn_config记录了这个RNApp的入口模块ID以及其他配置信息,详见下图:

8

  1. main_module为当前业务模块入口模块ID;

  2. module_path为业务模块JS文件所在当前包的相对路径;

  3. 666666=0.js,说明666666这个模块在0.js文件里面;

做完这个拆包和加载优化之后,我们用自己的几个业务做了下测试,下图是当时的测试验证数据。

9

可以看出,iOS和android基本都比官方打包方式的加载时间,减少了50%。

这是自己单机测试的数据,那上线之后,数据如何呢?

下图,是我们分析一天的数据,得出的平均值<排除掉了5s以上的异常数据,后面实测下来5s以上数据极少>;

10

看到这个数据,发现和我们自己测试的基本一致,但是还有一个疑问,加载的时间分布,是否服从正态分布,会不会很离散,快的设备很快,慢的设备很慢呢?

然后我又进一步分析这一天的数据,按照页面加载时间区间分布统计。

11

看图上数据,很明显,iOS&Android基本一致,将近98%的用户都能在1s内加载完成页面,符合我们期望的正态分布,所以bundle拆分到此基本完成。

关于这个数据,补充一下,先前看业到一篇58同城同学分享的RN实践的文章,里面也曾提到他们业务页面加载时间的数据,有兴趣的同学可以去比较下。

页面加载优化

按照上述的拆包方案实现后,我们的RN页面加载流程大致是这样的。

12

从上文的优化可以看出,缓存了common.js部分的JS执行引擎(iOS RCTBridge, Android ReactInstanceManager),页面加载可以大大提速,那对于已经被业务使用过的JS执行引擎,该如何处理呢?

缓存,还是缓存,不要立即释放,等符合一定条件之后,再释放。

对JS执行引擎,我们定义了以下的一些生命周期状态。

13

  1. JS执行引擎加载common.js的时候,处于loading状态,如果加载出错,处于Error状态;

  2. 框架common.js加载结束,JS执行引擎状态设置为Ready;

  3. Ready状态的JS执行引擎被使用,则修改状态为Dirty;

  4. Dirty状态的JS执行引擎达到一定条件<比如Dirty的JS执行引擎总数达到2个时候>,开始回收;

  5. 回收过程很简单,就是将加载(require)的业务代码,从__d<前文提到的define>的缓存模块数组里面删除掉就可以了,回收完成之后,又变成还原状态;

错误处理

RN刚上线的前2个版本,我们发现有大量因为RN导致的crash,常见的错误有以下几种。

iOS的crash问题处理

14

iOS的crash,基本都来自RCTFatalException,都是RCTFatal抛出错误信息所知, 处理也相对简单, 设置自己的Error Handler即可。

void RCTSetFatalHandler(RCTFatalHandler fatalHandler);

一般初次开发RN应用的开发人员,都没有留意这一点,其实查阅下RN的源代码,RCTFatal的注释写的还比较清楚,分析源码也可以发现在生产环境的时候,RCTFatal会直接Raise Exception,然后crash。

15

Android的crash问题处理

Android的crash点相对较多,大致会出现在以下几个场景。

  1. bundle加载过程中的RuntimeException;

  2. JS执行过程中的,处理NativeExceptionsManagerModule;

  3. native模块执行出错, 处理NativeModuleCallExceptionHandler

  4. so lib加载失败,经典的java.lang.UnsatisfiedLinkError, 这种问题,解决方案很简单,给System.load添加try catch,并且在catch里面做补偿,可以大大降低由此导致的crash;

对于第一点提到的RuntimeException,我们收集到的日志如下:

不能连接到dev server,看到之后很不明白,明明是生产环境,怎么会报这样的错误呢?

16

偶现的Javascript执行出错,怎么会走到RuntimeException呢?

17

问题的解决很简单,这些RuntimeException,都是从ReactInstanceManagerImp.java的createReactContext抛出来的, 处理掉就可以了。

再补充一点,这些错误处理之后,都需要一层一层的传递到最上层的UI界面,这样才能友好的给用户提示。

ListView性能问题

先来看一张截图,是从RN提供的UIExplore demo跑出来的。

18

可以清楚的看到,超出屏幕的条目,依然被渲染了。没有实现cell重用,导致数据量大时候,卡顿。

为适应大数据量listview的场景,我们专门安排资源,开发了可重用cell的CRNListView,iOS借鉴了第三方的ReactNativeTableView的实现,开发了可重用cell的listview,接口和官方原生的基本一致,Android借鉴iOS的方案,采用RecyclerView实现了类似的可重用cell的listview,同时我们还做了一些扩展,把常用的下拉刷新,载入更多,右侧字母索引栏等功能,都增加了进去。

实际测试下来,数据量少时候,和RN提供的listview,性能基本一致,但当数据量大时候,CRNListView优势明显,下面这张图,是我们在android上的测试数据。

19

三、下一阶段的规划

1. CRN-Web的开发

同样的功能,CRN一套代码可以在iOS和android 2个平台运行。但对于业务开发团队,他们还需要维护H5平台同样的功能,如果我们能够将CRN代码,通过类似webpack这样的工具,直接转换过去就能在H5平台上运行起来,就可以做到一套代码,三端运行,可以大大降低业务团队的开发维护成本。

目前,我们已经再拿一些业务的CRN代码做转换验证,初步验证可行,还在持续优化完善中。

2. 单JS执行引擎的实现

RN还有一个比较大的性能瓶颈在于内存耗用大.做过这样的测试,在一个HelloWorld的RN工程里面,打开一个Native/RN/H5 Hybrid的HelloWorld页面,native显示页面内存占用0.2MB,RN占用10MB,H5 Hybrid占用20MB。如果大量业务都使用RN开发,JS执行引擎大量创建,会耗费大量内存,但是从JS执行引擎的执行过程,运行逻辑来说,只要做好业务隔离,完全是可以在一个执行引擎里面运行多个业务功能的JS代码的。我们正在做相关尝试,相信在未来1-2个版本时间,可以完成线上验证。

3. AMD模式的加载尝试

RN打包默认是CommonJS规范,整个JSBundle一次读入内存,一次全部执行完成,所以耗费大量时间。如果能够用AMD模式改造,JSBundle读取到内存,但是只执行用到的模块,真正做到按需加载,相信对页面加载效率,会有更近一步的提升。