【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

前端性能优化实践之百度 App 个人主页优化

  • 2020-12-11
  • 本文字数:4188 字

    阅读完需:约 14 分钟

前端性能优化实践之百度App个人主页优化

前言


性能是每个前端工程师都应该关注的话题,通用的优化手段已有许多文章和实践,就不再赘述,本篇以百度 App 个人主页为例,聊聊针对业务特点进行的一些性能优化实践。


适用于:传统意义的优化手段能用的都用了:打包拆包,缩减体积和 HTTP 请求数、CDN 和按需加载等,但性能方面仍不太理想。


定义指标,建设报表


优秀方案的制定首先需要准确的数据做支撑。一般来说,前端性能指标包括 DOM readyFirst Contentful Paint白屏、首屏、用户可操作时间onload时间等,在实际中需要结合业务本身的特点进行定义,一般通用的指标定义并不能体现用户在当前业务下的真实体验。


个人主页是在百度 App 客户端内的 web 页面,有 hybrid 版(使用 file 协议直接加载本地 HTML 和 JS、CSS)和 web 版(打开一个 web URL)两种不同的打开方式。


首先,我们了解一下个人主页页面的结构:



头部区域展示当前作者的个人信息,tab 区域则是作者创作产生的内容。页面中所有数据均为异步获取。打开个人主页需要经历的过程可简化成以下几个:



其中耗时可划分为端耗时、网络和 server 耗时、前端渲染耗时三大部分:



根据以上过程,我们制定了定义指标的原则:


  • 主页页面展现的用户数据,是页面内 JS 请求数据后的异步渲染。因此首屏定义为:头部区域 和 tab 列表 第一屏数据渲染完成(用户真正可见,也即用户可操作时间)

  • 主页是由 san 搭建的 SPA 页面,HTML 上同步的 DOM 并没有真实内容出现,在首屏用户数据返回之前,页面均显示为 loading 态。因此白屏的定义为:页面 DOM 挂载上内容(用户首次看到页面不再空白的时间)

  • 由于在端内,iOS 和 安卓 onload 事件触发的时机不同,iOS 上资源加载会阻塞页面渲染,因此主页中针对 iOS 进行了调整,使用 rAF 使 iOS 在 JS 开始执行时即触发 onload,而安卓在首屏需要的图片、jsonp 等资源全部 load 完成后触发,因此该项指标主要用作辅助作用。



在报表建设的过程中,结合主页的业务形态(在 Android、iOS 双端均有 hybrid 版和 web 版两种)以及指标定义的含义,对整个过程的阶段尽可能细化,方式如下:


  • 将主页的三种版本进行分组打点:hybrid 版,hybrid 混合 web 版,web 版。即可避免数据干扰,又可通过控制上线时间,来进行实验对比

  • 添加系统、端内外、起始点作为筛选条件,排除不同的使用条件带来的数据差异,有助于缩小范围,定位分析

  • 根据主页的执行流程,将耗时流程细分,进一步定位问题,整个阶段细分为:端耗时(从点击到解析页面 head 顶部)、同步 HTML 内各 JS 引用阶段耗时、数据请求耗时、页面内端能力及各组件生命周期到首屏耗时(耗时部分在实际优化中逐步细化分析)


最终得到每个阶段的详细划分:



补充说明:


  • 端到端打点即以用户进行操作的时刻为起始点来记录数据,涵盖了从用户发起点击操作开始到页面完全展现之间的客户端耗时、网络耗时、server 耗时、前端各个阶段耗时的完整流程打点。

  • 其中,起始时间戳由上一个页面在用户操作时进行记录,并透传给个人主页;

  • 前端在每次发起网络请求时记录当前时间戳,接口的返回值中传回后端处理接口的耗时,二者的差值即 HTTP 连接的耗时。

  • 本次采用前端计算上报、平台展示的方案,打点前端控制灵活且迭代快。

  • 端耗时部分前期仅能计算从上一个页面点击到解析页面顶部的整体时间。


数据分析,提出优化方向


经过阶段一,拿到稳定的数据及页面各阶段耗时,分析并提出解决方案。



图中性能数据可以看出主要耗时阶段:端耗时、引入主 profile.js 到 js 内部开始耗时、首屏接口耗时、页面数据处理和渲染耗时,针对主要耗时阶段,优化分为以下几个方面:


  • 针对端耗时,前端配合端查找优化点

  • 针对首屏接口耗时,前端联合 server 进行接口优化

  • 针对 JS 内部耗时,前端进行自身代码优化


着手优化,逐步完善


主页入口较多,需要兼容不同入口情况以及历史遗留,个人主页业务基本情况如下:


  • 页面为 SPA 模式,但业务复杂,代码总体积较大

  • hybrid 版 首屏需要的资源由两个接口返回,且两个接口存在依赖,在前端串行执行

  • web 版顶部用户数据使用同步数据,依赖的 tab 接口与 hybrid 相同

  • hybrid 版 与 web 版 使用不同方式编译的同一套代码,但 web 版上第一个接口是同步的,数据随着 HTML 模板一起返回,而 hybrid 中所有接口均是异步

  • 使用的场景更多

  • 采用 file 协议加载 HTML 模板,用 jsonp 的方式请求后端数据接口


按照前端代码、工程化、server 端、客户端 native 框架四个方向分别针对性制定优化方案,以下主要介绍前端可控的代码和工程化两个方面。


前端代码


提前触发 iOS onload


  • 方法:使用 rAF 嵌套 setTimeout 提前触发 onload 事件,解决 iOS 资源加载阻塞页面显示的情况

  • 收益:用户可见的首屏时间不受 load 阻塞


减少首屏依赖


首屏时间可反映出用户对页面速度的感受,首屏所依赖的行为越多,就意味着用户需要等待的时间越长。因此,在性能优化中需要尽可能地减少在首屏前执行的操作、后置一些非必要的操作,可以在某种程度上提升用户体验。


经过一段时间的数据收集分析和代码 review,我们发现一些可以改进的地方:


  1. 在首屏前的一段逻辑里,JS 初始化一些数据时一次性调用了多个 native 提供的方法(端能力),导致端能力执行耗时 80 分位值 远超理论值;

  2. SPA 页面的最外层组件 App 在首个接口的数据返回后才进行挂载。对 web 版页面来说,首个接口是同步的,因此 App 在接口后挂载影响不大;但对使用场景更多的 hybrid 版 来说,页面的首屏至少需要两个接口,而所有接口请求均为异步,首个接口返回之前足以处理很多页面必要的逻辑,App 的挂载时机就显得非常不合适。

  3. 页面上埋了很多打点,除 pv 外其他多是页面上一些小组件的展现打点,在首屏之前频繁发送打点请求挤占了首屏中图片的加载时间。


结合以上发现,对代码进行了如下调整:


  • 调整与 native 端能力调用的执行顺序,首屏必要的留下,其他的后置,降低端能力执行耗时

  • 优化必要的代码信息(例如:个人主页从头用到尾的 runtime)初始化逻辑

  • 最外层 App 组件挂载不依赖接口数据,页面提前进行初始化,接口数据并行请求,异步渲染

  • 调整代码执行逻辑,关键逻辑移至 store,提前执行

  • 页面内部分打点等逻辑后置,减少页面挂载执行时间

  • 一波操作下来,获得了 80 分位 100ms+的收益。


首屏接口合并


上文有提到 hybrid 首屏需要在前端串行执行两个异步网络接口。从统计到的性能数据上看,在调用接口到拿到接口数据的过程中,耗时最长的是建立网络连接这个阶段,两个接口合并成一个接口,首屏时间上至少可以节省一次建立网络连接的时间(个人主页做到了 110ms+)。当然,接口合并也需要考虑 server 端的平响,考虑可能会牺牲的一丢丢白屏时间。


首屏接口前置


作为一个标准的 SPA 页面,个人主页页面上几乎所有的逻辑都是在公共 js 加载完成之后才开始执行,但 js 加载需要时间,尤其是首次加载、本地还没有缓存时。


hybrid 版本没有同步接口,只能在 js 加载完成之后才发出首屏的第一个请求,因此 hybrid 的版本在这里还存在可优化空间。


已知现在主流浏览器可并行处理的请求通常默认在 4~6 个,在加载 js 时去拿首屏需要的数据(jsonp),串行变并行,节省下来一份二者重叠的时间。


首屏接口前置就做了这么一些事:hybrid 打包时内联了一个体积尽可能小的极简代码包,去取首屏第一个接口的数据,完成后存入全局变量并以事件的形式派发出来。由于 iOS 部分场景中首次请求建立网络连接的耗时较长,顺便使用 native 端能力代替 jsonp,首屏接口前置中 iOS 收益在 260ms+,安卓 60ms 左右


工程化


工程化上进行的优化主要是在打包上下功夫,打包影响加载 JS、CSS 等资源的 http 耗时,在相同的条件下,包体积越小、请求次数越少,资源加载速度就越快。


打包和拆包


JS 和 CSS 资源打包合并,但需要考虑打包文件过大,单个请求耗时太长,需要结合业务场景合理拆分代码包。


主流浏览器可并行处理的请求通常默认在 4~6 个,可合理拆分资源包,利用并行请求缩减整体的响应时间。


通过合理划分包来最大程度上利用浏览器缓存。锁版本、保持每个小 bundle 未发生改变时哈希值稳定,较大的 JS、CSS 和图片等会被直接写进硬盘缓存。例如,个人主页根据代码的修改频率把 js 包拆成体积差不多大小的三个,其中 vendors 是各种 npm 依赖,版本稳定,通常不会发生改变。每次上线后用户浏览器只需要从 CDN 上请求另外两个代码包,vendors 则使用上次还未过期的本地缓存。


现代模式(modern mode)


通常,开发时我们使用 ES6(ES2015+) 来编写代码,ES6 的新特性可以让开发工作更便捷迅速但打包时需要用 Babel 进行转换来让我们的代码能运行在不支持 ES6 的浏览器上。转换后的代码会加入 polyfill,最直观的感受就是代码包体积增大。modern mode 在支持原生 ES6 的浏览器中,js 会通过 加载 ES 模块 的<script type="module"> 加载,而在不支持的浏览器中使用 <script nomodule> 来加载 babel 编译后的版本,并且支持 ES 模块的浏览器会忽略这种写法。在支持 ES6 的浏览器上使用 ES6 的版本,代码 bundle 体积更小、解析和执行的速度更快,何乐而不为呢?


从个人主页收集到的数据显示,目前已有 75% 的场景支持 modern mode,带来的性能收益也是非常可观:



白屏(ms)

首屏(ms)

实验组10551913
对照组11362081
收益81168


优化效果总结


优化后 JS 初始化耗时减少,首屏数据 jsonp 请求使用内联的极简代码包在页面准备完毕前就发出,在 jsonp 得到返回值前并行加载页面需要的其他 CSS 和 JS 资源;App 挂载和页面 runtime 初始化的时间提前,首屏数据回来后可以立马处理并渲染数据,而不被其他的一些操作占用宝贵的时间;打点等请求后置,首屏完毕前让 JS 专注于数据和渲染,同时腾出带宽加载图片等用户可见的资源。优化后的流程可用下图表示:



优化后数据分析



双端首屏时间均大幅度减小,首屏请求(两图中橙色部分)得益于 server 同学的接口性能优化,单单是平响就降低了 80ms+;而安卓上得益于端同学的 hybrid 框架优化,使得 hybrid 页面和本地 js 资源加载速度更快,效果更是显著。


总结


工欲善其事,必先利其器。在着手进行优化前,有大量的时间花在了选取数据参考点、收集数据上,通过反复的 code review、实验、业务逻辑推敲来确保每个关键指标反映的都是真实可信的数据。本文仅仅提供一种从数据着手的优化点分析方法,列举的优化方法与实际业务密不可分,并不具有太强的普适性,希望能给大家在解决瓶颈的道路上带来一点不一样的思路。




头图:Unsplash

作者:panming - 前端工程师

原文前端性能优化实践 之 百度App个人主页优化

来源:百度 App 技术 - 微信公众号 [ID:gh_59f5931152fe]

转载:著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


2020-12-11 21:392967

评论 1 条评论

发布
用户头像
想请教一下,各个阶段花费时间是通过什么工具统计到的
2020-12-15 11:13
回复
没有更多了
发现更多内容

戴尔G系列游戏本助玩家激战英特尔大师挑战赛

E科讯

《转》Spring事务传播机制

hasWhere

一个草根的日常杂碎(9月28日)

刘新吾

随笔杂谈 生活记录 社会百态

清华架构师整理分布式系统文档:从实现原理到系统实现,收藏吧

小Q

Java 程序员 架构 分布式 微服务

写给新人算法工程师

峰池

互联网 新人 推荐算法 算法工程师

关于深浅拷贝

西贝

Java 大前端 基础

Electron 快速入门及最新安装教程

程序员学院

Java html 大前端 Electron node,js

数字货币是大势所趋,新冠疫情后必须率先发展DCEP

CECBC

数字货币 银行

bug 回忆录(一)

志学Python

揭秘App的财富密码,剖析算法工程师价值来源

峰池

人工智能 互联网 推荐算法 互联网公司

奈学开发者社区分享:Java - 设计模式的7个设计原则

古月木易

Java 设计模式

一文纵览向量检索

华为云开发者联盟

数据 搜索 检索 检查

世界的下一个主宰——人工智能

CECBC

人工智能 智能时代

PPT画成这样,述职答辩还能过吗?

小傅哥

Java 小傅哥 流程图 架构师 PPT

Java进阶教程、大厂面试真题、项目实战,GitHub上这14个开源项目屌炸天了!

Java架构之路

Java 程序员 面试 编程语言 项目实战

初学源码之——银行案例手写IOC和AOP

Java架构师迁哥

华为全联接2020:环信AI领跑,输出5大行业最佳实践

DT极客

Binder那么弱怎么面大厂?

博文视点Broadview

Java android 通信 移动开发 Android进阶

实践分享丨物联网操作系统中的任务管理

华为云开发者联盟

华为 数据 物联网 进程

深入理解MySQL中事务隔离级别的实现原理

X先生

MySQL 数据库 后端 事务

实践案例丨利用小熊派开发板获取土壤湿度传感器的ADC值

华为云开发者联盟

物联网 IoT 传感

关于互联网留存和收益你知道多少—带你走近用户成长体系

滴滴普惠出行

一文领略 HTTP 的前世今生

yes

互联网 网络 HTTP 阿帕网

区块链会替代大数据吗?

CECBC

区块链 大数据

三年筑一“用”:长跑中的智能IP网络

脑极体

大学四年我是怎么写操作系统和计算机网络的?掏心掏肺的分享!

小林coding

学习 程序员 计算机网络 操作系统 计算机基础

公有云厂商哪家强?本月UCloud、百度云、阿里云位居三甲——2020年8月云主机性能评测排名

博睿数据

for-range造就循环永动机?快来看看go中for-range的那些事!

Gopher指北

后端 for Go 语言

奈学开发者社区分享:Java - 设计模式的7个设计原则

奈学教育

Java 设计模式 设计原则

H5选图预览到上传最佳实践

阿里云金融线TAM SRE专家服务团队

android H5

解读华为云原生数据库设计原则,打破传统数据库上云瓶颈

华为云开发者联盟

数据库 数据

前端性能优化实践之百度App个人主页优化_语言 & 开发_百度App技术_InfoQ精选文章