PWA最重要的一个部分,service worker。它和传统的Worker相似但又不同。操作Service Worker的方法很简单,只需要简单的register一下。
Service Worker 讲道理是由两部分构成,一部分是 cache,还有一部分则是 Worker。所以,SW(Service Worker) 本身的执行,就完全不会阻碍当前 js 进程的执行,确保性能第一。那 SW 到底是怎么工作的呢?
- 后台进程: SW 就是一个 worker 独立于当前网页进程。
- 网络代理: SW 可以用来代理请求,缓存文件
- 灵活触发: 需要的时候调起,不需要的时候睡眠(这个是个坑)
- 异步控制: SW 内部使用 promise 来进行控制。
注册与使用
SW 实际上是挂载到 navigator 下的对象。在使用之前,我们需要先检查一下是否可用,如果可用,我们就要使用 SW 进行路由的注册缓存文件了。不过,这里有点争议。啥时候开始执行 SW 的注册呢?上面说过,SW 就是一个网络代理,用来捕获你网页的所有 fetch 请求。那么,是不是可以这么写?
这样理解逻辑上是没有任何问题的,关键在于,虽然 SW 是 worker ,但浏览器的资源也是有限的,浏览器分配给你网页的内存就这么多,你再开个 SW(这个很大的。。。),没有 jank 才怪嘞,而且如果你网页在一开始加载的时候有动画展示的话,那么这种方式基本上就 GG 了。 另外,如果算上用户第一次加载,那么这个卡顿或者延时就很大了。 当然,W3C 在制定相关规范时,肯定考虑到这点,实际上 SW 在你网页加载完成同样也能捕获已经发出的请求。所以,为了减少性能损耗,我们一般直接在 onload 事件里面注册 SW 即可。GOOGLE Jeff Posnick 针对这个加载,专门讨论了一下。有兴趣的可以参考一下。(特别提醒,如果想要测试注册 SW 可以使用隐身模式调试!!!)。
那当我注册成功时,怎样查看我注册的 SW 呢? 这很简单,直接打开 chrome://inspect/#service-workers 就可以查看,在当前浏览器中,正在注册的 SW。另外,还有一个 chrome://serviceworker-internals,用来查看当前浏览器中,所有注册好的 SW。 使用 SW 进行注册时,还有一个很重要的特性,即,SW 的作用域不同,监听的 fetch 请求也是不一样的。 例如,我们将注册路由换成: /example/sw.js
|
|
那么,SW 后面只会监听 /example 路由下的所有 fetch 请求,而不会去监听其他,比如 /jimmy,/sam 等路径下的。
SW 的生命周期
首先,SW 并不是你网页加载就与生俱来的。如果,你需要使用 SW,你首先需要注册一个 SW,让浏览器为你的网页分配一块内存空间来。并且,你能否注册成功,还需要看你缓存的资源量决定。如果,你需要缓存的静态资源全部保存成功,那么恭喜您,SW 安装成功。如果,其中有一个资源下载失败并且无法缓存,那么这次调起就是失败的。不过,SW 是由重试机制的,这点也不算特别坑。
检查完之后,SW 就进入待机状态。此时,SW 有两种状态,一种是 active,一种是 terminated。就是激活/睡眠。激活是为了工作,睡眠则为了节省内存。这是一开始设计的初衷。如果,SW 已经 OK,那么,你网页的资源都会被 SW 控制,当然,SW 第一次加载除外。
简单的流程图如下:
我们可以看到生命周期分为这么几个状态 安装中, 安装后, 激活中, 激活后, 废弃。
使用关键
Install
下面的部分是在另外一个 js 中的脚本,使用的是 worker 的编程方法。监听安装 SW 的代码也很简单,当安装成功后,就可以开始缓存文件了。
|
|
此时,SW 会检测你制定文件的缓存问题,如果,已经都缓存了,那么 OK,SW 安装成功。如果查到文件没有缓存,则会发送请求去获取,并且会带上 cache-bust 的 query string,来表示缓存的版本问题。当然,这只针对于第一次加载的情况。当所有的资源都已经下载成功,那么恭喜你可以进行下一步了。大家可以参考一下 google demo。
首先 event.waitUntil 你可以理解为 new Promise,它接受的实际参数只能是一个 promise,因为,caches 和 cache.addAll 返回的都是 Promise,这里就是一个串行的异步加载,当所有加载都成功时,那么 SW 就可以下一步。另外,event.waitUntil 还有另外一个重要好处,它可以用来延长一个事件作用的时间,这里特别针对于我们 SW 来说,比如我们使用 caches.open 是用来打开指定的缓存,但开启的时候,并不是一下就能调用成功,也有可能有一定延迟,由于系统会随时睡眠 SW,所以,为了防止执行中断,就需要使用 event.waitUntil 进行捕获。另外,event.waitUntil 会监听所有的异步 promise,如果其中一个 promise 是 reject 状态,那么该次 event 是失败的。这就导致,我们的 SW 开启失败。
不稳定加载
不过,如果其中一个文件下载失败的话,那么这次你的 SW 启动就告吹了,即,如果其中有一个 Promise 是使用 reject 的话,那就代表着–您这次启动是 GG 的。那,有没有其他办法在保证一定稳定性的前提下,去加载比较大的文件呢? 有的,那你别返回 cache.addAll 就ok了。什么个意思呢? 就这样:
这样,第一个 cache.addAll 是不会被捕获的,当然,由于异步的存在,这毋庸置疑会有一些问题。比如,当大文件还在加载的时候,SW 断开,那么这次请求就是无效的。不过,你这样写本来就算是一个 trick,这种情况在制定方案的时候,肯定也要考虑进去的。整个步骤,我们可以用下图表示:
缓存捕获(fetch)
该阶段就是事关整个网页能否正常打开的一个阶段–非常关键。在这一阶段,我们将学会,如何让 web 使用缓存,如何做向下兼容。 先看一个简单的格式:
|
|
首先看一下,第一个方法–event.respondWith,用来包含响应主页面请求的代码。当接受到 fetch 请求时,会直接返回 event.respondWith Promise 结果。我们在 worker 中,捕获页面所有的 fetch 请求。可以看到 event.request ,这个就是 fetch 的 request 流。我们通过 caches.match 捕获,然后返回 Promise 对象,用来进行响应的处理。大家看这段代码时,可能会有很多的疑惑,是的,一开始我看的时候也是,因为,根本没注释,有些 name 实际上是内核自带的。上面的就有:
- caches:这是用来控制缓存专门分离出来的一个对象。可以参考: caches
- fetch: 是现代浏览器用来代替 XMLHttpRequest 专门开发出的 ajax 请求。可以参考: fetch 通信
简单来说,caches.match 根据 event.request,在缓存空间中查找指定路径的缓存文件,如果匹配到,那么 response 是有内容的。如果没有的话,则再通过 fetch 进行捕获。整个流图如下:
OK,那现在有个问题,如果没有找到缓存,那么应该怎么做呢?
- 啥都不做,等下一次 SW 自己根据路由去缓存。
- 没找到,我手动 fetch 然后添加进缓存。
那怎么手动添加呢? 很简单,自己发送 fetch,然后使用 caches 进行缓存即可。不过,这里又涉及到另外一个概念,Request 和 Response 流。这是在 fetch 通信方式 很重要的两个概念。fetch 不仅分装了 ajax,而且在通信方式上也做了进一步的优化,同 node 一样,使用流来进行重用。众所周知,一个流一般只能使用一次,可以理解为喝矿泉水,只能喝一次,不过,如果我知道了该水的配方,那么我就可以量产该水,这就是流的复制。下面代码也基本使用到这两个概念,基本代码为:
那么整个流图变为:
而里面最关键的地方就是 stream 这是现在浏览器操作数据的一个新的标准。为了避免将数据一次性写入内存,我们这里引入了 stream,相当于一点一点的吐。这个和 nodeJS 里面的 stream 是一样的效果。你用上述哪个流图,这估计得取决于你自己的业务。
Update
在 SW 中的更新涉及到两块,一个是基本静态资源的更新,还有一个是 SW.js 文件的更新。这里,我们先说一下比较坑的 SW.js 的更新。
SW.js 的更新
SW.js 的更新不仅仅只是简单的更新,为了用户可靠性体验,里面还是有很多门道的。
- 首先更新 SW.js 文件,这是最主要的。只有更新 SW.js 文件之后,之后的流程才能触发。SW.js 的更新也很简单,直接改动 SW.js 文件即可。浏览器会自动检查差异性(就算只有 1B 的差异也行),然后进行获取。
- 新的 SW.js 文件开始下载,并且 install 事件被触发
- 此时,旧的 SW 还在工作,新的 SW 进入 waiting 状态。注意,此时并不存在替换
- 现在,两个 SW 同时存在,不过还是以前的 SW 在掌管当前网页。只有当 old SW 不工作,即,被 terminated 后,新的 SW 才会发生作用。具体行为就是,该网页被关闭一段时间,或者手动的清除 service worker。然后,新的 SW 就度过可 waiting 的状态。
- 一旦新的 SW 接管,则会触发 activate 事件。
整个流程图为:
如果上述步骤成功后,原来的 SW.js 就会被清除。但是,以前版本 SW.js 缓存文件没有被删除。针对于这一情况,我们可以在新的 SW.js 里面监听 activate 事件,进行相关资源的删除操作。当然,这里主要使用到的 API 和 caches 有很大的关系(因为,现在所有缓存的资源都在 caches 的控制下了)。比如,我以前的 SW 缓存的版本是 v1,现在是 v2。那么我需要将 v1 给删除掉,则代码为:
这里不仅可以用来作为版本的更新,还可以作为缓存目录的替换。比如,我想直接将 site-v1的缓存文件,替换为 ajax-v1 和 page-v1。我们一是需要先在 install 事件里面将 ajajx-v1 和 page-v1 缓存套件给注册了,然后,在 activate 里面将 site-v1 缓存给删除,实际代码和上面其实是一样的:
|
|
不过,sw.js 文件的更新是一个很纠结的过程。因为,它的替换是当 older SW 不工作的时候,new SW 才能发生作用。并且,浏览器何时关闭对应的 SW 又是一个未知数。不过,Service Worker 本身就是这么设计的。
skipWaiting
那有没有什么办法能够让 new SW 立即生效呢?有的,可以在 install 阶段使用 self.skipWaiting(); API。因为上面说到 new SW 加载后会触发 install 然后进入 waiting 状态。那么,我们可以直接在 install 阶段跳过等待,直接让 new SW 进行接管。
|
|
不过,这样有个弊端是,此时用户正在当前网页中,此时,older SW 会触发 activate 事件,删除相关的资源,这样会造成资源丢失,只能通过网络获取。并且后面的网络请求都会交给 new SW 进行捕获和处理。所以,用不用还得根据具体业务来看。
手动更新
上面的 SW 更新都是在一开始加载的时候进行的,那么,如果用户需要长时间停留在你的网页上,有没有什么手段,在间隔时间检查更新呢?
有的,可以使用 registration.update() 来完成。
另外,如果你一旦用到了 sw.js 并且确定路由之后,请千万不要在更改路径了,因为,浏览器判断 sw.js 是否更新,是根据 sw.js 的路径来的。如果你修改的 sw.js 路径,而以前的 sw.js 还在作用,那么你新的 sw 永远无法工作。除非你手动启用 update 进行更新。
文件更新
对于文件更新来说,整个机制就显得很简单了。可以说,你想要一个文件更新,只需要在 SW 的 fetch 阶段使用 caches 进行缓存即可。实际操作也很简单,一开始我们的 install 阶段的代码为:
我们只需要在这里简单的写下一下 prefetch 代码即可。
当成功获取到缓存之后, SW 并不会直接进行替换,他会等到用户下一次刷新页面过后,使用新的缓存文件。
不过,这里请注意,我并没有说,我们更新缓存只能在 install 里更新,事实上,更新缓存可以在任何地方执行。它主要的目的是用来更新 caches 里面缓存套件。我们提取一下代码:
|
|
现在,我们已经拿到了核心代码,那有没有什么简便的办法,让我们少写一些配置项,直接对每一个文件进行文件更新。 有的!!! 还记得上面的 fetch 事件吗?我们简单回顾一下它的代码:
实际上,我们可以将上面的核心代码做一些变化直接用上:
|
|
这里比较难的地方在于,我们并没有去捕获 fetch(fetchRequest)… 相关内容。也就是说,这一块是完全独立于我们的主体业务的。他的 fetch 只是用更新文件而已。我们可以使用一个流图进行表示:
用户更新
现在,为了更好的用户体验,我们可以做的更尊重用户一些。可以设置一个 button,告诉用户是否选择缓存指定文件。有同学可能会想到使用 postmessage API,来告诉 SW 执行相关的缓存信息。不过事实上,还有更简单的办法来完成,即,直接使用 caches 对象。caches 和 web worker 类似。都是直接挂载到 window 对象上的。所以,我们可以直接使用 caches 这个全局变量来进行搜索。那么该环节就不需要直接通过 SW,这个流程图可以画为:
代码可以参考:
|
|
不过上述的弊端也是有的,你把缓存的更新交给前台来做,实际上是增加的 js 主线程的负担,所以,按照一般的思路,我们是需要通过 message 来触发 service worker 的文件更新。
Message 通信
这里,我们简单介绍一下, client 和 service worker 相互通信。首先, service worker 向 client 发送消息很容易。
其中 event.ports 是根据 messageChannel API 构造出来的。该 API 的用法大家 MDN 一下吧。我们主要来看一下,如何在 clients 端,向 service worker 传递信息。这里就要借由:ServiceWorkerContainer 这个对象在 navigator 上获取。
|
|
在该 API 上挂载了一些方法和属性,用来获取 service worker 上的相关状态。来看一下:
其中和通信相关的就两个,一个是 controller,一个是 onmessage 事件。
- controller: 通过其上挂载的 postMessage API 向 Service worker 发送信息。
- onmessage: 接受 Service worker 发送的消息
即:
而 Service Worker 只要负责接收即可:
该方法常常用于,用来更新根目录的 html 文档,因为 SW 在更新的时候,并不会对根目录下的 HTML 文档进行更新。那么综上所述,一般而言,除了根文件而言,其他文件只要根据 hash 值来跟新即可。我们看一下整个的写法:
然后,在 index.js 中,添加 postMessage API。记住,每次网页打开时,并不会每次都触发 register,因为你已经接受 SW,所以,我们需要做额外的判断,来检测是否发送相关的消息。那么我们在代码中就可以添加如下内容:
如果想更深入了解 Message 的相关处理,可以参考:sendMessage
Sync 离线处理
Sync 是为了更好解决没网的条件下,一些请求发送成功性问题。该场景的处理常常针对即时性要求比较高的业务。比如:IM,弱网数据存储,朋友圈动态发送等。在以前,我们针对没网的条件是通过 navigator.onLine 来判断有没有网。不过,这种方式会比较生硬,在没网的条件下也无法正常发送请求。而 Sync 则可以帮助我们完整这件事,假如用户在发朋友圈,而此时又没网了。。。通过 Sync,用户可以正常的发送该朋友圈(此时,并未真正的发送请求),当网重新连接,会触发 Service Worker 中的 sync 事件。
直接看个例子:
需要说明的是,sync 触发条件时:有网!有网!有网!
即,当在没网条件时,该 sync 事件是不会被触发的。提醒大家一点,在测试的时候,最好是直接关闭 wifi 或者直接断网,使用 Chrome 浏览器内置的 offline 好像没有用。
另外,如果遇到用户重复发送时,需要注意使用不同的 tag 进行注册。因为,多个相同的 Sync 触发的时候,会自动进行合并,使用最新的。
|
|
Caches
上面大致了解了一下关于 SW 的基本流程,不过说到底,SW 只是一个容器,它的内涵只是一个驻留后台进程。我们想关心的是,在这进程里面,我们可以做些什么?
最主要的应该有两个东西,缓存和推送。这里我们主要讲解一下缓存。不过在SW 中,我们一般只能缓存 POST.上面在文件更新里面也讲了几个更新的方式。简单来说:
简单的情形上面已经说了,我这里专门将一下比较复杂的内容。
网络缓存同时进行
这种情形一般很少用的,一方面检查请求,一方面有检查缓存,然后看两个谁快,就用谁,我这里直接上代码吧:
总是更新
这里就和我们在后台配置的 Last-Modifier || Etag 一样,询问更新的文件内容,然后执行更新:
|
|
先返回后更新
这应该是目前为止最佳的体验,返回的时候不会影响正在发送的请求,而接受到的新的请求后,最新的文件会替换旧的文件。(这个就是前面写的代码):
最佳实践更新
上面说的哪几种都有某一方面的缺陷,那如果才能实现一种比较靠谱的缓存方案呢?我们借鉴一下上面提到的 message 通信方式,方案为:
我们对资源做的主要工作就是如果处理好 fetch 事件中的相关资源。这里,我们简单的通过文件类型这个点来进行划分,优先情况是缓存 js/css 文件。那在 fetch 事件中,我们就需要写为:
这样通过在 FILE_LISTS 添加想要缓存的文件类型即可。之后,我们只要在 message 中更新原来的 document 即可。
接下来,我们来详细了解一下关于 Cache Object 相关的内容。加深印象:
sw 使用的相关问题
缓存更新问题
在使用 sw.js 的时候,一定要注意它缓存头的设置,这里给大家一个通用的做法,就是通过 cache-control 来设置缓存头。即:
并且,除了这个设置外,还需要注意个点,即,sw.js 也有可能会被 ServiceWorker 捕获(只针对多个 SW)。所以,在设置缓存策略的时候,请一定要把 sw.js 过滤掉,否则,你会永远的看到 200 OK (from disk cache) 这样的 Status Code。
通常的解决办法有两种,一种是通过 url 匹配,还有一种是通过 referrer 解决。
- url: 直接利用 self.location 对象,获得当前 sw.js 的域名信息。比如,href、pathname 等。通过匹配 request.url 信息来判断。
- referrer: 浏览器在发送 sw.js 文件时,默认是直接通过 SW domain 发送的,即它的 referrer 为 self.location.href。例如:
|
|
如果你的 SW 只是作用于当前的页面,不存在多路径的 SW 话,可以不需要管 SW 资源,默认是不会触发 serviceWorker Fetch 事件的。
总的来说,referrer 用的会多一下,不同的 SW 有独特的 self.location,这样会造成匹配上的复杂度。最有效的规则就是,直接通过 referrer 检查其是否是通过 HTML 发送的即可。
总结
这里放一张总结图: