NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

如何安全的运行第三方 JavaScript 代码(中)?

  • 2019-09-23
  • 本文字数:4438 字

    阅读完需:约 15 分钟

如何安全的运行第三方 JavaScript 代码(中)?

在本文中,我们将为读者详细介绍如何在自己的软件中安全地运行第三方 JavaScript 代码。



接上文

在主线程上运行的含义

在我们深入进行第二种尝试前,我们要先退一步,并重新考察允许插件在主线程上运行到底意味着什么。毕竟,一开始并没有考虑它,因为我们知道这可能是危险的。在主线程上运行听起来很像 eval(UNSAFE_CODE)方式。


在主线程上运行的好处是插件可以:


1.直接编辑文档而不是副本,避免加载时间问题。


2.可以运行复杂的组件更新和约束逻辑,而无需为代码置办两个副本。


3.在需要同步 API 时,可以使用同步 API 调用。这样的话,更新的加载或刷新就不会发生混淆。


4.以更直观的方式编写代码:插件只是自动执行用户可以使用 UI 手动执行的操作。


但是,这时我们又遇到了下列问题:


1.插件可挂起,但无法中断插件。


2.插件可以像 figma.com 一样发出网络请求。


3.插件可以访问和修改全局状态,例如修改 UI,甚至可以执行恶意操作,例如修改({}).proto 的值,从而危害所有新建的和现有的 JavaScript 对象。


经过斟酌后,我们决定放弃第 1 项要求。当插件被冻结时,会影响 Figma 的稳定性。然而,我们的插件模型的工作原理是,它们只处理显式的用户操作。通过在插件运行时更改 UI,冻结将始终被认为是插件所致。这也意味着插件无法“破坏”文档。


eval 的危险性体现在哪些方面?


为了解决插件能够发出网络请求和访问全局状态的问题,我们必须首先确切地了解“通过 eval 函数执行任意 JavaScript 代码是危险的”这句话到底意味着什么。


对于某些只能进行 7x24x60x60 这样的算术运算的 JavaScript 变体,我们称之为 SimpleScript,那么使用 eval 方法的话还是很安全的。


如果继续为 SimpleScript 添加其他特性,如变量赋值和 if 语句,使其更像编程语言,这时它仍然非常安全。归根结底,它本质上仍然归结为做算术。如果继续添加函数求值(function evaluation)特性,现在该语言就具备了λ演算和图灵完备性。


换句话说,JavaScript 未必一定就是危险的。在最简化的形式中,它只是一种做算术的扩展方式。真正的危险源是它的输入和输出访问权限,其中包括网络访问、DOM 访问等,即危险的是浏览器的应用程序接口。


我们知道,API 都是全局变量,因此,我们需要隐藏全局变量!


隐藏全局变量


现在,隐藏全局变量在理论上听起来不错,但仅通过“隐藏”它们来创建安全的实现还是很困难的。例如,我们可以考虑删除 window 对象的所有属性,或将它们设置为 null,但代码仍然可以访问全局值,例如({}).constructor。所以,找出泄漏全局变量值的所有可能方式是非常具有挑战性的。


相反,我们需要一些更强大的沙箱形式,使得这些全局变量值从一开始就不存在。


换句话说,JavaScript 并不一定非常危险。


考虑前面介绍的仅支持算术的 SimpleScript 语言,大家可以试着编写一个算术运算程序。在该程序的任何合理实现中,SimpleScript 将无法执行除算术之外的任何操作。


现在,我们继续扩展 SimpleScript,使其支持更多语言功能,直到它变成 JavaScript 为止,现在,我们将该程序称为解释器,它决定了 JavaScript(动态解释语言)的运行方式。

尝试 #2:将 JavaScript 解释器编译为 WebAssembly

对于像我们这样的小型创业公司来说,实现 JavaScript 编译器是不太现实的。相反,为了验证这种方法,我们采用了Duktape,这是一个用 C++编写的轻量级 JavaScript 解释器,并将其编译为 WebAssembly。


为了确认它是否有效,我们运行了test262测试,它是标准的 JavaScript 测试套件。它通过了所有 ES5 测试,只有少量不重要的测试失败了。要使用 Duktape 运行插件代码,我们需要使用编译为 WebAssembly 的解释器来调用 eval 函数。


这种方法有哪些特性?


这个解释器在主线程中运行,这意味着我们可以创建一个基于主线程的 API。


它是安全的,因为 Duktape 不支持任何浏览器 API,此外,它是作为 WebAssembly 运行的,而后者是一个无法访问浏览器 API 的沙箱环境。换句话说,默认情况下,插件代码只能通过显式的白名单 API 与外界进行通信。


它比常规 JavaScript 的速度要慢,因为这个解释器不支持 JIT,但这并不重要。


它需要浏览器编译一个中等大小的 WASM 二进制文件,这需要一些开销。


默认情况下,浏览器调试工具无法使用,但我们花了一天时间为解释器实现了一个控制台,以验证它至少可以调试插件。


Duktape 仅支持 ES5,但在 Web 社区中,通常会使用Babel等工具交叉编译较新的 JavaScript 版本。


(提示:几个月后,Fabrice Bellard 发布了QuickJS,它原生支持 ES6。)


现在,我们要编译一个 JavaScript 解释器!根据你作为程序员的爱好或审美倾向,您可能会想:


这太棒了!


或者


……这是要搞啥?还要自己搞 JavaScript 引擎,那操作系统是不是也要自己搞一个呀?


当然,这些质疑声是非常正常的! 除非我们有绝对的必要,否则最好避免重新实现浏览器。在实现整个渲染系统方面,我们花费大量的精力,因为这对于性能和跨浏览器支持来说是非常必要的,并且令人高兴的是,我们的确做到了,但我们仍然要郑重对读者说一声:不要重新发明轮子


注意,这并非我们最终采用的方法,因为后面还有更好的方法。那我们为什么要在这里介绍它呢?这是因为,这对于理解我们最终沙箱模型来说是非常有帮助的,毕竟我们的模型是非常复杂的。

尝试 #3:Realms

虽然编译 JS 解释器是一种很有前途的方法,但除此之外,还有一个方法非常需要考虑——Realms shim技术,其创建者为Agoric


这项技术将创建沙箱和支持插件描述为潜在的用例。这真是一种前途无量的描述方法!Realms API 看起来大致如下所示:


let g = window; // outer globallet r = new Realm(); // realm object let f = r.evaluate("(function() { return 17 })"); f() === 17 // true Reflect.getPrototypeOf(f) === g.Function.prototype // falseReflect.getPrototypeOf(f) === r.global.Function.prototype // true
复制代码


这种技术实际上可以使用现有的 JavaScript 特性来实现,尽管这些特性鲜为人知。沙箱的一项任务就是隐藏全局变量。这个 shim 库的核心功能大致如下所示:


function simplifiedEval(scopeProxy, userCode) {  'use strict'  with (scopeProxy) {    eval(userCode)  }}
复制代码


这是用于演示目的的简化版本;真实版本中还是有一些细微差别的。但是,它展示了其中最关键的部分:with 语句和 Proxy 对象。


其中,with(obj)语句创建了一个作用域,在该作用域内可以使用 obj 的属性查找变量。在这个例子中,我们可以将变量 PI、cos 和 sin 解析为 Math 对象的属性。另一方面,console 并不是 Math 的属性,因此需要在全局作用域内进行解析。


with (Math) {  a = PI * r * r  x = r * cos(PI)  y = r * sin(PI)  console.log(x,  y)}
复制代码


代理对象是 JavaScript 对象最动态的一种形式。


· 最基本的 JavaScript 对象可以通过访问 obj.x 返回属性的值。


· 更高级的 JavaScript 对象可以具有 getter 属性,用于返回函数的计算结果。实际上,访问 obj.x 就是调用 x 的 getter 属性。


· 代理可以通过运行函数 get 来访问任意属性。


对于下面的代理(由于它仅用于演示,所以进行了相应的简化处理)来说,当我们尝试访问它的任何属性时,都将返回 undefined,而不是对象 whitelist 中的属性值。


const scopeProxy = new Proxy(whitelist, {  get(target, prop) {    // here, target === whitelist    if (prop in target) {      return target[prop]    }    return undefined  }}
复制代码


现在,当您将这个代理用作 with 对象的参数时,它将拦截所有变量的解析过程,并且永远不会使用全局作用域来解析变量:


with (proxy) {  document // undefined!  eval("xhr") // undefined!}
复制代码


不过,这种方法仍然可以通过诸如({}).constructor 之类的表达式来访问某些全局变量。此外,沙箱也确实需要访问一些全局变量。例如,Object 是一个全局对象,并且许多合法的 JavaScript 代码(例如 Object.keys)都需要用到它。


为了让插件既能够访问这些全局变量又不会捅娄子,Realms 沙箱支持通过创建同源的 iframe 来实例化所有这些全局变量的新副本。当然,这个 iframe 不会像在尝试 #1 中那样用作沙箱。并且,同源 iframe 不会受 CORS 的限制。


相反,当在与父文档同源的情况下创建时:


1.它附带了所有全局变量的单独副本,例如 Object.prototype 等。


2.可以从父文档访问这些全局变量。



这些全局变量将被放进代理对象的“白名单”中,这样的话,插件就可以访问它们了。最后,这个新的还附带了一个新的“eval”函数副本,它与现有的函数有一个重要的区别:即使只有通过({}).constructor 这样的语法才能访问的内置值,也将会解析为 iframe 的副本。


这种基于 Realms 的沙箱方法有许多优秀的属性:


它在主线程上运行。


速度很快,因为它可以使用浏览器的 JavaScript JIT 来执行代码。


浏览器开发工具仍可以正常使用。


即使如此,我们还面临令一个非常重要的问题:这种方法安全吗?(本文转自嘶吼)


(未完待续)


系列文章


如何安全的运行第三方 JavaScript 代码(上)?


2019-09-23 10:592134

评论

发布
暂无评论
发现更多内容

并发程序的隐藏杀手——假共享(False Sharing)

了不起的程序猿

编程 高并发 java程序员

使用python获取浏览器收藏夹和历史浏览记录,然后可以...

技能实验室

签约计划第三季

SAP ABAP SteamPunk 蒸汽朋克的最新进展 - 嵌入式蒸汽朋克

Jerry Wang

云原生 Cloud 云平台 SAP 8月月更

5种kafka消费端性能优化方法

华为云开发者联盟

大数据 kafka 后端 MRS

信创是什么意思?涉及哪些行业?为什么要发展信创?

行云管家

信息安全 信创

如何在Linux (CentOS7.3) 下安装JDK1.8?【一篇文章教会你】

Bug终结者

java; Linux Kenel 8月月更

快速打造安全的车联网平台

Geek_99967b

小程序

《分布式云最佳实践》分论坛,8月11日深圳见

阿里云弹性计算

分布式云 飞天 数字化升级 一云多形态

百度APP Android包体积优化实践(三)资源优化

百度Geek说

Andriod

《2022 年上半年全球独角兽企业发展研究报告》发布——DEMO WORLD世界创新峰会圆满落幕

创业邦

深入聊聊Linux五种IO模型

C++后台开发

epoll 网络模型 I/O模型 C/C++后台开发 C/C++开发

如何通过使用“缓存”相关技术,解决“高并发”的业务场景案例?

冉然学Java

高并发 java; 单线程 redis'

《中国综合算力指数》《中国算力白皮书》《中国存力白皮书》《中国运力白皮书》在首届算力大会上重磅发出

蓝海大脑GPU

2022年7月国产数据库大事记-墨天轮

墨天轮

数据库 腾讯云 GaussDB 国产数据库 KingBase

Spring之JDK动态代理与CGLIB动态代理

echoes

化繁为简,聊一聊复制状态机系统架构抽象

阿里技术

数据库 架构

Vue3 初探

怀府风

大数据开发,Hadoop Spark太重?你试试esProc SPL

华为云开发者联盟

大数据 开源 后端

直播系统开发——直播间架构的设计及难点分析

开源直播系统源码

软件开发 语聊房 语音聊天源码 直播系统开发

攻防视角下,初创企业安全实战经验分享

声网

网络安全

IDC:阿里云稳居中国大数据平台公有云市场第一位

阿里云大数据AI技术

阿里云

Pisanix v0.2.0 发布|新增动态读写分离支持

SphereEx

数据库 开源 ShardingSphere SphereEx

HTTP和HTTPS的区别

开发微hkkf5566

基于 Next.js实现在线Excel

葡萄城技术团队

前端 在线excel nextjs 表格 控件

兆骑科创创新创业大赛活动举办,线上直播路演,投融资对接

兆骑科创凤阁

Mybatis中#{}和${}的区别

开发微hkkf5566

中大型商业银行堡垒机升级改造就用行云管家!必看!

行云管家

信息安全 银行 堡垒机 IT安全

开发者独立搭建一个跨模态搜索应用有多难?

Jina AI

深度学习 云原生 神经搜索 跨模态应用 多模态数据

从-99打造Sentinel高可用集群限流中间件

艾小仙

Java 高可用 sentinel 集群限流

重构指标之如何监控代码圈复杂度

京东科技开发者

测试 重构 软件重构 分布式应用软件

如何防止重复下单?

三分恶

8月月更

如何安全的运行第三方 JavaScript 代码(中)?_语言 & 开发_Rudi Chen_InfoQ精选文章