2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

如何安全的运行第三方 JavaScript 代码(中)?

  • 2019-09-23
  • 本文字数:4438 字

    阅读完需:约 15 分钟

如何安全的运行第三方 JavaScript 代码(中)?

在本文中,我们将为读者详细介绍如何在自己的软件中安全地运行第三方 JavaScript 代码。



接上文

在主线程上运行的含义

在我们深入进行第二种尝试前,我们要先退一步,并重新考察允许插件在主线程上运行到底意味着什么。毕竟,一开始并没有考虑它,因为我们知道这可能是危险的。在主线程上运行听起来很像 eval(UNSAFE_CODE)方式。


在主线程上运行的好处是插件可以:


1.直接编辑文档而不是副本,避免加载时间问题。


2.可以运行复杂的组件更新和约束逻辑,而无需为代码置办两个副本。


3.在需要同步 API 时,可以使用同步 API 调用。这样的话,更新的加载或刷新就不会发生混淆。


4.以更直观的方式编写代码:插件只是自动执行用户可以使用 UI 手动执行的操作。


但是,这时我们又遇到了下列问题:


1.插件可挂起,但无法中断插件。


2.插件可以像 figma.com 一样发出网络请求。


3.插件可以访问和修改全局状态,例如修改 UI,甚至可以执行恶意操作,例如修改({}).proto 的值,从而危害所有新建的和现有的 JavaScript 对象。


经过斟酌后,我们决定放弃第 1 项要求。当插件被冻结时,会影响 Figma 的稳定性。然而,我们的插件模型的工作原理是,它们只处理显式的用户操作。通过在插件运行时更改 UI,冻结将始终被认为是插件所致。这也意味着插件无法“破坏”文档。


eval 的危险性体现在哪些方面?


为了解决插件能够发出网络请求和访问全局状态的问题,我们必须首先确切地了解“通过 eval 函数执行任意 JavaScript 代码是危险的”这句话到底意味着什么。


对于某些只能进行 7x24x60x60 这样的算术运算的 JavaScript 变体,我们称之为 SimpleScript,那么使用 eval 方法的话还是很安全的。


如果继续为 SimpleScript 添加其他特性,如变量赋值和 if 语句,使其更像编程语言,这时它仍然非常安全。归根结底,它本质上仍然归结为做算术。如果继续添加函数求值(function evaluation)特性,现在该语言就具备了λ演算和图灵完备性。


换句话说,JavaScript 未必一定就是危险的。在最简化的形式中,它只是一种做算术的扩展方式。真正的危险源是它的输入和输出访问权限,其中包括网络访问、DOM 访问等,即危险的是浏览器的应用程序接口。


我们知道,API 都是全局变量,因此,我们需要隐藏全局变量!


隐藏全局变量


现在,隐藏全局变量在理论上听起来不错,但仅通过“隐藏”它们来创建安全的实现还是很困难的。例如,我们可以考虑删除 window 对象的所有属性,或将它们设置为 null,但代码仍然可以访问全局值,例如({}).constructor。所以,找出泄漏全局变量值的所有可能方式是非常具有挑战性的。


相反,我们需要一些更强大的沙箱形式,使得这些全局变量值从一开始就不存在。


换句话说,JavaScript 并不一定非常危险。


考虑前面介绍的仅支持算术的 SimpleScript 语言,大家可以试着编写一个算术运算程序。在该程序的任何合理实现中,SimpleScript 将无法执行除算术之外的任何操作。


现在,我们继续扩展 SimpleScript,使其支持更多语言功能,直到它变成 JavaScript 为止,现在,我们将该程序称为解释器,它决定了 JavaScript(动态解释语言)的运行方式。

尝试 #2:将 JavaScript 解释器编译为 WebAssembly

对于像我们这样的小型创业公司来说,实现 JavaScript 编译器是不太现实的。相反,为了验证这种方法,我们采用了Duktape,这是一个用 C++编写的轻量级 JavaScript 解释器,并将其编译为 WebAssembly。


为了确认它是否有效,我们运行了test262测试,它是标准的 JavaScript 测试套件。它通过了所有 ES5 测试,只有少量不重要的测试失败了。要使用 Duktape 运行插件代码,我们需要使用编译为 WebAssembly 的解释器来调用 eval 函数。


这种方法有哪些特性?


这个解释器在主线程中运行,这意味着我们可以创建一个基于主线程的 API。


它是安全的,因为 Duktape 不支持任何浏览器 API,此外,它是作为 WebAssembly 运行的,而后者是一个无法访问浏览器 API 的沙箱环境。换句话说,默认情况下,插件代码只能通过显式的白名单 API 与外界进行通信。


它比常规 JavaScript 的速度要慢,因为这个解释器不支持 JIT,但这并不重要。


它需要浏览器编译一个中等大小的 WASM 二进制文件,这需要一些开销。


默认情况下,浏览器调试工具无法使用,但我们花了一天时间为解释器实现了一个控制台,以验证它至少可以调试插件。


Duktape 仅支持 ES5,但在 Web 社区中,通常会使用Babel等工具交叉编译较新的 JavaScript 版本。


(提示:几个月后,Fabrice Bellard 发布了QuickJS,它原生支持 ES6。)


现在,我们要编译一个 JavaScript 解释器!根据你作为程序员的爱好或审美倾向,您可能会想:


这太棒了!


或者


……这是要搞啥?还要自己搞 JavaScript 引擎,那操作系统是不是也要自己搞一个呀?


当然,这些质疑声是非常正常的! 除非我们有绝对的必要,否则最好避免重新实现浏览器。在实现整个渲染系统方面,我们花费大量的精力,因为这对于性能和跨浏览器支持来说是非常必要的,并且令人高兴的是,我们的确做到了,但我们仍然要郑重对读者说一声:不要重新发明轮子


注意,这并非我们最终采用的方法,因为后面还有更好的方法。那我们为什么要在这里介绍它呢?这是因为,这对于理解我们最终沙箱模型来说是非常有帮助的,毕竟我们的模型是非常复杂的。

尝试 #3:Realms

虽然编译 JS 解释器是一种很有前途的方法,但除此之外,还有一个方法非常需要考虑——Realms shim技术,其创建者为Agoric


这项技术将创建沙箱和支持插件描述为潜在的用例。这真是一种前途无量的描述方法!Realms API 看起来大致如下所示:


let g = window; // outer globallet r = new Realm(); // realm object let f = r.evaluate("(function() { return 17 })"); f() === 17 // true Reflect.getPrototypeOf(f) === g.Function.prototype // falseReflect.getPrototypeOf(f) === r.global.Function.prototype // true
复制代码


这种技术实际上可以使用现有的 JavaScript 特性来实现,尽管这些特性鲜为人知。沙箱的一项任务就是隐藏全局变量。这个 shim 库的核心功能大致如下所示:


function simplifiedEval(scopeProxy, userCode) {  'use strict'  with (scopeProxy) {    eval(userCode)  }}
复制代码


这是用于演示目的的简化版本;真实版本中还是有一些细微差别的。但是,它展示了其中最关键的部分:with 语句和 Proxy 对象。


其中,with(obj)语句创建了一个作用域,在该作用域内可以使用 obj 的属性查找变量。在这个例子中,我们可以将变量 PI、cos 和 sin 解析为 Math 对象的属性。另一方面,console 并不是 Math 的属性,因此需要在全局作用域内进行解析。


with (Math) {  a = PI * r * r  x = r * cos(PI)  y = r * sin(PI)  console.log(x,  y)}
复制代码


代理对象是 JavaScript 对象最动态的一种形式。


· 最基本的 JavaScript 对象可以通过访问 obj.x 返回属性的值。


· 更高级的 JavaScript 对象可以具有 getter 属性,用于返回函数的计算结果。实际上,访问 obj.x 就是调用 x 的 getter 属性。


· 代理可以通过运行函数 get 来访问任意属性。


对于下面的代理(由于它仅用于演示,所以进行了相应的简化处理)来说,当我们尝试访问它的任何属性时,都将返回 undefined,而不是对象 whitelist 中的属性值。


const scopeProxy = new Proxy(whitelist, {  get(target, prop) {    // here, target === whitelist    if (prop in target) {      return target[prop]    }    return undefined  }}
复制代码


现在,当您将这个代理用作 with 对象的参数时,它将拦截所有变量的解析过程,并且永远不会使用全局作用域来解析变量:


with (proxy) {  document // undefined!  eval("xhr") // undefined!}
复制代码


不过,这种方法仍然可以通过诸如({}).constructor 之类的表达式来访问某些全局变量。此外,沙箱也确实需要访问一些全局变量。例如,Object 是一个全局对象,并且许多合法的 JavaScript 代码(例如 Object.keys)都需要用到它。


为了让插件既能够访问这些全局变量又不会捅娄子,Realms 沙箱支持通过创建同源的 iframe 来实例化所有这些全局变量的新副本。当然,这个 iframe 不会像在尝试 #1 中那样用作沙箱。并且,同源 iframe 不会受 CORS 的限制。


相反,当在与父文档同源的情况下创建时:


1.它附带了所有全局变量的单独副本,例如 Object.prototype 等。


2.可以从父文档访问这些全局变量。



这些全局变量将被放进代理对象的“白名单”中,这样的话,插件就可以访问它们了。最后,这个新的还附带了一个新的“eval”函数副本,它与现有的函数有一个重要的区别:即使只有通过({}).constructor 这样的语法才能访问的内置值,也将会解析为 iframe 的副本。


这种基于 Realms 的沙箱方法有许多优秀的属性:


它在主线程上运行。


速度很快,因为它可以使用浏览器的 JavaScript JIT 来执行代码。


浏览器开发工具仍可以正常使用。


即使如此,我们还面临令一个非常重要的问题:这种方法安全吗?(本文转自嘶吼)


(未完待续)


系列文章


如何安全的运行第三方 JavaScript 代码(上)?


2019-09-23 10:592656

评论

发布
暂无评论
发现更多内容

linux之软连接和硬连接的区别

入门小站

Linux

硬件Scrum指南

AmyGuo

Scrum 敏捷开发 硬件架构 硬件开发‘ 硬件敏捷

考试试卷redis存储详细设计

小智

架构训练营

架构实战营-模块四作业

南山先生

「架构实战营」

力扣前400题解答笔记,全被字节大神整理到了这份文档里

Java 编程 架构 面试 程序人生

2021西部云安全峰会召开:“云安全优才计划”发布,腾讯云安全攻防矩阵亮相

腾讯安全云鼎实验室

云安全 峰会

读懂Redis源码,我总结了这7点心得

Java redis 架构 面试 后端

阿里资深架构师整理分享全套Java核心技术面试题及答案

Java 编程 架构 面试 程序人生

模塊九 畢業設計

孫影

架构实战营 #架构实战营

阿里IM技术分享(四):闲鱼亿级IM消息系统的可靠投递优化实践

JackJiang

架构设计 即时通讯 IM

连锁便利店:夕阳产业还是明日之星

石头IT视角

写给“后浪”们的职业生涯规划建议

轻口味

android 生涯规划 音视频 9月日更

陌陌和它的解药,聊聊出海社交产品的思路

拍乐云Pano

社交APP出海 社交APP 泛娱乐出海

阿里大牛再写传奇:并发原理JDK源码手册GitHub下载量已破百万

Java 编程 架构 面试 程序人生

千万级学生管理系统的考试试卷存储方案

毛先生

MyBatis Plus 批量数据插入功能,yyds!

王磊

mybatis springboot

喜讯 | 拍乐云创始人赵加雨荣获「2021企业数智化转型升级先锋人物」奖

拍乐云Pano

音视频 数智化

被阿里奉为神册!2021公认最权威的分布式微服务指导手册

Java 架构 面试 程序人生 编程语言

阿里藏经阁天花板:高性能Java架构核心原理手册,一定要偷偷看

Java 编程 架构 面试 程序人生

消息队列:Kafka Consumer源码解读

正向成长

kafka

J2PaaS低代码开源版,10月1号即将上线,企业数字化转型优选!

J2PaaS低代码平台

低代码 零代码 开发工具

深耕与构建:华为数字能源的立体版图

脑极体

时间转换不在变bug

卢卡多多

时间戳 时间转换 9月日更

架构实战营 设计千万级学生管理系统的考试试卷存储方案

💤 ZZzz💤

架构实战营

成为一名月薪2万的web安全工程师需要掌握哪些技能??

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

从浏览器地址栏输入url到显示页面的步骤

Augus

浏览器 9月日更

2021年金九银十必问的1000道Java面试题及答案整理

Java 架构 面试 程序人生 编程语言

java 虚拟机 GC 学习笔记三

风翱

GC 9月日更

网络攻防学习笔记 Day148

穿过生命散发芬芳

等级保护 9月日更

2021中国规模化敏捷大会(早鸟票倒计时)

AmyGuo

DevOps 敏捷开发 Scrum精髓 硬件敏捷 规模化敏捷

人工智能、机器学习和数据工程 InfoQ 趋势报告 - 2021 年 8 月

Regan Yue

人工智能 9月日更 数据工程 趋势报告

如何安全的运行第三方 JavaScript 代码(中)?_语言 & 开发_Rudi Chen_InfoQ精选文章