50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

Facebook 引入 Haskell 升级 Sigma 防御系统

  • 2015-07-07
  • 本文字数:1991 字

    阅读完需:约 7 分钟

Facebook 的 Sigma 防御系统主要用来主动识别垃圾邮件、钓鱼攻击以及恶意链接等,并自动将其从网络中删除。随着网站内容和用户数量的极速增长,之前设计的 Sigma 系统渐渐不能满足网站的需求。Facebook 利用两年时间对 Sigma 进行了升级,用 Haskell 语言替代了 FXL(Feature eXtraction Language)语言对 Sigma 进行了重新编程。接下来,本文就 Sigma 升级的相关内容进行简要介绍。

作为 Facebook 的防御系统,Sigma 实际上就是一个规则引擎。对于网站上的每一个交互,它都会调用一系列相关的规则对这次交互的安全性进行评估。其中,这些规则主要包含了恶意攻击的相关模式。一旦交互中的内容符合了某个恶意攻击的规则定义,Sigma 就认定其为恶意内容,禁止发到网站中。这样,Sigma 就可以在攻击发生前识别并加以阻止。为了能够应对新出现的攻击模式,Sigma 中的规则集需要不断变化。这就要求 Facebook 团队不断分析网络中的攻击模式,并相应的修改规则集,以达到防御新型攻击的目的。

最初,Sigma 采用了 Facebook 自己推出的 FXL 语言。作为 Facebook 为对抗垃圾邮件而在 2013 年推出的编程语言,FXL 能够满足当时 Sigma 的需求。然而,随着网站的迅速发展,FXL 已经很难应对迅速扩大和日益复杂的规则集。它针对用户自定义的数据类型和模块缺乏某种抽象设备,而且基于翻译器的实现使得其处理速度也满足不了需求。Facebook 迫切需要一种能够在性能和表达性方面有良好表现的编程语言。该语言需要具备以下特性:纯函数式和强类型、能够自动打包和隐藏数据提取动作、在短时间内完成产品中代码的升级和更迭、极佳的性能以及支持交互式开发等。通过筛选,Facebook 发现 Haskell 最能符合这些要求——它是一个纯函数式、强类型的语言,有着成熟的编译器和交互式的环境( GHCi );Haskell 还拥有所需要的所有抽象设备、丰富的库集合以及活跃的开发者社区。然而,Haskell 并不能满足所有的特性需求——自动打包 / 并行处理数据提取和编译后代码的热替换。Facebook 团队还需要想办法解决这些问题。

为了支持自动打包和并行数据提取,Facebook 创建了 Haxl 框架。Haxl 能够把多个数据提取操作进行自动打包和并行执行。目前,Haxl 已经开源,其代码依托在 GitHub 中。此外,Facebook 团队在 GHC 中设计和实现了 Applicative donotation,使得编译器可以自动发掘串行代码中的并行性。接下来,有关编译后代码热交换的问题。每次有新的规则加入到版本库时,Facebook 团队都希望能够在 Sigma 运行中尽快把规则更新到每一台机器。一般来说,在一个程序运行过程中动态修改其代码是一件很难的事情。然而,Facebook 团队通过认真分析,发现了一个关键的现象——Sigma 接收的请求寿命都很短暂。这样,系统只需要把新的请求送到新的代码,而老的代码可以在运行完正在服务的请求后再抛弃即可。Facebook 使用了 GHC 内置的运行时连接器进行加载和卸载代码。在卸载老版本的代码时,垃圾收集器(Garbage Collector,GC)也会参与其中。GC 会探测到什么时候老的代码不再被新的请求使用,从而指导相关人员进行安全卸载。

解决以上两个问题后,Facebook 就顺利采用了 Haskell 进行 Sigma 的编写。在代码设计中,Haskell 位于两个 C++ 层中间。因为 C++ thrift 服务器更加成熟、高性能,而且支持更多特性,顶层的服务器层采用 C++。在有需要时,它会调用下层的 Haskell。而在最底层,C++ 客户端代码负责与其他内部的服务进行通信。为了减少负担,Facebook 利用 Haskell 的 FFI(Foreign Function Interface)把 Haxl 数据源中的每一个 C++ 客户端封装起来,方便上层调用。

最后,Facebook 针对 25 种最常见的请求类型(基本覆盖了 Sigma 95% 左右的典型负载),比较了基于 Haskell 和 FXL 的系统的处理能力。结果表明,Haskell 在最好情况下能够比 FXL 快 3 倍左右,吞吐量平均高 20%-30%。Facebook 团队还在 GHC 中实现了分配限制机制(Allocation Limit)。该机制会在一个线程结束之前对其能够使用的内存数量进行鉴定,防止一个单独的请求占用太多的资源。一旦一个线程长期占用最大限额的资源,Haskell 会以异步例外(Asynchronous Exception)的形式来放弃本次请求。而且,Facebook 团队构建了一个交互式的环境和自己的包源 Stackage,提高工作效率。

目前,Facebook 已经开始使用 Haskell 编写而成的 Sigma 进行大规模对抗垃圾信息或其他攻击的活动。据透露,使用Haskell 的Sigma 工作性能良好,可靠性强。 Facebook 的软件工程师 Simon Marlow 表示,Haskell 并不是那么顺理成章的选择。在这升级过程中,Facebook 的后端安全团队经历了很多困难,也收获了很多经验。


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-07-07 09:142836
用户头像

发布了 268 篇内容, 共 136.2 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

恕我直言!有了这份MySQL学习文档,你收藏夹里的其他MySQL学习资料都可以扔了

Java架构之路

Java 程序员 架构 面试 编程语言

了解OAuth2.0

环信

DolphinDB与Elasticserach在金融数据集上的性能对比测试

DolphinDB

数据处理 金融 时序数据库 tsdb DolphinDB

话题讨论 | 程序员自己电脑中毒是甚么体验?

xcbeyond

话题讨论

用60行代码实现一个高性能的圣诞抽抽乐H5小游戏(含源码)

徐小夕

Java 大前端 H5游戏 H5

阿里架构师经验分享!啃完999页Android面试高频宝典,面试心得体会

欢喜学安卓

android 程序员 面试 移动开发

助力孩子走上学霸之路,K12学习神器现已面世!

E科讯

服务于阿里、滴滴、华为等一线互联网公司的分布式消息中间件RocketMQ核心笔记

Java架构追梦

Java 架构 面试 RocketMQ 消息中间件

SGY奇点交易所系统软件APP开发

系统开发

区块链信息共享应用落地搭建解决方案

t13823115967

区块链+ 区块链应用 信息共享

Scala中String和Int隐式转换的问题分析

木子李G

scala 大数据 编程 隐式转换

某美女的程序员老公半夜都还不回家,原来是偷偷在公司看Redis+JVM+Spring cloud+MySQL技术文档

Java架构之路

Java 程序员 架构 面试 编程语言

Github 2020 年度报告:你以为新冠击溃了开发者?不!他们创造了更多代码...

阿里巴巴云原生

开源 Serverless 程序员 代码

iOS面试基础知识 (一)

iOSer

ios 面试 runtime 编程开发 iOS Developer

仅凭这份Java大纲笔记,我如愿拿到了阿里offer。

Java架构之路

Java 程序员 架构 面试 编程语言

区分Protobuf 3中缺失值和默认值

Gopher指北

protobuf Go 语言

港美股交易系统开发框架构造简述篇

软件开发大鱼V15988750073

国际配售 港股交易系统开发 证券交易系统 资管系统 港股打新系统

动态高并发时为什么推荐ReentrantLock而不是Synchronized?

moon聊技术

JVM 并发 synchronized ReentrantLock 锁升级

新思科技最新报告显示开源安全是首要考虑因素

InfoQ_434670063458

还有谁比阿里人更懂SpringCloud Alibaba 呢?P8大牛纯手打笔记免费分享!

Java架构之路

Java 程序员 架构 面试 编程语言

智慧警务开发,二维码定位报警系统搭建

t13823115967

智慧公安 智慧公安扫码

Mybatis动态映射,so easy啦

田维常

《数据结构与抽象:Java语言描述》.pdf

田维常

数据结构

JS&Swift

ios swift

区块链BaaS应用平台开发

13828808769

SGY奇点交易所系统软件开发|SGY奇点交易所APP开发

系统开发

四面腾讯pcg后端开发岗,一个星期面完成功拿到20K的offer。分享面经

Java架构之路

Java 程序员 架构 面试 编程语言

刚拿到蚂蚁金服架构师offer!大佬教你如何成为offer收割机

比伯

Java 编程 架构 面试 计算机

请问如何短时间突击 Java 通过面试?

Java架构师迁哥

超详细讲解!Android面试真题解析火爆全网,搞懂这些直接来阿里入职

欢喜学安卓

android 编程 程序员 面试 移动开发

EPBC环保生态链系统开发案例丨环保生态链EPBC源码平台

系统开发咨询1357O98O718

环保链APP系统开发案例

Facebook引入Haskell升级Sigma防御系统_后端_张天雷_InfoQ精选文章