AntiSamy 1.0 发布：保护Web应用免受恶意HTML和CSS攻击_Java_Gavin Terrill_InfoQ精选文章



 写点什么

登录/注册

跨站点脚本（Cross Site Scripting —— XSS），是允许用户提交包含 HTML 和 CSS 内容的开发者所面对的主要安全问题。 OWASP 上出现了一个的叫做 “ AntiSamy ” 的新项目，其目标是提供一个全面的、策略驱动的 API 来检验和清理用户的输入，同时在过滤过程中提供用户反馈。项目的主页描述了 API：

从技术上来说，AntiSamy API 可以保证用户提供的 HTML/CSS 内容遵从一个应用的规则。另外一种说法是：AntiSamy API 可以帮助你确保客户不会在他们提供的简介、评论等保存在服务器上的 HTML 中包含恶意代码。就 Web 应用而言，术语恶意代码通常仅指 JavaScript。样式表仅仅在它们调用 JavaScript 引擎的时候才被认为是恶意的。然而，有很多时候“正常的”HTML 和 CSS 也可以以一种恶意的方式来使用。

根据 AntiSamy 的领导开发者 Arshan Dabirsiaghi 的说法，这个 API 的特点是它的用户友好性：

AntiSamy 的方法的独特之处在于它是建立在一个积极的安全模型之上的，不论对 HTML 文档的格式还是文档的内容都是如此。另外的独特之处在于它试图以合作的精神来帮助用户调整他们的输入来通过校验，不是像当代的所有其他安全机制那样把用户当作潜在的攻击者来对待。

在论文《向检测和除去恶意代码前进》 (PDF) 中，Dabirsiaghi 描述了过滤过程中包括的阶段：

预处理。使用 NekoHTML 来执行 HTML 清理。
处理。Tag/CSS 校验规则按照深度优先的算法应用三种处理模型——过滤，截尾和校验。过滤动作去掉不允许的标签，但是保留标签内的内容。截尾删除禁止的标签属性和标签的子节点。校验使用在策略文件中的规则来匹配标签 / 属性的组合，以确保只包含合法的标签。
补救。如果在处理过程中校验失败，可以与策略文件交互来决定如何处理标签和它的内容。选项包括删除标签以及它的内容，过滤掉标签而保留它的内容和从标签中删除属性。

AntiSamy 的第一个版本包括一个 Java 的实现，随后会提供.Net 和 PHP 的实现。

AntiSamy 易于与一个 Java 应用集成：

import org.owasp.validator.html.*;<p>Policy policy = new Policy(POLICY_FILE_LOCATION);</p><br></br>AntiSamy as = new AntiSamy();<br></br>CleanResults cr = as.scan(dirtyInput, policy);<br></br>MyUserDAO.storeUserProfile(cr.getCleanHTML()); // some custom function<br></br>``CleanResults类提供了访问过滤过程的有用信息的方法：

getErrorMessages() —— 一个字符串错误信息列表
getCleanHTML() —— 干净的，安全的 HTML 输出
getCleanXMLDocumentFragment() —— 反应产生的干净的，安全的XMLDocumentFragment
getCleanHTML()
getScanTime() —— 返回以秒为单位的扫描时间

AntiSamy 采用 BSD 许可，可以在 Google Code 项目主页下载。

查看英文原文： AntiSamy 1.0 Released - Protecting web applications from malicious HTML and CSS - - - - - -

译者简介：曹云飞，西安交通大学计算机软件硕士。现就职于 Ethos ，热衷于新技术的钻研，软件架构与敏捷开发，目前从事 Home Control 方面的工作。参与 InfoQ 中文站内容建设，请邮件至 china-editorial[at]infoq.com 。

评论

发布

暂无评论

区块链技术发展的十大趋势

区块链金融安全问题

业务架构学习内容有哪些？

BIZBOK 业务架构

JavaScript引擎的事件循环机制是怎样工作的？

Java 大前端运行时栈帧事件循环

面试必问亿级流量优化策略之JVM调优，文档视频面试，还不收藏

Java 程序员架构 JVM jvm调优

基于Goc的Golang代码VSCode实时染色方案

测试覆盖率精准测试 Go 语言

.NET委托，事件和Lambda表达式

不要以为Bug写的好就是好程序员，其实这只占不到15%

Java 学习程序员架构面试

从外卖员到拼多多30K+程序员，我付出了三年的青春

Java 学习程序员架构面试

架构师训练营第十四周

甲方日常 13

工作随笔杂谈日常

央行数研所推出贸易金融区块链平台

区块链金融

一文解开java中字符串编码的小秘密

程序那些事

java安全编码 java编码指南 UTF编码

宅家三个月玩转算法，再战字节跳动，字节跳动面试官朝我比了个“ok”

编程字节跳动面试算法

Dubbo-go应用维度注册模型

apache/dubbo-go

dubbo dubbo-go dubbogo

这篇文章，把中国科技的真实底子讲透了

中国科技产业竞争

LeetCode题解：232. 用栈实现队列，使用两个栈入队 - O(1)，出队 - 摊还复杂度 O(1)，JavaScript，详细注释

大前端 LeetCode

阿里培训官给新入职程序员的25条建议

Java架构师迁哥

从新浪数字化转型，窥见互联网的“懂行”新十年

记一种spring框架的想当然但错误的用法

源码分析最佳实践 Spring Framework bug

【高并发】Redis如何助力高并发秒杀系统，看完这篇我彻底懂了！！

多线程高并发秒杀电商超卖签约计划第二季

藏在Java数组的背后，你可能忽略的知识点

Java架构师迁哥

澳门金沙玩赢了钱提现不了异常注单未更新有什么办法处理?

丛林里的余光

异常检测澳门金沙提现不了

架构师课作业 - 第十三周

大数据任务调度 - 有向无环图(DAG)之拓扑排序

大数据数据结构 DAG 拓扑排序 Apache DolphinScheduler

oeasy教您玩转linux 010211 牛说 cowsay

[翻译]Scalable Go Scheduler Design Doc[Go可扩展调度设计文档]

golang scheduler Go scheduler Go 语言

一点 Go Web 编程实践经验

Go web Go 语言

TOGAF认证课由2天变化为5天的思考

企业架构 TOGAF

朱嘉明：全球科技革命正在逼近“奇点”，区块链影响未来人类社会的走向

人工智能科技科技革命

LeetCode题解：232. 用栈实现队列，使用两个栈入队 - O(n)，出队 - O(1)，JavaScript，详细注释

区块链赋能市场监管浙江上线“黑科技”清除取证固证难题

区块链市场监管取证难题