写点什么

Google 开放 HTML5 解析库 Gumbo 的源代码

  • 2013-08-19
  • 本文字数:653 字

    阅读完需:约 2 分钟

Google 已经开放了 Gumbo 的源代码,这是一个用 C 编写的 HTML 解析库。该库符合 HTML 解析算法标准,它通过了所有的 html5lib-0.95 测试,并且已经在 Google 索引的 25 亿个网页上进行过测试。

根据该项目的说明页,Google 发布 Gumbo 的目的是为开发人员提供一个轻量级的 HTML 解析库,它没有外部依赖,而且大多数语言都可调用它。该库可以包含在 Web 页面验证器、静态分析器、模板语言和重构工具等应用中。

Google 认为,Gumbo“对于不够标准的输入,它健壮而有弹性”,但是,由于 ABI 将来可能发生变化,所以不推荐维护指向 Gumbo 的一些内部数据结构的指针。不过,该 API 被认为相当稳定。Gumbo 1.0 会在不久的将来发布,在此之前,项目团队将一直等待开发人员的意见。

下面是一些将来会增加的功能:

  • 支持最近的 HTML5 规范变更,以支持模板标签
  • 支持片段解析
  • 全功能的错误报告
  • 在其它语言中的绑定

在 HTML5 解析算法标准化之前,每个浏览器自主选择如何标记输入页面和如何渲染页面。虽然 HTML 4 对于有效标记有详细说明,但是却没有指出在输入无效时浏览器应该做什么,所以世界上95% 的Web 页面都不能通过 W3C 参考验证器的验证。使用像 Gumbo 这样的工具验证 HTML 页面,可以保证页面在所有主要的浏览器中得到恰当地解析和渲染。

查看英文原文:**** Google Open Sources Gumbo, An HTML5 Parsing Library


感谢马国耀对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2013-08-19 04:085369
用户头像

发布了 256 篇内容, 共 95.7 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

进阶面试皆宜!阿里强推Java程序员进阶笔记,差距不止一点点

Java java面试 Java八股文 Java面试题 Java面试八股文

【活动预告】数据集成引擎BitSail遇上CDC

字节跳动数据平台

数据集成平台 bitsail

DAPP合约拆分公排模式项目系统开发技术讲解

I8O28578624

华为云加速器首期加速营圆满结营,40+位创业者携手出海

科技热闻

系统梳理面试6大专题,阿里爆款Java面试速成笔记也太香了

Java java面试 Java八股文 Java面试题 Java面试八股文

面试官:Spring Boot 的启动流程你了解吗?我:。。

Java你猿哥

Java spring Spring Boot ssm main

【全网首发】华秋CAM:免费Gerber查看器,离线版!

华秋电子

2023年企业降低云支出的小方法汇总

行云管家

云计算 云资源 云成本 云支出

云从科技进入百模大战,行业大模型成为胜负手

ToB行业头条

虚拟显示器软件:BetterDisplay Pro 激活Mac版

真大的脸盆

Mac Mac 软件 显示器校准软件

加速信创生态建设 焱融科技与优炫软件完成兼容性互认证

焱融科技

文件存储 高性能存储 #分布式存储

学会这招,来给你的 SpringBoot 工程部署的 jar 包瘦瘦身吧!

Java你猿哥

Java jar Spring Boot ssm

3F聆听

郭明

阿里开源SpringBoot全栈小册!Github已标星百万

Java spring Spring Boot 框架

阿里、字节等大佬神创,必须是全网最全的Netty核心原理手册

Java你猿哥

Java 源码 Netty ssm netty内存管理

直击面试!阿里技术官手码12W字面试小册在Github上爆火

Java java面试 Java八股文 Java面试题 Java面试八股文

系统梳理面试6大专题,阿里爆款Java面试速成笔记也太香了

Java你猿哥

Java MySQL redis MQ java面试

优秀!阿里甩出GC面试小册,仅7天Github获赞96.9K

Java JVM 垃圾回收 GC

共享电单车生产厂家排名!怎么选?

共享电单车厂家

共享电动车厂家 共享电单车生产 本铯共享电动车 共享电单车厂家排名

JVM调优实战:优化Java应用程序的性能

Java JVM 性能调优

区块链DAPP互助逻辑模式系统开发技术方案

I8O28578624

【安全运维】免费运维软件有哪些?哪款好用一点?

行云管家

运维 安全运维 免费 小微企业

深化企业数据智能应用 用友敢当“急先锋”

用友BIP

2023用友BIP技术大会

数据驱动运营增长

MobTech袤博科技

为什么 GPU 能够极大地提高仿真速度?

思茂信息

gpu 仿真软件 计算机硬件 仿真技术

SpringBoot限制接口访问频率 - 这些错误千万不能犯

Java spring Spring Boot 框架

在行 | 唱响钢铁冶金行业绿色发展进行曲

用友BIP

NFTScan:05.15~05.21 NFT 市场热点汇总

NFT Research

理论+实操,带你了解多沙箱容器运行时Kuasar

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

智能的支柱:算法

TiAmo

算法 动态规划 分治 回溯算法 分支限界

Google开放HTML5解析库Gumbo的源代码_开源_Abel Avram_InfoQ精选文章