蚂蚁金服开源:数据驱动的高交互可视化图形语法G2

2019 年 9 月 09 日

蚂蚁金服开源:数据驱动的高交互可视化图形语法G2


AntV 是蚂蚁金服全新一代数据可视化解决方案,主要包含「数据驱动的高交互可视化图形语法」G2、专注解决流程与关系分析的图表库 G6、适于对性能、体积、扩展性要求严苛场景下使用的移动端图表库 F2 以及一套完整的图表使用指引和可视化设计规范,致力于提供一套简单方便、专业可靠、无限可能的数据可视化最佳实践。


今年是 AntV 发展的第三个年头,经过岁月的洗礼,多年的努力,以及越来越多的领域大牛加入到这个项目中来,AntV 已经成为阿里经济体中,数据可视化领域十分重要的技术基础设施,为集团内外 2000+个业务系统提供数据可视化能力,其中不乏日均千万 UV 级的产品。同时,阿里内部基于 AntV 技术栈的可视化组件、工具、图表类库等相关技术生态开始繁荣,并逐步走向外界受到越来越多的关注。


今天,我们怀着诚心、真心以及「 让人们在数据世界里获得视觉能力 」的梦想,为各位带来 AntV 3.0。


G2 3.0 一次绚丽的蜕变


G2 是 AntV 最重要的组成,始于《The Grammar of Graphics》一书描述的视觉编码语法系统(这也是 G2 项目命名的由来),是图形语法在前端工程上的一个实现。G2 提供了强大的语义化图表生成能力,使得用户(开发者)可以通过简单的语法组合即可搭建出各种各样的图表。


G2 在过去两年多时间一直稳步发展,虽然通过了阿里集团内近千个业务系统,千万级 UV 产品的严苛考验,历经了两个大版本的迭代改进,但离我们心中的使命目标还有很长的一段距离,加上现有的图形语法理论在交互定义上的缺失极大限制了她的可视分析能力,于是我们决定让 G2 进入新一轮的蜕变。


经过近半年密锣紧鼓的设计和研发迭代,2017 年 11 月 22 日,G2 3.0 来了,一个“数据驱动的高交互图形语法”新生绽放,并且从这个版本起,G2 将以 MIT 协议正式对外开源。


你没有听错,今天,2017 年 11 月 22 号,G2 正式开源了! GitHub!


我们做了什么?


在 3.0 里,我们把之前混合在图形语法里的数据处理、统计函数统统抽离出来;我们把原先的配置项做了升级,使得坐标轴、图例、图标样式、提示信息等配置项更灵活更强大,并且大多支持了回调函数;我们还顺道优化了绘图性能、交互、动画、事件体系,处理了先前一些接口命名和组织上不合理的地方。


支撑这些改变的同时,G2 的底层也悄然发生了变化。我们调整了 G2 的架构,把原先不够集中的模块精简到三个核心的包里:底层绘图库 G 、数据处理库 DataSet 和上层的数据驱动的交互式图形语法库 G2 ;同时更多地从 JS 社区借力,采用 ES6 语法进行开发、通用基础能力更多依赖第三方成熟的底层库、更好的开发测试流程等等。新的架构将更加开放和包容,也使得新版本的可扩展能力变得前所未有的强大。


新特性尝鲜


下面来看看,3.0 具体带来了哪些新特性?


高速渲染,即时交互响应


3.0 通过合并 Canvas 图层、数据处理外置等措施,大幅度提升了图表的渲染性能。个别图表渲染/重绘效率甚至得到了数倍的提升,为流畅的交互提供了更强有力的保障,即便在大数据量的图上,也能获得流畅的交互体验。



热力图(heatmap)有渲染和重绘两个阶段。2.x 版本重绘需要重新创建 chart instance,所以渲染和重绘时间消耗一致;而新版支持不销毁实例重绘,所以3.0版本除了让渲染耗时降低到只需原来时间的25%之外,还让重绘实现了质的飞跃,只需原重绘时间的3%即可刷新,使得热力图连续图例过滤成为现实。



热力图连续图例过滤



即时交互响应


动画模块也从底层做了深入的优化,支持自定义动画,也更加流畅。




自定义动画


事件完备,无限交互可能


在 3.0 版本中,图表上的任意元素均可捕获鼠标和触摸事件,提供了更精准的事件监听,同时也为丰富多样的交互提供无限可能,自此用户不仅可以通过灵活多变的图形语法组合去创造图表,而且还可以为图表增添各种交互能力,为用户的想象力插上翅膀~


用户只需要在 chart 或者 view 上监听该元素对应的事件名即可(元素名+基础事件名的方式组合),如下


// 监听坐标轴文本的鼠标事件
chart.on('axis-label:mouseenter', ev => {});
chart.on('axis-label:mouseleave', ev => {});
chart.on('axis-label:click', ev => {});
复制代码



任意元素自定义交互


更完备的定制化能力


3.0 里,图例(legend)、提示信息(tooltip)、辅助元素(guide)等配置重新进行了设计,新的配置项方案更加丰富、合理,同时还增强了对 HTML 的支持,而在 Geometry 层的 style、label、tooltip 等方法的属性上支持回调函数控制。这些的改进,使得自定义组件变得更加简单而灵活,进一步让 G2 拥有高定制化的能力。



自定义图例以及 tooltip


更强的分面功能


分面功能不再统一由一个 chart 实例定义,而是通过回调函数函数的形式,每个分面上的图表单独用一个 view 来绘制。这使得我们可以轻松根据需求在不同的分面图表上绘制不同的内容。经过这样的改进,绘制类似下面专业的分面图表就变成了小菜一碟:



分面定制效果


数据处理外置,轻装上阵


要说 3.0 变化最大的点,无疑是数据处理外置。旧版本中,Frame 和 Stat 是和 G2 强耦合的,统计处理甚至会入侵到图形语法中。这会带来几方面的问题:不少功能受限于耦合比较难升级;数据处理是非常大的领域,内置的话扩展起来难免畏首畏尾,担心因此影响 G2 的体量;耦合的情况下,给数据处理和图形语法两方面都带来了新的理解成本。


基于这些考虑,我们认真梳理了底层架构,决定从 G2 中把数据处理部分抽离出来,封装成了一个专门的数据处理模块 DataSet。从此 G2 内部不再有数据处理、布局和统计方面的代码包袱,继续专注强化“高交互图形语法”方面的特长;而独立的 DataSet 模块则通过简单、强包容性的架构,以及状态量等策略扫除了升级扩展的障碍,得以从开源社区大量借力,不断丰富“数据驱动”这一特性的内涵。


G2 3.0不强依赖DataSet,在不需要复杂数据处理时可以不引入。


独立出来的 DataSet 主要提供三个方面的能力:


1.数据连接(connector):用于接入不同类型的数据,支持不限于 CSV/GeoJSON/Hierarchy 等;


2.数据处理(transform):进行数据变形、数据转换等,是 DataSet 的核心功能,负责和扩展了 G2 在统计、布局、数据补全等等方面的数据处理需求;


3.状态量管理(state):支持不同数据视图之间、数据视图和图表之间的通信;


抽象出这三个方面的特性后,DataSet 模块就得以简单而广泛地从社区接力。譬如采用 d3-dsv 接入 CSV 类型的数据只需要下面寥寥两行代码:


import {csvParse} from 'd3-dsv';DataSet.registerConnector('csv', str => csvParse(str));
复制代码


引入社区上各种布局算法、统计函数也类似,非常简单就可以完成,马上就能扩展 G2 的绘图能力。譬如通过引入 d3-hierarchy 和 d3-voronoi 就可以轻松画出比老版本更成熟的 Treemap 和 Voronoi 图:



Treemap



Voronoi diagram


致敬 d3,但不止步于“d3”,事实上,结合 DataSet 和 G2 的图形语法能力,我们能画的图可能比 d3 还要多一些,比如 Voronoi 在极坐标上的变体,直方图、六边形分箱的 offset 支持,矩形分箱的实现等等。



Voronoi 在极坐标上的变体



直方图、六边形分箱的 offset 支持



矩形分箱

React ?Angular ?Vue ?

基于 AntV 技术栈还有许多优秀的项目,在 React 环境下使用 G2,我们推荐可以尝试使用 BizCharts 和 Viser-react!这两个产品都是基于 G2 的 React 版本封装,使用体验更符合 React 技术栈的习惯,他们都与 AntV 有着紧密的协同,他们很快也将同步开源和发布基于 G2 3.0 的版本。

此外,Viser 并不是针对 React 做的适配,它是对 G2 3.0 通用的抽象。通过基于 Viser 封装,现在已经支持对 React、 Angular 和 Vue 三个常用框架的深度整合,对应的是 viser-react、viser-ng 和 viser-vue。对,你都有机会用到一样的使用体验。当然,你甚至可以自己动手来封装针对任何库的版本,如果需要的话。Viser 提供了这种自定义的扩展能力,而且成本非常低。

G6 1.2 更丰满、更稳健

支撑了内部足够多的场景后,G6 本身的架构越来越清晰和完善。1.2.0 中,一方面,我们将布局机制抽象到了 Graph 层次,有了完备、统一的布局机制,这使得大家更容易的拓展 G6 的布局。另一方面,我们将常见的功能需求和社区内优秀的算法进行总结、封装,沉淀出一部分实用的插件以供大家使用,以求最大限度的降低大家的使用成本。

统一分层布局

得益于 graphviz 的研究成果以及 cpettitt 的工程实现,经过简单的封装产出的统一分层布局插件。有了该插件以后大家把手头毫无顺序的网状数据丢进 G6 ,就能绘制出符合人基本美学和阅读习惯的分层关系图。该插件着重展示关系数据的流向,非常适用于流程类关系数据。

plugin.layout.dagre – 统一分层布局

Minimap,缩量图

关系的规模只要稍微大点,要做到 overview -> zoom && filter 怎么能少了 minimap 的存在!

plugin.tool.minimap – 缩量图

分析模板

G6 官方自研的、用于解决带权简单图的分析模版。适用于页面流量分析、系统调用分析、大中规模知识图谱等等业务场景。

plugin.template.analysis.maxSpanningForest – 最大生成森林图分析模版

基于 d3 的扩展

基于 d3 技术栈开发的两个在可视分析中非常有用的插件。

plugin.layout.d3.force–力导布局 && plugin.enhance.d3.mapper–d3映射增强器

F2 1.0 更轻、更快、为移动端打造

F2(原g2-mobile) 是一套高性能、高扩展的移动端图表库,主要用于对性能、大小、扩展性高度敏感的场景,已经在钱包、淘票票、钉钉、weex、rax 中广泛使用。

特性

  • 极小:在提供了几十种图表的基础上,压缩后代码不足 70k,全部大小 100k

  • 高性能:极致优化贴近原生canvas的性能

  • 高扩展性:可以非常容易的实现个性化的图表

性能对比

1024 条数据的情况下折线图的性能对比:

一些示例:官方示例

真实场景

结束语

AntV 3.0 不仅凝聚了蚂蚁金服体验技术部数据可视化团队多年来的心血,还有一路相伴的众多合作伙伴的支持和帮助,感谢对 AntV 的关注和信赖,感谢一路有你。

2017年11月22日,AntV G2正式对外开源,这是我们新的起点,期待未来与您同行。

大家使用过程中有任何的问题或者建议都可以在 Github 上跟我们反馈。

本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。

原文链接:

https://mp.weixin.qq.com/s/ZkXW-0tWzJweDJdW6aev5A








2019 年 9 月 09 日 09:522215
用户头像

发布了 150 篇内容, 共 20.7 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

后李健熙时代的三星,将迎来怎样变局?

脑极体

极客大学 - 架构师训练营 第六周作业

9527

为产业AI去障:联想的边缘突破

脑极体

零基础IM开发入门(三):什么是IM系统的可靠性?

JackJiang

网络编程 即时通讯 IM

企业级RPC框架zRPC

Kevin Wan

go RPC microser

Flink在窗口上应用函数-6-9

小知识点

scala 大数据 flink

频繁操作本地缓存导致YGC耗时过长

AI乔治

Java 架构 JVM GC

数字“异化”生存

脑极体

通过GUI界面更改 Ubuntu 20 LTS apt 源为阿里云

jiangling500

ubuntu 阿里云 apt

阿里内部首发1000页涨薪面试宝典:Spring+SpringMVC+MyBatis框架整合开发实战

Java架构追梦

Java 源码 架构 面试 SSM框架

架构师训练营作业:第五周

m

快速掌握并发编程---线程池的原理和实战

田维常

程序员

小白学算法:买卖股票的最佳时机!

王磊

Java 算法

狼人杀背后的秘密,实时语音你不知道的那些事

anyRTC开发者

音视频 WebRTC 语音 RTC 安卓

gRPC服务注册发现及负载均衡的实现方案与源码解析

网管

go 负载均衡 gRPC etcd 服务注册与发现

《Maven实战》.pdf

田维常

程序员

第6周作业

饭桶

web worker的介绍和使用

程序那些事

多线程 Web Worker 异步模型 异步编程 web技术

码农会锁,synchronized 对象头结构(mark-word、Klass Pointer)、指针压缩、锁竞争,源码解毒、深度分析!

小傅哥

小傅哥 虚拟机 synchronized mark-word Klass Pointer

总结年初到10月底Java基础、架构面试题,共计1327道!涵盖蚂蚁金服、腾讯、字节跳动、美团、拼多多等等一线大厂!

Java架构追梦

Java 架构 字节跳动 面试 蚂蚁金服

调包侠的炼丹福利:使用Keras Tuner自动进行超参数调整

计算机与AI

学习 keras 超参数调优

面试官:面对千万级、亿级流量怎么处理?

艾小仙

Java 缓存 分布式 高并发 中间件

分析和解决JAVA 内存泄露的实战例子

AI乔治

Java 架构 JVM 内存泄露

ConcurrentHashMap核心原理,彻底给整明白了

AI乔治

Java 架构 分布式 线程

极客大学 - 架构师训练营 第六周

9527

直播带货大战在即:账号交易灰产猖獗

石头IT视角

当 TiDB 与 Flink 相结合:高效、易用的实时数仓

Apache Flink

flink #TiDB

架构师训练营第二周课后作业

天涯若海

极客大学架构师训练营

甲方日常 40

句子

工作 随笔杂谈 日常

数字货币交易所系统开发解决方案,撮合交易平台搭建

WX13823153201

数字货币交易所系统开发

第6周学习总结

饭桶

蚂蚁金服开源:数据驱动的高交互可视化图形语法G2-InfoQ