写点什么

支持大数据的 JasperSoft 4 发布了

  • 2011-02-18
  • 本文字数:1748 字

    阅读完需:约 6 分钟

近日, JasperSoft 宣布提供对大数据系统报表的支持,包括 Hadoop 、几种流行的 NoSQL 数据库以及 3 个 MPP 分析关系数据库上的各种模型报表。他们现在支持:

  • Hadoop——Jaspersoft 通过 Hive SQL 接口和 HBase 支持 Hadoop,通过 HDFS 读取文件,包括 Avro 文件格式。
  • NoSQL——Jaspersoft 对如下广泛使用的数据存储提供了 NoSQL 支持:键值存储、文档数据库、BigTable Clones、图形数据库以及 Data Grid Caching。Jaspersoft 的开源项目支持各种 NoSQL 技术报表,包括:Cassandra、MongoDB、Riak、HBase、CouchDB、Neo4J、Infinispan、VoltDB 以及 Redis。还有一个用于 VMware GemFire 的闭源连接器,目前处于 Beta 版。
  • MPP 分析数据库——Jaspersoft 支持 IBM 的 Netezza MPP 分析数据库数据仓库,不久还会提供商业的分析支持。此外还支持 Vertica 与 EMC Greenplum。

InfoQ 有幸采访到了 JasperSoft 技术联盟的资深总监 Andrew Lampitt 以详细了解此次发布。

问:此次发布与其他 BI 厂商所提供的产品有何不同?

答:JasperSoft 一直都支持晦涩的数据格式的报表。

现在,业界都在使用非常乏味的方法制作 Hadoop 上的报表,使用 Hive 对 Hadoop 执行 SQL 查询。JasperSoft 增加了对 HDFS 中的文件报表的支持,或是直接支持 HBase,也支持各种 NoSQL 风格。

问:你们做过性能基准测试么?

答:他们都是第一代或第二代的连接器,更不必说产品质量了。JasperSoft 与多家厂商保持着合作关系,项目所有者会制作出第一份报表。JasperSoft 已经通过潜在或现有客户了解到了诸多反馈信息。

问:这些连接器的使用或评测级别如何?

答:我们既让现有的客户使用,也让新客户使用,从他们那里能获得反馈信息。从某种程度上说,此次发布是为了引起人们的注意。

我们与客户和厂商紧密合作,从中了解到这些公司最渴求的报表需求。

问:此次发布包含哪些新功能?

答:JasperSoft 连接器提供了

  • 数据连通性——可以作为客户化数据源如 MongoDB 或 Riak 来连接
  • 客户化查询执行器——可以使用各种风格的系统(包括非 SQL、层次系统)所使用的查询语言 / 语法

JasperSoft 支持将文件加载到内存并在其中操作文件。

图形数据库(比如 Neo4J)中的节点分析与键值存储形式是大不相同的。

问:支持非传统格式中的摘要或 star schema 报表么?

答:我不太确定。关系系统的报表与数据仓库的差别非常大。

对于 MongoDB 或 Riak 来说,你可以在 GUI 层次上操纵数据,比如说摘要,但它并非传统的分析情况。

我们将 NoSQL 看作是 OLTP 的新选择。

如果我是个使用 Hadoop 的开发者,想要查看一些数据,那么就可以通过文件系统报表达成所愿。

问:何时在 Hadoop/HDFS 中查询文件,会将整个文件加载到内存中么?

答:是内存的限制么?没必要将全部数据加载到客户端浏览器中,但在服务器端(JasperReports 服务器)却总是加载全部内容。

问:有什么办法可以使用过滤器或是最小化文件数据集的大小?

答:一切皆有可能,但这并非我们现在想要解决的问题。这类似于本地的 CSV 文件。通常,你需要将全部文件加载到内存中。对文件进行过滤并不是一个好办法。

问:JasperSoft 对 HBase 报表的支持如何?

答:HBase 只是针对给定字段存储一系列字节而已。没有什么内建的手段可以获悉这些字节所代表的对象类型。在 POC 版本的连接器中,我们将一张传统的表转换成了 HBase。我们将表的主键作为 ROW_ID,将其他的列名作为 HBase 中的 FAMILY,将字段值转换为字节,并将其作为 VALUE。我们还使用 QUALIFIER 存放数据类型信息。这样,连接器就知道每个字段的数据类型是什么了。其他人也可以像我们一样将数据加载到 HBase 中(感兴趣的读者可以查看 HBase loader 的源代码了解详情)。

接下来要实现一个可插拔的反序列化引擎,将其插入到连接器中。这样,连接器就知道从给定字段中所取出的字节可以使用Java 序列化机制进行序列化,也可以使用Google 的Protocol Buffers 或是其他序列化方法。我们就可以“获悉”每个字段的数据类型了。基于这一点,使用JasperSoft iReport(桌面版的报表设计器)的开发者就可以轻松构建报表了。

我们还可以直接或是通过Thrift 间接连接到HBase。Thrift 是可选的,常与HBase 搭配使用。

感兴趣的读者还可以到项目的下载页面了解连接器的详细信息。

查看英文原文: JasperSoft 4 Released with Big Data Support

2011-02-18 10:273613
用户头像

发布了 88 篇内容, 共 272.9 次阅读, 收获喜欢 9 次。

关注

评论

发布
暂无评论
发现更多内容

挖到宝了!2022阿里大佬手写“精品”Sping Boot学习笔记

小小怪下士

Java 程序员 阿里 springboot

java程序员可以参加大数据培训吗

小谷哥

上海前端培训课程应该怎么来学习呢?

小谷哥

聚焦“教-学-评-测-练-管一体化”,推动新型人才培养!

华为云开发者联盟

云计算 后端 华为云

[力扣] 剑指 Offer 第一天 - 用两个栈实现队列

陈明勇

Go 数据结构与算法 力扣 11月月更

Python进阶(三十七)Windows7使用nginx+apache部署django项目

No Silver Bullet

Python Apache nginx django 11月月更

直播CDN调度技术关键挑战与架构设计

京东科技开发者

架构 系统架构 直播 CDN加速 CDN技术

零基础学习大数据培训难吗?

小谷哥

亚中医疗——数据驱动预算管理升级,引领业务发展

元年技术洞察

数据驱动

大咖说·先临三维|高精度3D视觉技术商业应用与实践

大咖说

科技 高精度3D视觉

还在为数据库事务一致性检测而苦恼?让Elle帮帮你,以TDSQL为例我们测测 | DB·洞见#7

腾讯云数据库

数据库 腾讯云 数据一致性 tdsql 腾讯云数据库

JavaScript刷LeetCode拿offer-二叉树层序遍历篇

Geek_07a724

JavaScript LeetCode

大数据培训学习的时候有什么方法吗

小谷哥

一文读懂NodeJs知识体系和原理浅析

coder2028

node.js

js对象和原型、原型链的关系

hellocoder2029

JavaScript

js函数式编程讲解

hellocoder2029

JavaScript

元年科技:在数字化浪潮中,为企业建造一艘“方舟”

元年技术洞察

微服务 云原生 容器化 方舟企业数字化 PaaS 平台

分享一招应对BOM表的检查方法,摆脱被BOM支配的“恐惧”

华秋PCB

检查 PCB PCB设计

MASA MAUI Plugin (六)集成个推,实现本地消息推送[Android] 篇

MASA技术团队

blazor MASA MAUI Xamarin MASA Blazor

一篇神文就把java多线程,锁,JMM,JUC和高并发设计模式讲明白了

程序知音

Java 高并发 性能调优 java架构 后端技术

java培训如何入门,怎么选择靠谱机构

小谷哥

nodejs实现jwt

coder2028

node.js

Python进阶(三十九)使用matplotlib进行绘图分析数据

No Silver Bullet

Python 绘图 matplotlib 11月月更

JavaScript刷LeetCode拿offer-js版字典

Geek_07a724

JavaScript LeetCode

ONES 出席产业互联高峰论坛,分享金融企业研发管理实践

万事ONES

Nftea: 世界杯文化、 NFT与 期权的首度碰撞

股市老人

彻底搞懂nodejs事件循环

coder2028

node.js

杀疯了,GitHub疯传2022Java面试八股文解析+大厂面试攻略

程序知音

java架构 程序员面试 后端技术 Java面试题 Java面试八股文

js异步编程的三种模式

hellocoder2029

JavaScript

Python进阶(三十八)利用matplotlib 进行折线图,直方图和饼图的绘制

No Silver Bullet

Python matplotlib 11月月更

支持大数据的JasperSoft 4发布了_Java_Ron Bodkin_InfoQ精选文章