写点什么

Griffin 正式成为 Apache 顶级项目

  • 2018-12-15
  • 本文字数:1789 字

    阅读完需:约 6 分钟

Griffin正式成为Apache顶级项目

Apache 软件基金会正式宣布 Griffin 为顶级项目。Griffin 是一个适用于各种规模分布式数据系统的开源大数据质量解决方案。它提供一个统一的流程以从不同角度度量数据数据质量,以及构建和验证在流式处理或批处理上下文中的可信数据资产。


Griffin 起源于 eBay,并于 2016 年 12 月进入 Apache 孵化器。


Griffin 副主席 William Guo 说:“对于 Griffin 到达这一重要里程碑,我们感到非常自豪。通过积极提高大数据质量,Griffin 有助于构建可信数据资产,从而提升对业务的信心。”


Griffin 通过以下方式帮助数据科学家和分析师处理数据质量问题:


  • 定义——指明数据质量要求,如准确性、完整性、及时性和描述性等;

  • 度量——摄取到 Griffin 计算集群的源数据将根据用户定义的需求度量数据质量;

  • 应用指标——数据质量报告作为指标,将被导出到指定位置。


此外,Griffin 允许用户将新的要求纳入平台,并编写全面的逻辑来进一步定义数据质量。


Griffin 被广泛应用于网易、eBay、Expedia、华为、京东、美图、PayPal、平安银行、PPDAI、VIP.com 以及 VMWare 等具有大数据量和高需求的环境中 。


eBay、通用汽车中国卓越中心副总裁 Vivian Tian 表示:“2016 年 12 月 eBay 把 Griffin 贡献给 Apache 孵化器,以确保其未来以社区驱动的方式发展。Griffin 的想法始于 eBay 想要解决跨多个系统中(尤其是在流式数据上下文)的数据质量问题 。Griffin 给数据生态系统带来了数据质量解决方案,并确保数据应用程序拥有坚实的质量基础。我们非常高兴看到 Griffin 作为 Apache 顶级项目毕业了,并期望它继续创新并和 Apache 社区继续合作。”


VIPshop Finance 高级总监 Chao Zhu 表示:“两年来,我们一直在使用 Griffin,用数据质量指标监控 1000 多张数据表。我们很高兴看到它成为顶级项目。Griffin 及其数据质量 DSL 有助于我们轻松地在我们的大数据平台上即时识别数据质量问题。此外,Griffin 的架构具有高度可扩展性。我们期盼能够在实时数据质量管理系统中使用它。我们也希望为 Griffin 贡献一些力量,回馈社区。”


PPDAI 实时数据部门总监 Jianfeng Liu 说:“我们感谢 Griffin 项目,它真的对我们的日常工作很有帮助。在努力应对数据质量问题多年之后,我们转向 Griffin,以简化我们的数据质量管道。因为批处理和流处理都可以用到 Griffin 的统一模型,我们已经能够用一种无缝的解决方案替换了传统系统。Griffin DSL 让我们大大简化了我们的管道,并减轻了我们的工作量。我很自豪也很兴奋地看到该项目的毕业。”


PayPal 企业服务平台高级工程经理 Austin Sun 说:“Griffin 是我的团队迄今为止用过的最好的数据质量解决方案之一。看着 Griffin 社区飞速发展是一个非常令人兴奋的过程。很多人不断采用它并贡献更新的功能。在 PayPal 风险部门,我们从 Griffin 中受益良多,借助 Griffin,我们能够提供高质量数据来做出精确决策和保护我们的客户。除了 PayPal 风险部门,我知道还有其他企业也在使用 Griffin 的核心能力作为他们的数据质量解决方案。我很荣幸目睹 Griffin 成长为顶级项目。请继续努力,Griffin。”


ASF 成员和 Griffin 孵化器导师 Henry Saputra 说:“Griffin 项目是另一个展示项目,它展示了社区如何让代码从公司内部走向开源。除了其它几个已经捐赠给 ASF 的项目(如 Apache Kylin 和 Eagle)外,我很自豪参与了 Griffin 项目,并在 eBay 把它贡献出来时成为该项目的导师。整个团队非常努力地去适应 Apache Way,并充分尊重开源社区在设计、开发和发布过程。作为一个顶级项目,我认为 PMC 将有助于领导该项目在未来取得更大的成功。”


Guo 补充道:“毕业不是结束,它是另一段旅程的开始。我们希望通过更广泛的功能和用户把 Griffin 提升到一个新水平。我们欢迎大家加入,通过产品设计、文档、代码、技术讨论或用 Apache Way 来推广 Griffin。”


可用性和监督


Griffin 基于 Apache License v2.0 发行,并由一个活跃贡献者自选的团队进行监督。项目管理委员会(Project Management Committee,简称 PMC)指导项目的日常运营,包括社区开发和产品发布。有关下载、文档以及参与 Griffin 项目的方法,请访问以下网址:http://griffin.apache.org/https://twitter.com/apachegriffin


阅读英文原文:https://globenewswire.com/news-release/2018/12/12/1665737/0/en/The-Apache-Software-Foundation-Announces-Apache-Griffin-as-a-Top-Level-Project.html


2018-12-15 13:483969
用户头像

发布了 199 篇内容, 共 88.5 次阅读, 收获喜欢 295 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

2023 MWC上海:移动云勇担新基建国家队 引领算网新趋势

极客天地

语音房源码搭建技术分享之降噪功能详解

山东布谷科技

软件开发 源码搭建 语音房源码 语音房

追击策略?微软云服务器业务2022年规模少于亚马逊AWS一半

B Impact

营销SaaS SemRush 2.9 亿美元年收入的五个经营数据分析

B Impact

2023-07-03:讲一讲Redis缓存的数据一致性问题和处理方案。

福大大架构师每日一题

redis 底层原理 福大大架构师每日一题

用ChatGPT搞定K8s!

互联网工科生

k8s kubernetes 运维 ChatGPT

大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

浪潮信息直播高能预告!令人感兴趣的高性能架构、CXL技术、数据库等硬件相关技术分享来了 | 第 83-85 期

OpenAnolis小助手

开源 高性能架构 龙蜥大讲堂 RDMA 浪潮信息

揭秘元宇宙背后的最炫科技风

华为云PaaS服务小智

云计算 华为云 元宇宙

SQL 优化(四):如何使用 join

hungxy

软件DevOps云化发展的趋势 【课程限时免费】

华为云PaaS服务小智

云计算 DevOps 云原生 华为云 华为开发者大会2023

如何自动化测试你的接口?—— Rest Assured

不在线第一只蜗牛

自动化 自动化测试 API

技术分享| 融合通讯的架构介绍

anyRTC开发者

音视频 MCU mesh SFU 融合通讯

POCO库的安装与基础知识说明

芯动大师

第九届“互联网+”大赛产业赛道百度命题正式公布!57道命题,等你揭榜!

飞桨PaddlePaddle

人工智能 百度

谁是家居智能化时代“头号玩家”? 小度全屋智能将登陆中国建博会

新消费日报

扫光动效在移动端应用实践

百度Geek说

动效 移动端 企业号 7 月 PK 榜

时序数据库 TDengine 与 DBeaver 达成合作,生态系统再壮大

爱倒腾的程序员

涛思数据 tdengine 时序数据库

Flink-Learning 实战营在升级!更多精美好礼等你来!

Apache Flink

大数据 flink 实时计算

代码随想录训练营 Day06 - 哈希表(上)

jjn0703

一篇文章带你上手性能测试框架K6

QE_LAB

自动化测试框架 测试自动化 #性能测试

火山引擎 DataLeap 构建Data Catalog系统的实践(一):背景与调研思路

字节跳动数据平台

数据挖掘18大算法实现以及其他相关经典DM算法:决策分类,聚类,链接挖掘,关联挖掘,模式挖掘。图算法,搜索算法等

汀丶人工智能

人工智能 数据挖掘 机器学习 深度学习 决策树

算法复杂度介绍

宁静知行者

算法

组合框架:融合创新技术,实现一次编码多平台运行

FinFish

flutter 跨端开发 小程序容器 跨端框架 跨端应用开发

合作、参与、让开源更易用 | 亚马逊的开源文化

亚马逊云科技 (Amazon Web Services)

云计算

inBuilder今日分享丨系统集成系列之异构接入

inBuilder低代码平台

集成

Griffin正式成为Apache顶级项目_大数据_Apache软件基金会_InfoQ精选文章