写点什么

大数据自助平台的思考与建设

2019 年 8 月 15 日

大数据自助平台的思考与建设

ArchSummit深圳2019大会上,成峰讲师做了《大数据自助平台的思考与建设》主题演讲,主要内容如下。


演讲简介


Grab 是东南亚最大的互联网 O2O 平台,业务由刚开始的打车业务,扩展到涵盖了打车、支付、送餐、地图、物流、生鲜等诸多领域。


如此快速变化的业务发展给数据工程团队带来了很多挑战,上游的数据快速增长和变化,数据团队需要快速支持数据流的变化。同时,数据量的快速增长和数据模型逐渐复杂化,我们支持下游数据分析团队可以快速的分析处理。这些驱动着我们设计端到端自助的大数据处理平台,把各类数据需求模块化,自动化,给数据用户自助服务的平台。给上下游提供平台每个环节的可见度,联通数据生产者和数据消费者。


演讲提纲


  1. Grab 的数据架构的演化

  2. 数据平台的迭代

  3. 存储与计算引擎的挑战

  4. 数据平台自助化的原动力

  5. 大数据遇到微服务

  6. 多元化自助 BI 的需求

  7. 数据平台自助化的实践

  8. 自助数据导入平台

  9. 自助数据分析平台

  10. 自助数据导出平台

  11. 数据治理的思考和实践

  12. 数据质量监管平台

  13. 元数据管理


听众受益点


  1. 多元化业务快速发展的初创公司的平台化转型路径

  2. 如何设计高可扩展性,高性能的数据平台

  3. 自助化思维落地的挑战与实践


讲师介绍


成峰


Grab Data Engineering Lead


主导 Grab 大数据平台开发和维护。8 年 Data Geek,经历了 Oracle RAC,MPP,Hadoop 到如今 Spark/Presto 储存与计算分离的架构演变。


现在就职 Grab 新加坡,专注于的 Data Lake,数据平台,数据治理的研发工作。参与并主导了数据平台的端到端自助平台化的研发。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/shenzhen/schedule


2019 年 8 月 15 日 00:00999

评论

发布
暂无评论
  • 滴滴出行数据应用平台建设实践

    在 ArchSummit 北京 2019 大会上,郑秋野讲师做了《滴滴出行数据应用平台建设实践》主题演讲。

  • 亿级数据服务化平台的建设与发展

    在 ArchSummit 北京 2019 大会上,常越峰讲师做了《亿级数据服务化平台的建设与发展》主题演讲。

  • 架构师训练营第二周命题作业

    作业一:请描述什么是依赖倒置原则,为什么有时候依赖倒置原则又被称为好莱坞原则?

    2020 年 6 月 17 日

  • 大数据自助平台的思考与建设

    演讲嘉宾主导 Grab 大数据平台开发和维护。8年 Data Geek,经历了 Oracle RAC,MPP,Hadoop 到如今 Spark/Presto 储存与计算分离的架构演变。现在就职 Grab 新加坡,专注于的 Data Lake,数据平台,数据治理的研发工作。参与并主导了数据平台的端到端自助平台化的研发。内容介绍Grab 是东南亚最大的互联网 O2O 平台,业务由刚开始的打车业务,扩展到涵盖了打车、支付、送餐、地图、物流、生鲜等诸多领域。如此快速变化的业务发展给数据工程团队带来了很多挑战,上游的数据快速增长和变化,数据团队需要快速支持数据流的变化。同时,数据量的快速增长和数据模型逐渐复杂化,我们支持下游数据分析团队可以快速的分析处理。这些驱动着我们设计端到端自助的大数据处理平台,把各类数据需求模块化,自动化,给数据用户自助服务的平台。给上下游提供平台每个环节的可见度,联通数据生产者和数据消费者。

    2019 年 7 月 26 日

  • 技术管理:如何“革新”不“革命”?

    跨界玩家层出不穷的时代,“颠覆式创新”此起彼伏。创业维艰,长青不易,面对变革的焦虑,技术团队如何“革新”不“革命”?没有一步到位的完美企业,法无定法,“快发展”的结果有时来自内功修炼的“慢功夫”。而要保证变革稳步开展,需要管理者掌控全局,把握尺度和守住“基本盘”。同时,灵活采用种种策略,卡准节奏,让变革从情怀到落地。讲师简介2016年加入白山,负责公司技术产品战略的实施、技术人才培养和研发体系管理工作,带领团队研发了云存储、ATD云安全、数据蜂巢等新业务。曾担任新浪研发中心总经理,在新浪工作 16 年,新浪云计算业务发起人之一,积累了丰富的互联网技术及云计算、大数据等行业经验。

    2020 年 1 月 3 日

  • 7.5 锁: 锁原语 CAS

    7.5锁:锁原语CAS

    2020 年 11 月 9 日

  • 「架构师训练营」第 1 周命题作业

    命题作业:食堂就餐卡系统设计

    2020 年 6 月 9 日

  • 亿级数据服务化平台的建设与发展

    个推作为专业的数据智能服务商,以数据技术为引擎,为各行业提供大数据解决方案,致力于构建数据智能新生态。自 2010 年成立以来,个推依托出色的消息推送技术,成功服务了包含人民日报、新华社、CCTV、新浪微博、京东、网易新闻、滴滴出行等在内的数十万 APP,SDK 安装量超 440 亿,覆盖超 40 亿设备。本次演讲将介绍个推亿级数据服务化平台建设的背景和演进过程,详细介绍个推数据服务化平台架构设计,以及建设过程中所遇到的挑战及解决方案讲师简介曾在多个创业公司担任研发主管,主导多个大数据项目研发。现任个推大数据研发高级主管,负责数据仓库、数据挖掘平台的建设等,在数据研发领域拥有丰富的经验。

    2020 年 1 月 3 日

  • 第 62 讲 | 张溪梦:技术领袖需要具备的商业价值思维

    技术领袖必须转变成商业战略导向的思维,通过解决业务的问题,拉动增长,完成创新-战略-执行-结果的过程,和公司的CXO们一起为,企业的增长做出各种准备和努力。

    2018 年 7 月 31 日

  • 数据中台建设三板斧:方法论、组织和技术

    建数据中台就比作盖房子,设计图纸是数据中台建设的方法论;工具是数据中台的支撑技术;施工队伍就是数据中台的组织架构。

    2020 年 4 月 6 日

  • Flink 源码分析之 Flink 是如何 kafka 读取数据的

    Flink读取kafka数据

    2020 年 6 月 7 日

  • 基因组数据区块链的机会和挑战

    演讲嘉宾 陈钢,WeGene研发CTO,TGO鲲鹏会会员。 内容介绍 大规模基因组数据已经是生物医药研发和应用过程中不可或缺的重要资源。但是基因组数据的收集和利用、存储和计算资源,以及由此带来的利益在数据贡献者、计算和存储资源贡献者和研发机构之间的分配日益成为一个亟待解决的问题。 区块链技术的出现和成熟,让我们有可能构建起一套透明的利益分配系统,并以此为基础,利用协同计算和存储发展出一个弱中心化的基因组应用和研究网络。进而以基因组数据为核心,融入更多其他生命数据,成为生命科学研发和应用的基础设施。这将彻底改变整个生命科学研究和应用的方式,极大的提升效率,并让所有参与方获得合理的收益。 演讲大纲 Nebula Genomics、Shivom、Zenome等基于区块链的基因组应用和研究网络的发展进展,以及这些项目所存在的问题及在大数据存储、隐私保护、安全计算、监管政策等方面所面临的技术挑战; 上述技术挑战可能的解决方案,例如协同存储、协同计算、软硬件同态加密、SGX等技术的优劣; 一个基于以太坊的数万人基因组数据应用和研究网络项目开发运营过程中的经验教训。

    2018 年 9 月 12 日

  • 企业级金融数据平台云上研发之路

    企业级金融数据平台云上研发之路

  • 【第十三周】课后作业

    作业:Google 搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述 PageRank 算法。)

    2020 年 12 月 20 日

  • OOA-OOD:面向对象分析 / 设计练习

    面向对象分析/设计练习--week2

    2020 年 9 月 27 日

  • 大数据自助平台的思考与建设丨 ArchSummit

    平台,业务由刚开始的打车业务,扩展到涵盖了打车、支付、送餐、地图、物流、生鲜等诸多领域。如此快速变化的业务发展给数据工程团队带来了很多挑战,上游的数据快速增长和变化,数据团队需要快速支持数据流的变化。

  • 企业开发遇到瓶颈,何不换个新思路?快速开发了解一下

    雨云漆黑如乌鸦的羽翼,扇动的风裹挟着远处滚滚而来的闷雷,将豆大的雨水打在窗上。视线在雨幕中胶着,眼前的城市在扬起的水雾中逐渐模糊起来。南方的夏日气候是出名的多变,也就一杯红茶的功夫,烈日耀阳的晴空便会被不知从何而来的乌云笼罩。

    2020 年 10 月 12 日

  • ARTS 打卡第三周(200525-200531)

    同步-ARTS 打卡第三周

    2020 年 8 月 24 日

发现更多内容

2020国庆我花了 7 天给大家撸了一篇云南旅游攻略

石头

美食 旅行

程序员在中国是青春饭?扯!看看阿里资深架构师是怎么说的!

Java架构师迁哥

Java 程序员 面试

手把手教你AspNetCore WebApi:数据验证

AI代笔

ASP.NET Core web api 数据验证

能够让机器狗学会灭火, ModelArts3.0让AI离我们又近一步

华为云开发者社区

人工智能 AI 机器狗

MySql领域经典之作,“不敢自诩为MySql专家,岂敢错过这本神书”

Java架构之路

Java MySQL 程序员 面试 编程语言

阿里巴巴内部“Java成长笔记”,看完才发现自己和阿里大牛的差距真的太远了!

Java架构之路

Java 阿里巴巴 程序员 面试 编程语言

Redis-技术专题-Jedis实战入门

李浩宇/Alex

论软件工程师的自我修养:角色、重构与质量

华为云开发者社区

软件 开发 工程师

一场哔哩哔哩Java开发面试之旅,分享面试经历及复习资料

Java成神之路

Java 程序员 面试 算法 编程语言

《我想进大厂》之Redis夺命连环11问

艾小仙

Java redis 面试 程序语言

反射API

彭阿三

反射

诺奖以上,真相未满:追捕黑洞二百年

脑极体

【硬件篇之功耗测试】

良知犹存

硬件

手写SpringIOC

彭阿三

spring源码 sping springioc

架构师第一期作业(第四周)

Cheer

课程作业

Java并发编程-线程基础

云流

程序员 并发编程 java 14 架构师训练

开源监控系统open-falcon搭建笔记

卓丁

监控 监控管理平台 Open-Falcon 监控告警

一文搞懂PV、UV、VV、IP及其关系与计算

冰河

多线程 高并发 流量 并发流量

来碗小面

葱小白

美食 旅行

嘘!偷窥鹅厂运维专家,让Linux内核奔跑起来不得不说的秘密

周老师

Java Linux 编程 程序员 架构

面朝大海,夏日的遗憾一定会被秋风温柔化解

张sir

美食 摄影 摄影征文 旅行

TensorFlow安装

菜鸟小sailor 🐕

学习

实用威胁建模指南(二)

亚伦碎语

敏捷 安全 系统安全架构 系统安全 威胁建模

延迟满足

时间是一个人最好的证明

延迟满足感 成功

浅析 Java 内存模型 一

朱华

Java JMM

云服务时代,未来怎么样保障自己的核心竞争力?

boshi

个人成长 职业规划 云服务

vidyo提供的云化视频会议与传统的视频会议有什么区别?

dwqcmo

音视频会议 集成架构 解决方案 智能硬件

某Java程序员在外包公司每天读写删改几年后,发现跳不出来了

Java架构之路

Java 程序员 面试 算法 编程语言

MySQL-技术专题-连接查询和子查询

李浩宇/Alex

系统架构第四周作业「架构师训练营第 1 期」

天天向善

系统架构第四周总结「架构师训练营第 1 期」

天天向善

NLP领域的2020年大事记及2021展望

NLP领域的2020年大事记及2021展望

大数据自助平台的思考与建设-InfoQ