AICon全球人工智能与机器学习技术大会9折特惠中,点击立减¥480>> 了解详情
写点什么

10 月不能错过的这场开源大数据大会,有哪些亮点值得开发者关注?

2021 年 10 月 13 日

10月不能错过的这场开源大数据大会,有哪些亮点值得开发者关注?

数据是 DT 时代新的“石油”,这句话,大家已经耳熟能详。当数据成为石油,其价值则依靠大数据技术的挖掘和变现。


从网购、叫车、订外卖到看电影,人们生活和工作诸多场景的背后都离不开大数据技术。经过十几年的发展,它已经成为互联网企业的基础设施。通过大数据技术,企业可以洞察用户,发现新需求,找到增长点,同时基于大数据实现降本增效,并进行业务决策。因此,无论是业务发展,还是自身转型,大数据技术能力对企业来说都很重要。



对传统企业或成熟型企业来说,为快速实现业务需求,“烟囱式开发”导致企业不同业务线,甚至同一业务线的不同应用之间,数据都是割裂的。割裂形成数据孤岛,无法彰显数据价值,不能驱动业务发展。这是它们的痛。


对新兴的创业型公司而言,开源大数据技术从 Hadoop 生态“一枝独秀”到现在的各种开源大数据技术“百花齐放”,如何选择最适合自己的开源大数据技术,构建功能完整的数据平台。这是它们的痛。


针对上述问题,2021 WeDataSphere 社区大会·深圳分会场可能有你想知道的答案。这场活动面向开源大数据领域的开发者和用户,邀请到开放原子开源基金会 TOC 主席堵俊平、WeDataSphere 社区发起人邸帅、天翼云大数据平台技术专家王小刚等嘉宾进行分享。


本次分享既有对开源大数据技术和工具发展趋势的解读,还有开源一站式大数据平台套件 WeDataSphere 最佳实践和优秀案例的分享,更有如何基于开源项目构建企业级数据平台的探讨和交流。

亮点一:开源大数据技术和工具发展趋势


开放原子开源基金会 TOC 主席堵俊平将介绍开源大数据领域的技术、工具发展历程和最新趋势。通过这个演讲,你将进一步了解大数据领域技术发展的现状、新趋势,洞察大数据技术的演进路径。


此外,WeDataSphere 社区发起人、计算中间件 Apache Linkis (Incubating) PPMC、微众银行大数据平台负责人邸帅将分享 WeDataSphere 层次化模块化高复用建设思路和开源历程。通过这个演讲,你不仅可以了解基于开源项目,构建企业级大数据平台的思路,而且还将学习到如何以高复用方式构建数据平台。

亮点二:如何基于 WeDataSphere 等开源项目构建企业级大数据平台


Apache Linkis 是 WeDataSphere 大数据平台开源的计算中间件。微众银行大数据平台工程师尹强将向大家分享基于 Linkis 实现上下层间真正解耦,助力构建一站式、金融级、全连通的 WeDataSphere 大数据平台开发套件的生产实践。通过这个分享,你将了解大数据平台面临的计算治理问题,同时,了解计算中间件的解决思路和开源社区方案的对比。此外,你还能了解 Linkis 如何助力和加速企业级大数据平台的建设。


随着数据爆发式增长,数据分析工具对一个公司高效挖掘数据价值显得越来越重要。微众银行大数据平台工程师王和平将向大家介绍 WeDataSphere 数据分析工厂的建设和开源思路,阐述 WeDataSphere 数据分析工厂从数据流入 / 数据分析 / 数据可视化 / 数据质量等流程的建设思路、功能介绍和未来规划。基于这个分享,你将了解开源数据分析工具的选型思路,学习数据分析工具的建设经验以及知晓数据分析工具如何有效提升数据分析人员的效率。


目前,各大金融机构积累了海量丰富的数据,对数据的管理和应用能力已经成为核心竞争力之一。同时,大数据的发展带来了企业对个人隐私信息的过度采集和使用问题,监管部门也对金融机构的数据治理提出更高要求。微众银行大数据平台工程师周可将分享基于开源系统打造数据治理系统的实践过程。通过分享,你将知晓数据治理面临的挑战和要解决的问题。同时,了解开源数据治理系统的选型思路,学习金融级大数据平台数据治理系统的建设经验。


近年来,机器学习已经渗透到各行各业,而数据是机器学习模型开发的前提及关键,一个优秀的机器学习平台往往需要与大数据平台做好适配。微众银行大数据平台工程师吴梓煜将分享 WeDataSphere 机器学习平台的构建之路、如何利用云原生技术构建一站式机器学习平台和 WeDataSphere 如何打通大数据平台与云原生机器学习平台。通过本次分享,你将学习开源相关的云原生机器学习平台技术选型,了解大数据平台与云机器学习平台结合的痛点。

亮点三:最佳实践与案例分享


安全是重中之重,大数据平台计算组件多,治理繁杂。一直以来,天翼云尝试提升大数据平台的安全性,解决计算治理的问题,后来选择 WeDataSphere 开源组件进行相关工具建设,尝试降低数据分析使用人员的学习成本,提高工作效率。天翼云大数据平台技术专家王小刚将分享 WeDataSphere 开源组件在天翼云大数据平台产品中的应用实践。通过本次分享,你将了解如何解决公司计算组件多,治理繁杂问题,同时,全方位地保证大数据平台的使用安全,以及如何提升一站式开发管理工具的用户体验,降低用户学习使用成本。


来自萨摩耶云的数据业务部总监易小华将分享 WeDataSphere 在萨摩耶云的应用,详细阐述萨摩耶云基于 WeDataSphere 研发的数据治理和用户行为分析模块,以及 WeDataSphere 的应用效果和给业务带来的价值。

亮点四:现场“0”距离分组交流探讨


为更好的利用难得的线下见面机会,更多的增加现场互动,我们专门设计了按会前提交的“感兴趣议题”,现场分组讨论的环节。您可以与各位讲师及同行,就自己最感兴趣的话题,做现场充分交流探讨,碰撞火花,激发灵感。


想了解更多分享干货?我们在 10 月 30 日的 2021 WeDataSphere 社区大会·深圳分会场等你!



或点击下方链接参与报名


https://www.infoq.cn/event/?id=205

2021 年 10 月 13 日 11:081
用户头像
万佳 InfoQ编辑

发布了 622 篇内容, 共 237.1 次阅读, 收获喜欢 1597 次。

关注

评论

发布
暂无评论
发现更多内容

聊聊并发,进程通信方式,go协程简单应用场景

AI乔治

Java 架构

IDEA@Data注释使用

AI乔治

Java 架构 注解

MySQL在按照某个字段分组、排序加序号

AI乔治

Java MySQL 架构

生产环境全链路压测建设历程 25:FAQ 7、8 正常业务保护和外调接口的处理

数列科技杨德华

28天写作

架构师培训第二周课后作业

跳蚤

微信视频号的不同 | 视频号28天(03)

赵新龙

28天写作

技术人小故事-团队愿景篇-第2段

Ian哥

28天写作

反对没有节制的加班文化

熊斌

管理 职场 工作思路 28天写作

第七周 学习总结

简简单单

从大局着眼,立微处发力

张老蔫

28天写作

架构师训练营第 12 周课后练习

菜青虫

车轱辘话来回说怎么治

Justin

团队协作 沟通 28天写作

4.5万字手把手教你实现MySQL TB级数据存储!!

冰河

MySQL 分布式 微服务 数据存储 mycat

汽油车最简知识——28天写作Day2/28

mtfelix

28天写作 电动汽车

week7-homework

J

程序员练习算法的几个实用技巧

Phoenix

算法

MySQL慢查询(下):问题解决,干货总结

架构精进之路

MySQL MySQL 高可用 MySQL优化 28天写作

第七周 性能优化作业

简简单单

创业也是要帮助他人突破认知 Jan 10, 2021

王泰

28天写作

中华石衫 Elasticsearch 顶尖高手系列课程

escray

elasticsearch elastic 28天写作 死磕Elasticsearch

新官上任,如何开始你的管理工作(上)

一笑

管理 28天写作

大作业2

钟杰

HDFS SHELL详解(3)

罗小龙

hadoop 28天写作 hdfs shell

python自学 第一章 初始python

WEB前端修行日志

Python

大数据知识专栏1-Hadoop环境安装

小马哥

大数据 hadoop 28天写作

面试官:换人!赶快换人!连 CopyOnWriteArrayList 都没听过!

xcbeyond

Java 28天写作 CopyOnWriteArrayList

第12周作业

Jack

week7-总结

J

有关架构设计原则的总结

跳蚤

堡垒机是什么?

Java程序经验小结:谨慎的使用本地方法

后台技术汇

28天写作

数据cool谈(第1期)数据库寻路,开源有态度

数据cool谈(第1期)数据库寻路,开源有态度

10月不能错过的这场开源大数据大会,有哪些亮点值得开发者关注?-InfoQ