【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

星环科技研发总监刘汪根:大数据 3.0 时代的星环之路

  • 2018-08-22
  • 本文字数:2240 字

    阅读完需:约 7 分钟

8 月 14 日,2018 星环科技大数据 3.0 研讨会北京站圆满举行,本站研讨会,来自各行业的参会嘉宾逾 300 人,星环科技联合北京大学、卓朗科技、联储证券、数起科技等众多合作伙伴、客户展开行业落地案例分享,旨在让观众对星环的产品有更深入的了解。

星环科技创始人兼 CEO 孙元浩先生率先登台,介绍了星环的发展趋势及产品路线。自 13 年星环科技成立以来,在五年内迅速发展,星环的家族产品越来越多。2018 年通过 TPC-DS 的测试,代表星环在此方面的技术已经达到世界顶尖水平,星环的客户数量也从 13 年的 6 个爆炸式攀升到了 1020 个,客户分布于大江南北,集中在北上广深,分支机构从上海出发,遍布全国,在新加坡,休斯顿,多伦多也有星环的足迹。

孙元浩认为,大数据 3.0 时代具备 5 个技术特征,融合的数据平台,开发方式的融合,BI+AI 的融合,ABC 的全面融合,应用 + 数据与企业生态应用的生态融合。

星环科技数据工程部资深架构师高俊杰为大家介绍了星环科技新一代智能大数据云平台 TDC,TDC 是大数据、云平台与人工智能三者成功融合的智能产物。星环科技的云平台 TDC 作为大数据 3.0 时代典型的落地产品,涵盖了星环科技的大数据平台、人工智能平台和云部署,实现 ABC 的全面融合,为业务创新提供了坚实的技术基础。

大型企业的大数据业务在演进过程中也将基本遵循:数据统一化—数据资产化—数据业务化—数据生态化的路线,星环科技 TDC 作为优秀的底层平台,遵循技术的发展趋势,以解决业务需求为目标,为更多行业应用提供可能。

星环科技分布式存储研发经理刘熙介绍了分布式闪存数据库产品:ArgoDB。由于如今数据平台复杂性急剧增加,数据存储多份、客户成本上升,实施、运维难度上升等,星环科技针对客户降低业务复杂性,避免冗余数据、节约硬件成本,降低实施、运维成本等需求打造了分布式闪存数据库产品:ArgoDB。

ArgoDB 拥有为高速硬件而生的存储格式,基于分布式一致性协议的存储引擎,专用的纯向量化计算引擎等诸多性能,简单灵活,更节省内存资源的火山模型,高效友好的索引都能提高数据使用的应用效率。无疑,硬件的发展将为软件提供更多可能。刘熙还从实施的角度与观众分享了银行、邮政业务等不同行业的大数据案例。

在演讲结束之后,星环科技研发总监刘汪根在一旁的会议室中与记者就大数据 3.0 的相关情况,回答了记者们的提问。

刘汪根先生分别为我们回顾了数据 1.0 时代到 3.0 时代的,星环科技的发展历程,让我们看到了星环科技在大数据 3.0 时代下所做出的努力。

他告诉记者,在 big data1.0 时代,很多企业不能很好地 hold 住这样的场景,开发与运维都有非常高的技术门槛,只有少量的高科技企业能够自建和使用。

以前是很多数据无法留存,现在因为大数据技术的进步,数据存储成本降低,企业可以将众多的数据进行留存。

广大的群体其实是需要大数据的能力,但是缺少入口和变现的能力。刘汪根认为,大数据的核心是引入了无限的、可扩展的计算能力,数据库的优势是良好的应用生态对接,我们如果把数据库的能力和大数据的能力结合起来,就会有非常好的再应用性,也可以大大降低开发难度。“这就是所谓的 2.0 的时代。”刘汪根解释说。

从 2015 年开始,结构化数据的处理问题已经基本解决,业界又开始把关注焦点转到了非结构化数据处理上面,特别是图像、视频、语音、文本的处理。同时,人们又试图用深度学习这样新的思路去解决过去 MapReduce 和 Spark 没有能很好解决的问题,这也意味着大数据技术开始进入 3.0 时代。

技术的进步使得整个的数据收集和梳理的工作变得容易,数据的处理变容易了以后,就需要做数据化运营,也就需要很多核心应用。这就形成了一个数据 + 应用 + 整个生态的融合。

Big data 3.0,刘汪根认为要解决的问题很简单:第一是积累高质量的数据;第二,做出创新的应用;第三,有一个平台,可以进行创新应用的分享。

刘汪根说:Big data 3.0 就要去解决这些问题,星环科技着重的研发有三点。

  • 第一,建立统一的数据的平台。将大数据技术和人工智能技术融汇起来,也可以依赖智能化的方式来梳理数据,并保证数据质量
  • 第二,在技术创新的过程中要去建立模型生态、应用生态。就像 APP store 一样,可以根据业务需求进行选择,并不断完善。
  • 第三,通过云化的 PaaS 层提供服务平台,用户无需关注底层细节,让服务随处可用。服务化的开放平台可以降低技术应用的门槛,让更多的开发者和业务人员进行创新。

这样整个的过程可以实现不管是产生数据、提供数据的人,还是利用数据作分析的人,以及开发模型的人,都能够找到期望的工作方式。

这个过程是一个完全民主的代化的体系,所有人在上面按照自己期望的方向去工作。大家可以产出,并进行共享,也可以引入比如内部数据的交换交易体系,或者像应用的定价体系。这样的话整个内部的生态就非常好地能够融入起来,这是我们认为未来三年比较大的趋势。统一的技术框架梳理以后,可以开发和利用大数据的群体可以拓展到几乎所有的人群,而不再是仅仅的公司内部技术比较高的人,或者对业务理解特别深的人才能做的这件事情。另外通过每层之间群体互相的数据和应用的分享,可以提高每个人的工作效率,最后形成这样一个服务生态。

结语

从大数据 1.0 到 3.0,这样一个原本让普通用户触不可及的技术就这样一步步走进人们的工作与生活。在降低技术门槛,推进技术民主化的进程中,星环科技一直在以它自己的方式默默地奉献着力量。在与星环科技的技术专家交流之后,我们似乎看到了 3.0 时代,星环科技将带来更多的可能性,我们将持续关注星环科技的未来动向,敬请期待。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-08-22 05:071466
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.5 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

架构师训练营第2周总结

Glowry

极客大学架构师训练营

极客大学架构师训练营 编程的本质与未来 第三课 听课总结

John(易筋)

极客时间 极客大学 架构师 极客大学架构师训练营 编程的未来

极客大学架构师训练营--编程的未来 面向对象 依赖倒置原则 -- 第二次作业

John(易筋)

极客时间 极客大学 架构师 极客大学架构师训练营 依赖倒置原则

小师妹学JVM之:深入理解JIT和编译优化-你看不懂系列

程序那些事

Java JVM JIT 签约计划第二季

区块链在农业领域能有什么用武之地?

CECBC

区块链技术 上链 农业链 三农

第 02 周 开发编程框架 命题作业

Jaye

设计原则之依赖倒置和接口隔离

极客大学架构师训练营 依赖倒置 设计原则 接口隔离

Week 02- 作业:设计原则

dean

极客大学架构师训练营

架构师训练营--第二周作业

_MISSYOURLOVE

极客大学架构师训练营 第二周作业

架构师训练营 - 第二周作业

Melo

Flink on Zeppelin (3) - Streaming篇

章剑锋_Jeff

大数据 flink 流计算 Zeppelin

架构师训练营-week2-作业

sljoai

作业 week

分布式唯一ID解析

Chank

架构师训练营第0期第二周作业

无名氏

依赖倒置原则 DIP 依赖反转原则

第 2 周 - 学习总结

大海

极客大学架构师训练营

架构师训练营-week2-作业

晓-Michelle

极客大学架构师训练营

软件设计原理

而立斋

专栏

使用接口隔离原则优化 Cache 类的设计

极客李

架构师训练营 - 第二周作业

zcj

极客大学架构师训练营

第 2 周 - 课后作业

大海

软件设计原则

jason

架构师训练营第二周 - 总结

无心水

极客时间 架构师 极客大学架构师训练营 23种设计模式 面向对象设计原则

训练营第二周作业

Mr冰凉

架构师训练营 Week 02 作业

Wancho

OOD设计原则之DIP

无心水

极客大学架构师训练营 面向对象设计原则 OOD SOLID

依赖倒置原则

Halley

训练营第二周总结

Mr冰凉

架构师训练营第二周作业 (3)

烟雨濛濛

架构师训练营 -week2-总结

sljoai

架构师训练营第二周学习总结

子豪sirius

架构师实现自己架构的主要手段

_MISSYOURLOVE

极客大学架构师训练营

星环科技研发总监刘汪根:大数据3.0时代的星环之路_大数据_陈思_InfoQ精选文章