收录了 大数据引擎 频道下的 50 篇内容
腾讯云发布云原生数据湖计算服务,协同腾讯云端数据湖体系,帮助企业高效构建云端数据湖架构、降低数据计算成本,提升数据分析敏捷性、激发数据应用价值,助力企业数字化决策。
阿里历经十年时间,打造了一个什么样的大数据平台?
在数字环境,每个科学的决策离不开数据的支撑。随着疫情的影响,线下商家对于开店投入更加谨慎,更需要大数据作为支撑提供科学的决策依据。
但大数据团队是成本中心还是价值中心?
每个组织的数据平台建设都应该要量体裁衣,且会是个长时间的持续 PDCA,螺旋上升的过程。
我们沿大数据发展时间线,从产品、行业、技术多角度讨论其发展脉络,究其发展承其脉络我们可以学习、借鉴、并最终推测未来大致走向。
值得一提的是,多点团队利用 JuiceFS 社区版实现了与 Ranger 组件进行权限的对接。
在最近举行的百度世界2014大会大数据论坛上,百度大数据部研发副总监高亮分享了百度在大数据存储、处理和产品化方面的最新成果。
过去一二十年,开源大数据技术从Hadoop “一枝独秀”发展到现在“百花齐放”。
本地大数据服务是否进入消失倒计时?云平台大数据服务最终到底会趋向多云、混合云还是单一公有云?集群规模增大,上云成本将难以承受是误区还是事实?
这一趋势已经引起了越来越多企业的开发者的注意。
可以秒级查询响应的秒算引擎是如何设计的呢?
腾讯万亿实时分析引擎 Hermes到底是怎么实现的?研发过程中遇到那些难点?作为开发者,我该怎么借鉴和避免;作为用户,又有哪些新的思考?
云粒智慧成立于 2018 年 6 月,它是一家科技公司,主要面向政府和中小规模的企业,提供智慧城市和生态环保方面的智能化应用。
近日, Linkedin宣布开源其正在使用的大数据计算引擎Cubert,该框架提供了一种新的数据模型来组织数据,并使用诸如MeshJoin和Cube算法等算法来对组织后的数据进行计算,从而减轻了系统负荷和节省了CPU资源,最终提供给用户一个简单、高效的查询。
本次分享介绍360大数据中心数据分析平台架构的演进、遇到的问题以及具体的应用场景实践。
本文是Apache Beam 实战指南系列文章第五篇内容,将对 Beam 框架中的 pipeline 管道进行剖析,并结合应用示例介绍如何设计和应用Beam管道。
距离上一轮融资才7个月时间,Databricks的估值已经增加了100亿美元。
Apache Calcite是面向Hadoop新的查询引擎,它提供了标准的SQL语言、多种查询优化和连接各种数据源的能力,除此之外,Calcite还提供了OLAP和流处理的查询引擎。正是有了这些诸多特性,Calcite项目在Hadoop中越来越引入注目,并被众多项目集成。
除了大数据领域赫赫有名的开源项目Spark,Databricks在2018年6月、2019年4月先后又开源了全流程机器学习平台MLflow和存储层Delta Lake,均在业内引起热烈反响。