收录了 数据分析 频道下的 50 篇内容
本文主要分享数据分析平台的平台演进以及我们在上面沉淀的一些数据分析方法是如何应用的。
【云上探索实验室】专为开发者设计,旨在创造最前沿技术的一站式实操体验。版本的云上探索实验室全面升级!
数势科技的SwiftAgent通过引入指标语义层和大模型能力,实现数据分析的民主化,帮助非技术用户跨越数据门槛,提升数据分析效率和价值,推动企业数字化转型。
Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励以后。本文介绍了达观数据分析平台架构和Hadoop/Hive实践。
GPT-4 真的可以取代数据分析师吗?
本文探讨了使用运行在 Mesos 上的 Storm 和 Spark Streaming 处理实时和流数据的可选方案。也讲解了如何使用运行在 Mesos 上的 Cassandra 实现更多探索性数据分析。
移动互联网时代,吃喝玩乐、办公支付等等各种应用都在抢占移动APP市场,在流量为王的今天,移动APP虽然竞争激烈前景一片大好,但也有让开发者和运营人员十分头疼的事情,那就是缺乏贯穿完整移动生命周期测试的解决方案和运营策略指导。如何快速处理移动应用的碎片化测试、利用大数据分析指导移动运营策略是长盛不衰的话题。
马蜂窝大数据平台自 2017 年下半年引入 Apache Kylin 以来,极大的提升了数据分析师对于数据探索的效率。因为使用了 Apache Kylin,数据分析师可以直接查询大数据、无需排队、亚秒级响应,整体开发效率提高了 10 倍以上。
随着企业安全边界的扩大化模糊化、各类威胁新出速度越来越快、影响越来越广,视企业安全边界为静态、仍然依赖各种特征码技术的传统安全思路早已落后,无法实际解决安全问题。必须通过各种创新,整合大数据、人工智能、可视化等领域的最新技术进展,安全产品才能解决目前和将来的企业安全难题。 但如何选择并整合各种技术是复杂系统工程,比常规企业安全软件开发需要考虑更多因素。本次分享中对大数据、人工智能、可视化的最新进展和应用案例做个总结,重点讨论大数据平台云部署运维、交互批处理与实时流处理的关系、有监督学习解决的安全问题和大数据可视化这四个细分领域。
本文以智慧城市为背景,介绍西安中服软件有限公司是如何利用大数据分析神兽 Apache Kylin,让物联网的传感器信息,通过云化的大数据物联网云平台,对感知的数据进行分析处理,进而满足智慧城市的建设需求。
众所周知,大数据生态很复杂,对于个人来说,要全部学会可能要花费好几年时间。而对于企业来说,要最大程度发挥其价值,构建一个成熟稳定、功能多样的大数据平台,期间花费的时间以及人力成本着实难以估量,更何况还需要考虑持续维护的问题。这就是七牛的Pandora大数据平台灵感的来源,我们构建一个大数据平台,作为产品提供给用户,快速帮助用户挖掘数据价值。
马上又有新概念要被炒作了!
如何基于 Flink 搭建大规模准实时数据分析平台?
营销的基本原理是一致的,每个人都喜欢洞察力,因为这些数字模式可以提供最安全的方法来确保企业采取正确的行动,更有效地运作,以及将其资源用在何处。
本文将借用《Processing a Trillion Cells per Mouse Click》的实验数据,结合笔者的上一篇Hadoop文件格式的内容介绍更多大数据分析中列数据库的核心原理, 希望读者能对列数据库的原理有更多了解,也希望对将来Hadoop在针对数据分析方面能够有更多优化, 并对一些忽悠的厂商和空喊口号的技术有辨别能力。
数据分析师薪酬五连问。
在2014年早些时候,Simple还是一家创业中期的公司,只有一名数据分析师,在回答与用户行为或业务性能相关的问题时还必须查询产品数据库。那时,公司里的每个人都想做出明智的决定,从工程师到产品战略到业务开发到客户关系都是如此,为此Simple构建了一个数据仓库和一个支持它的团队。
几千台的 Hadoop 集群,近百 P 级的存储总量,每日产生万亿的消息数据入库,需要针对几十亿 imei 手机设备去重,海量大数据背后,腾讯如何升级分析架构?
数据分析领域新的名词和新的方向是非常多的,客户比较困惑,看得眼花缭乱,怎么办?
Hadoop还有大的发展吗?