InfoQ Geekathon 大模型技术应用创新大赛 了解详情
写点什么

Splunk 会议回顾: 大数据的关键是机器学习

  • 2014-10-20
  • 本文字数:1271 字

    阅读完需:约 4 分钟

Splunk 的用户大会已经接近尾声。三天时间的会议里,共进行了 160 多个主题研讨,涵盖了从安全、运营到商业智能,甚至包括物联网,会议中一遍又一遍出现相同的中心主题:大数据的关键是机器学习。

存储不再是一个问题。从运行 Hadoop 兼容节点的专用存储硬件,到数百台使用普通硬盘的计算机组成的集群,毫无疑问,我们具备了处理这类存储问题的能力。另一方面,像 Splunk 这样的分析和可视化工具也应运而生。如果你知道你要找什么,这些工具可以很快给你所需要的答案。

但是,你应该找什么呢?对于绝大多数的基层供应商来说,问题的答案就在机器学习里面。无论你是在谈论网络流量、用户行为,或者是消费趋势,这都不要紧,你能真正洞察你所监控的东西的方式是找到数据中的模式和相关性。虽然人类操作员可以通过试错法蹒跚而行,但他们相信,可以通过训练计算机来得到结果,并且速度更快和不带偏见。

当然,这并不是说人类已经过时。必须有人来确认相关性不只是种巧合,并找出对信息采取行动的方法。而这也正是前面所提到的可视化工具可以发挥作用的地方。

大数据和机器学习的主要用例

虽然大数据的潜力几乎是无限的,但不可避免的是一或两个行业会在前面带头冲锋。如果再过一年问我,我可能会说不同的话,但现在的预测是,无论是安全还是运营,都会处在第一线。

只要比那些只收现金的咖啡亭大的公司,都需要考虑信息的安全性。即使他们没有知识产权可言,但他们都在处理一些敏感信息,如信用卡号码。有方法可以可靠地检测和阻止那些正在发生的违约行为,对公司的长期成功是至关重要的。基于机器学习的安全产品承诺提供这种能力,并且它的易用性接近“交钥匙工程(译者注:意为卖方把所有事情都做好了,买方只要拿钥匙验收就可以了)”的水准。

与此类似,运营分析将会流行起来。现在你就可以买到工具来监视你的网络,解码数据包,或向你精确呈现一个给定的 REST 调用是如何经过服务器的中间层一路到达数据库或文件系统的,然后把它和一周,一个月或一年以前的行为做对比。这不是未来的概念,而是今天现成的东西,并可以在一周内运行起来。

其它领域的研究将会继续下去,但不会有如此快的速度。欺诈检测是非常重要的,但大多数公司会依靠他们的金融机构来设计和实施必要的控制措施。我预计在这方面不会有太多商业化的、现成的产品。

商业智能是另一个会看到大量金钱投入的研究领域。但可口可乐与百事可乐公司用来确定下一个流行口味的算法,看起来一点也不像通用和福特公司用来预测每种尺寸的车型会有多少量的算法。如此类推,商业化产品对大数据的运用目前可能会主要局限于基本的分析和可视化方面。

其他的会议思考

总而言之,Splunk 举办了一次非常好的会议。一切都组织得很好,每个人,从初学者到最高级的数据挖掘工程师,都会有相关的议题研讨。我唯一的抱怨是,议题研讨没有记录。因为有这么多的内容,人们势必会因为冲突错过一两个重要的议题。

即使你对 Splunk 本身不感兴趣,但对大数据、机器学习以及相关主题感兴趣的任何人来说,这都是一次重要的会议。

查看英文原文: Splunk Conference Recap: The Key to Big Data is Machine Learning

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2014-10-20 13:102455

评论

发布
暂无评论
发现更多内容

云服务的可服务性经典6问

华为云开发者联盟

服务 计算

大众汽车“芯片荒”,折射汽车芯片的漫漫“自主替代”路

脑极体

volatile,synchronized可见性,有序性,原子性代码证明(基础硬核)

叫练

volatile 多线程 synchronized 原子性 指令

距离 Java 开发者玩转 Serverless,到底还有多远?

阿里巴巴云原生

Java Serverless 微服务 云原生 中间件

阿里架构师478页Java工程师面试知识解析笔记pdf,一份2021年通往阿里的面试指南

Java架构之路

Java 程序员 架构 面试 编程语言

量化交易系统开发搭建案例

薇電13242772558

区块链 策略模式

英特尔宋继强:迈向可持续的千倍速计算未来

E科讯

Reactive Spring实战 -- 理解Reactor的设计与实现

binecy

reactor Reactive SpringBoot 2

PostgreSQL:您可能需要增加MAX_LOCKS_PER_TRANSACTION

PostgreSQLChina

数据库 postgresql 开源

TypeScript | 第二章:类、接口和之间的关系

梁龙先森

typescript 大前端 七日更

由于不知线程池的bug,某Java程序员叕被祭天

Java架构师迁哥

大连市税务局局长赵福增:用区块链打破部门间“信息孤岛”

CECBC

区块链 汽车

神比喻:低代码开发像自动驾驶汽车,零代码开发像无人驾驶汽车!

J2PaaS低代码平台

程序员 软件 开发者 低代码 开发工具

编程之美!从线程池状态管理来看二进制操作之美

Geek Tech

Java 源码分析 线程池

LeetCode题解:55. 跳跃游戏,贪心,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

“区块链+社会治理”模式获居民点赞

CECBC

区块链 区块链投票

比特币10年:从2个披萨涨到2万美金,背后的三个“神秘人”

CECBC

比特币

Service Mesh最火项目Istio是怎么做流量管理的?

AI乔治

Java 架构 istio

2020年书单

井中人

OPPO小布助手正在改变普罗米修斯的世界

脑极体

阿里开发10年,全部心血汇聚成到这份文档里,拿到30W的offer没问题

Java架构之路

Java 程序员 架构 面试 编程语言

2020,谁是中国ToB行业最有影响力的企业?

ToB行业头条

MSHA x Chaos 容灾高可用实践

阿里巴巴云原生

数据库 高可用 云原生 中间件 容灾

世界之书:《麦田里的守望者》与在虚无中创造希望

lidaobing

麦田里的守望者 28天写作

GitHub上3天1W赞的程序员学习路线!入门进阶都非常实用

Java架构之路

Java 程序员 架构 面试 编程语言

学透这份300页的2020最新java面试题及答案,一线大厂offer随便拿

Java架构之路

Java 程序员 架构 面试 编程语言

脑洞:如何用一个整数来表示一个列表?

Python猫

Python

谁告诉你观察者就是发布订阅模式的!抽他!

爱笑的架构师

设计模式 23种设计模式 观察者模式 Java设计模式 七日更

【Java入门】流

Albert

Java 七日更

2020 微信头像圣诞帽来啦,快给 TA 戴帽子吧~

mghio

圣诞帽 微信头像 圣诞节

测开之函数进阶· 第2篇《纯函数》

清菡软件测试

测试开发

  • 扫码添加小助手
    领取最新资料包
Splunk 会议回顾: 大数据的关键是机器学习_DevOps & 平台工程_Jonathan Allen_InfoQ精选文章