【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

IBM 2013 技术峰会访谈:大数据不仅仅是未来业务

  • 2013-07-19
  • 本文字数:2780 字

    阅读完需:约 9 分钟

IBM 于 7 月 11 日 -12 日在北京举行了 IBM 2013 技术峰会,会上 IBM 的技术专家解析了其 MobileFirst (移动先行)、大数据、DevOps 等技术趋势与现状,在 11 日下午的媒体采访中,IBM 杰出工程师及 InfoSphere Streams 高级开发经理 James R Giles、IBM 杰出工程师、副总裁兼 Guardium 首席技术官 Ron Ben Natan、IBM 软件集团大中华区信息管理软件 DSCO 销售总监甘佳凌等针对大数据方面的提问进行了详细的回复。

InfoQ:NoSQL 更多用在互联网行业,传统行业用 NoSQL 数据库应用到关键系统并不太多,那么 IBM 在大数据平台当中添加 NoSQL 的功能是为了添加这个功能而添加,还是我们客户真的有这样的需求?

Ron Ben Natan:传统的应用程序不需要 NoSQL,但是 NoSQL 是跟其他的传统应用相比有好的地方。比如你是一家电子商务的公司,有很多供应商要交换很多数据。如果使用 NoSQL,数据的来源就是文档,那么就可以直接使用它,能够灵活方便的处理前端操作的改变。

InfoQ:你们认为大数据对于企业到底帮助会有哪些?有什么本质性的帮助?目前在大家提出大数据的时候,这背后本质上反映了企业目前是出于什么状态,可能意味着像企业往哪方面发展或者趋势是什么?

James R Giles:我能看到很多点,特别提两点:

  1. 大数据是不仅仅是数据,还是一种渠道。这给我们带来很多的商业上的机会和价值,能够使用户能够更好更快的、更深入的了解我们的客户,这是很重要的方向,也是大数据应用的方向!
  2. 关联到 Ron Ben Natan 提到的另外一点,其实有很多技术都有自己的长处和短处,在大数据时代,有这么多不同的种类、如此大量级的数据时,通过技术的组合可以帮我们带来很多更高效率上的问题。

Ron Ben Natan:给大家两个答案,一个是现实的,一个是理论上的。理论上假如说我们有无穷无尽的计算力和存储空间,我们可以把现实当中所有的事情都计入里面,这能给我们带来什么?我们对很多事情都进行精准的预测,这些会帮助我们。现实当中我们不可能有无穷无尽的计算力和存储力,我们现在有什么?可以在商业化的模式下有商业化的计算力和商业化的存储和商业化一切的情景下它帮助我们预测和做一些判断。

InfoQ:今天的开场演讲嘉宾讲到大数据时代跟小数据时代的对比,小数据时代大家都在追求干净、高质量的数据,大数据时代大家对于数据的精确性要求并不是很高,大家注重是趋势上的一些洞察,我想问一下两位专家怎么在大数据时代,大数据的语境下的精确性如何来理解,是不是一些比较粗放的或者只是一些趋势上的洞察就可以?

James R Giles:是的,精确度确实在大数据来说是很重要的,在大数据时代,我们会有很多的案例,像早上举的例子,大数据是非常散乱的数据,我们需要利用大数据的分析功能去处理这种散乱的数据。其实我们也知道大数据当中有 4V,最后一个 V 是准确性,也有相当多的场合对于精确性是非常重要的,我们必须要有这样的技术能够提高它的精确性,同时会有很多的案例,这些数据是需要可信的、准确的。

Ron Ben Natan:这个问题很难一句话说清楚。我们首先不知道这个数据本身是不是有这样的变化,即便几点数据的加合,或者为这些数据来打分,最后得出这些数据,这些都是不清楚的。但是可以肯定的是扔进去的是垃圾,出来的也是垃圾。

InfoQ:刚才 Ron 回答关于无线计算和无线数据的情况,我从里面得到一个结论:大数据是个未来业务,现在在中国和美国依然还没有太大的市场。所以在整个重要的四个方向里,Mobile、社交网络、大数据、云计算,从重量方面来说是放在最后一位,您怎么看?现在在技术角度肯定是并重的,但是在市场角度肯定是放在次之的位置。

Ron Ben Natan:移动、云计算、大数据在技术领域是非常重要的三个大的变革,并不是说一个比另外一个更重要,他们都在同时发生,但是它们是在解决或者是在针对不同的事情,比如说移动,实际上是针对于我们的消费者。比如我家里有太太和三个孩子还有我自己,我们一共有 18 个手机,一会儿手机找不着,一会儿手机又找到了,但是这么多设备在随时随地产生信号和数据。又比如说在互联的网络后台有很多的数据,这样的数据就是我们说的大数据的一种,这只是其中一部分,当我们谈到互联网的时候,移动只是互联网当中的一部分,一个子集,会有更多的包括机器、设备联系在一起,这会产生大量的数据,所以实际上后台是需要一个大数据的平台去支撑。

再举一个例子,现在的飞机上会有 12 万的传感器,随时随地在产生数据,我们是需要大数据处理能力的。而云非常简单易用,能够降低部署、开发和应用的成本。所以这三件事情并没有说孰重孰轻,都非常重要,在里面扮演不同的角色。

甘佳凌:我是代表市场行销,我的观察是大数据是一个现在的业务!当然大家也在找一个比较好的模式。基本上我们前面谈了很多都是相关技术,从 IBM 的角度来说,我们也希望可以协助我们的客户在现在多数据源、非结构化数据中获得价值。以前都是传统的数据,现在有这么多的数据源,每一个客户都在谈大数据,但是我跟客户说到底你们想做什么,很多客户都回答不出来。

但是我知道客户在想什么,客户在想怎么利用不同的数据来源和非结构化的来源找到可以让企业获利的模式。前面也有提到 IBM 所提供的大数据平台也可以协助客户去找到在这么多海量的数据或者非结构化的数据,去预测出来所要锁定的这一群客户。

假设有一个客户跟我提的是想要知道这么多的银行的业务,把目前免费让客户上网来查询一些交易记录或者是在银行的一些户头里面的状况,在未来变成是生意的模式?如果查询是要付费的,可能会是通过付费的机制根据你跟银行的交易的等级来设定一些会员的机制,对不同的等级来收费,这可能会变成一种盈利的模式。

在现在这个时代,大家都在谈所谓的大数据,大数据代表了海量、非结构化数据的来源,还要关心怎么去利用海量的大数据来源,挖掘出来可以提供给客户的服务和盈利的模式。您可能会问我们国内有没有客户在做?我的回答是有的。大家在谈大数据的时候,有不同的客户需求。针对于我们跟 Hadoop 平台区分的话,从整个数据的生命周期来看,这些数据源是怎么产生的?我们会从它的生成时就来管理,同时可以先定义哪些数据是可用的,哪些数据是可以从中找到所需要的一些智能,哪些数据是属于敏感的数据需要保护的,是不可以泄露的。从这些数据里找出可能有的盈利模式出来。

James R Giles:运营分析方面,比如说我们在能源和电力行业的客户丹麦的 Vestas 公司利用风力发电的设备和服务,对于他们而言选择风力发电的选址是非常重要的,因为这些设备都非常昂贵,一个设备可能购买都是一百万美金,他们有一个非常好的计算方法。现在是跑在我们 BigInsights 产品上,通过 BigInsights 高性能计算可以帮助客户降低成本,而且能快速的计算出在哪里投放这样的风力发电的设备是最好最优的。联动优势是我们本地的客户,他们实际上是在用移动银行,使用我们 PureData for Analytics 能够很好的提高他们的计算性。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2013-07-19 11:011514
用户头像

发布了 89 篇内容, 共 31.1 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

Serverless: 2020年函数计算的冷启动怎么样了

刘宇

Kafka零数据丢失的配置方案

奈学教育

kafka kafka配置 kafka数据

spring注入bean的几种策略模式

王德发

Java Spring Boot 测试驱动开发实战营

Android | Tangram动态页面之路(一)需求背景

哈利迪

android

何时开始重构?

Page

敏捷开发 重构

2020 敏捷产品基本盘

Yanel 说敏捷产品

产品 敏捷 产品设计 产品推荐

真的!只需 “六步” 实现图像特定物体识别!!!

周果

Python OpenCV 计算机视觉 图像识别 物体检测

Intellij IDEA2020.x如何安装Lombok插件

龙眼果

开发者工具

敏捷团队成员的工作量指标真的那么重要吗?

金生水起

敏捷开发 Scrum精髓 敏捷精髓 Agile

MySQL索引知识介绍

Simon

MySQL 索引结构

KK日知录20200515

kimmking

揭秘!开源软件背后的神秘组织

Apache Flink

大数据 flink 流计算 实时计算

多多益善的MacOS文件管理方案

陈东泽 EuryChen

macos Mac apple 提升效率 文件管理

为什么我喜欢的大V拉黑我?

lmymirror

经历 后真相时代 日常思考

数据分析的利器-clickhouse概述

流沙

数据库 Clickhouse

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (七)CORRECT边界条件

编程道与术

Java 编程 软件测试 TDD 单元测试

用"结构性张力"构建自驱力

Yanel 说敏捷产品

团队管理 敏捷 团队协作 项目

MySQL备份基础

一个有志气的DB

MySQL 数据

Java实现Base64

Java

近期工作的几点感想

Leiy

app退出登录

常见的主从报错集锦

一个有志气的DB

MySQL 主从配置 主从同步

【Howe学爬虫】全国统计用区划代码爬取

Howe

Java 爬虫

从ClickHouse的名字由来讲起

nauu

数据库 大数据 分布式 OLAP Clickhouse

提升编程效率:重构

Page

高效工作 敏捷开发 重构 高效

工程师、程序员和产品经理

王泰

程序员 产品经理 IT 软件工程师 工程师思维

BVR 才是变革的核心

Yanel 说敏捷产品

团队管理 项目管理 敏捷 敏捷开发 敏捷精髓

看完这篇操作系统,和面试官扯皮就没问题了

cxuan

操作系统 计算机基础

搜商:高效的使用搜索引擎

石云升

高效搜索 搜索技巧 搜商

太赞了,VSCode 上也能画流程图了!

GitHubDaily

visual-studio GitHub 程序员 vscode 开发者工具

【大咖说问大咖】关于开源的那些事 —— PingCAP CTO 黄东旭 Q&A 交流帖

InfoQ写作社区官方

开源 写作平台 大咖说 技术交流 热门活动

学习型组织的修炼之道

Yanel 说敏捷产品

团队管理 项目管理 敏捷 团队协作 组织转型

IBM 2013技术峰会访谈:大数据不仅仅是未来业务_IBM_水羽哲_InfoQ精选文章