50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

大数据 Hadoop 解决方案:2014 年第 1 季度形势

  • 2014-03-18
  • 本文字数:1470 字

    阅读完需:约 5 分钟

根据最新的 Forrest 报告,有很多公司都在努力挖掘他们拥有的大量数据,包括结构化、非结构化、半结构化以及二进制数据等,探索对数据的深入利用。下面是报告结论的其中一点:

大多数公司估计他们只分析了已有数据的 12%,剩余 88% 还没有被充分利用。大量的数据孤岛和分析能力的缺乏是造成这种局面的主要原因。另外一个难题是如何判断数据是否有价值。尤其是在大数据时代,你必须采集并存储这些数据。一些看起来与业务无关的数据,如手机 GPS 数据,将来也可能是座金矿。

所以,大量公司都寄希望于使用 Hadoop 解决如下难题:

  • 采集并存储与公司业务职能相关的所有数据。
  • 支撑先进的分析功能,包括商业智能,采用现代方式对数据进行先进的可视化和预测性分析。
  • 将数据快速分享给所需之人。整合多个数据孤岛帮助组织解答以前根本没人提过,甚至是未知的复杂问题。
  • 容纳持续增长的数据量和新数据源。Hadoop 支持解决方案规模的快速、有效扩大,使不断增长的容量、速度以及多样的数据尽在公司的把控之中。

根据报告的内容,Hadoop 的购买周期正处于上升阶段,因此在该领域催生了越来越多的厂商。尽管 Hadoop 是 Apache 的开源项目,任何人都可以免费下载,但大多数消费者还是倾向于采用厂商的打包方案。除了将所有的 Hadoop 组件打包并保证其能正常使用(兼容版本)之外,厂商一般还会提供企业级支持和扩展:以 Apache Hadoop(Common,HDFS,MapReduce )作为方案的核心组件,搭配额外实现增强 Hadoop 的功能,并增加差异化功能使其解决方案更具吸引力。

Forrester 的报告详细介绍了 9 家厂商:Amazon Web Services、Cloudera、Hortonworks、IBM、Intel、MapR 科技、Microsoft、Pivotal 软件和 Teradata,并根据以下指标对这些厂商进行了评测:

  • 现有产品,包括解决方案架构、数据和处理功能、安装、管理、监控工具、兼容性和社区成熟度等方面。
  • 战略,包括厂商在满足当前客户需求和弥补企业部署方面的计划。对战略的评测包括股权并购、内部战略的执行能力、产品路线图以及对客户的支持能力等。
  • 市场占有率,包括公司的财务,全球占有率,安装基数,与其他软件厂商、专业服务厂商以及软件即服务(Saas)/ 云 / 托管提供商之间的战略合作关系等。

报告的主要研究结果如下:

  • 厂商众多,但是并没有占主导地位的厂商。

在此次大数据 Hadoop 解决方案评测中,领导厂商有 Amazon Web Services、Cloudera、Hortonworks、IBM、MapR 科技、Pivotal 软件和 Teradata。这些厂商都是基于 Apache 开源项目,然后增加打包、支持、集成等特性以及自己的创新等内容以弥补 Hadoop 在企业中的短板。所有厂商都实现了这些功能,尽管方式略有不同——从各厂商的评测得分和厂商资料可见一斑。

  • 新晋厂商的解决方案也有不俗的表现。

在此次大数据 Hadoop 解决方案评测中,表现强劲的厂商有 Intel 和 Microsoft。Microsoft 为 HDInsight 产品制定了强劲的路线图,使其竞争力不亚于其他领导厂商。Microsoft HDInsight 为 Azure 进行了特殊优化,所以对于那些想要在 Azure 上实现 Hadoop 的 Microsoft 客户来说,它是最好的解决方案。而 Intel 将其创新能力聚焦于芯片级,如果它想将其产品打造成企业级解决方案,还需要加强其战略和企业工具。

根据该报告,虽然此次对大数据 Hadoop 解决方案市场的评测只是一个开始,但是对于那些努力摆脱复杂的 Hadoop 厂商局面的公司而言,该报告提供了很好的参考信息。


感谢孙镜涛对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-03-18 07:463298
用户头像

发布了 28 篇内容, 共 12.0 次阅读, 收获喜欢 0 次。

关注

评论

发布
暂无评论
发现更多内容

Spring如何选择类构造器

申屠鹏会

翻译 Go 语言

平均负载是什么?

我是程序员小贱

解析 HashMap 源码之基本操作 put

shengjk1

Java hashmap

解析 HashMap 源码概括

shengjk1

Java hashmap

阿里、力扣、政采云的15位专家分享前端面试与招聘视角

三钻

面试 大前端

真正的异步API网关Agate

dinstone

Async API Gateway

如何学习一个框架?

云起

学习技术先从学会使用搜索引擎开始

我是程序员小贱

1 学习性能优化的要点

我是程序员小贱

Docker搭建PHP+Nginx+MySQL+Redis

书旅

Docker 镜像 lnmp

Apache Mina和Netty的历史

dinstone

翻译: Effective Go (6)

申屠鹏会

翻译 Go 语言

让你起飞的20个Linux命令骚操作

我是程序员小贱

Rust特征与泛型区别点

编号94530

rust 泛型 封装、继承、多态

华为的“少年天才”攀登者,出发向智能存储的“奥林帕斯山”

脑极体

MEDO 项目开发中遇到的问题汇总

陈皮

MySQL 基准测试

多选参数

MySQL

你生日那天的宇宙什么样子知道?我全部给你吧!

我是程序员小贱

troubleshoot之:使用JFR分析性能问题

程序那些事

Java 性能分析 jfr

敏捷到底是个什么鬼?

刘华Kenneth

程序员 敏捷 change

毕玄大佬的分享以及给我的感悟

白色蜗牛

Java 程序员 技术 职场 架构师

航运区块链 抗疫危中有机

CECBC

区块链 航运

这样看mybatis,谁都会分析源码!

诸葛小猿

源码 mybatis mybatis源码

为什么考研,考研能给你带来什么?说说我的感受!

我是程序员小贱

1 时间复杂度总结

我是程序员小贱

解析 hashMap 源码之基本操作 get

shengjk1

Java hashmap

高效程序员的45个习惯:敏捷开发修炼之道(1)

石云升

读书笔记 敏捷开发

docker入个门

书旅

Docker 容器 Dockerfile

Elasticsearch学习

张明森

翻译: Effective Go (7)

申屠鹏会

翻译 Go 语言

如何隐藏你的数据库密码

Rayjun

安全 服务器

大数据Hadoop解决方案:2014年第1季度形势_DevOps & 平台工程_Boris Lublinsky_InfoQ精选文章