【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

大数据 Hadoop 解决方案:2014 年第 1 季度形势

  • 2014-03-18
  • 本文字数:1470 字

    阅读完需:约 5 分钟

根据最新的 Forrest 报告,有很多公司都在努力挖掘他们拥有的大量数据,包括结构化、非结构化、半结构化以及二进制数据等,探索对数据的深入利用。下面是报告结论的其中一点:

大多数公司估计他们只分析了已有数据的 12%,剩余 88% 还没有被充分利用。大量的数据孤岛和分析能力的缺乏是造成这种局面的主要原因。另外一个难题是如何判断数据是否有价值。尤其是在大数据时代,你必须采集并存储这些数据。一些看起来与业务无关的数据,如手机 GPS 数据,将来也可能是座金矿。

所以,大量公司都寄希望于使用 Hadoop 解决如下难题:

  • 采集并存储与公司业务职能相关的所有数据。
  • 支撑先进的分析功能,包括商业智能,采用现代方式对数据进行先进的可视化和预测性分析。
  • 将数据快速分享给所需之人。整合多个数据孤岛帮助组织解答以前根本没人提过,甚至是未知的复杂问题。
  • 容纳持续增长的数据量和新数据源。Hadoop 支持解决方案规模的快速、有效扩大,使不断增长的容量、速度以及多样的数据尽在公司的把控之中。

根据报告的内容,Hadoop 的购买周期正处于上升阶段,因此在该领域催生了越来越多的厂商。尽管 Hadoop 是 Apache 的开源项目,任何人都可以免费下载,但大多数消费者还是倾向于采用厂商的打包方案。除了将所有的 Hadoop 组件打包并保证其能正常使用(兼容版本)之外,厂商一般还会提供企业级支持和扩展:以 Apache Hadoop(Common,HDFS,MapReduce )作为方案的核心组件,搭配额外实现增强 Hadoop 的功能,并增加差异化功能使其解决方案更具吸引力。

Forrester 的报告详细介绍了 9 家厂商:Amazon Web Services、Cloudera、Hortonworks、IBM、Intel、MapR 科技、Microsoft、Pivotal 软件和 Teradata,并根据以下指标对这些厂商进行了评测:

  • 现有产品,包括解决方案架构、数据和处理功能、安装、管理、监控工具、兼容性和社区成熟度等方面。
  • 战略,包括厂商在满足当前客户需求和弥补企业部署方面的计划。对战略的评测包括股权并购、内部战略的执行能力、产品路线图以及对客户的支持能力等。
  • 市场占有率,包括公司的财务,全球占有率,安装基数,与其他软件厂商、专业服务厂商以及软件即服务(Saas)/ 云 / 托管提供商之间的战略合作关系等。

报告的主要研究结果如下:

  • 厂商众多,但是并没有占主导地位的厂商。

在此次大数据 Hadoop 解决方案评测中,领导厂商有 Amazon Web Services、Cloudera、Hortonworks、IBM、MapR 科技、Pivotal 软件和 Teradata。这些厂商都是基于 Apache 开源项目,然后增加打包、支持、集成等特性以及自己的创新等内容以弥补 Hadoop 在企业中的短板。所有厂商都实现了这些功能,尽管方式略有不同——从各厂商的评测得分和厂商资料可见一斑。

  • 新晋厂商的解决方案也有不俗的表现。

在此次大数据 Hadoop 解决方案评测中,表现强劲的厂商有 Intel 和 Microsoft。Microsoft 为 HDInsight 产品制定了强劲的路线图,使其竞争力不亚于其他领导厂商。Microsoft HDInsight 为 Azure 进行了特殊优化,所以对于那些想要在 Azure 上实现 Hadoop 的 Microsoft 客户来说,它是最好的解决方案。而 Intel 将其创新能力聚焦于芯片级,如果它想将其产品打造成企业级解决方案,还需要加强其战略和企业工具。

根据该报告,虽然此次对大数据 Hadoop 解决方案市场的评测只是一个开始,但是对于那些努力摆脱复杂的 Hadoop 厂商局面的公司而言,该报告提供了很好的参考信息。


感谢孙镜涛对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2014-03-18 07:462807
用户头像

发布了 28 篇内容, 共 94549 次阅读, 收获喜欢 0 次。

关注

评论

发布
暂无评论
发现更多内容

swap去中心化交易所系统开发技术分析

开发微hkkf5566

上游sql通过drainer同步到kafka时在kafka中是什么样子的

TiDB 社区干货传送门

实践案例 管理与运维 版本测评 大数据场景实践 实时数仓场景实践

pd-ctl 选项 --jq 格式化语法使用案例详解

TiDB 社区干货传送门

性能调优 实践案例 管理与运维 扩/缩容

TiFlash 表达式的实现与设计

TiDB 社区干货传送门

PCTP考试学习笔记之一:深入TIDB体系架构(下)

TiDB 社区干货传送门

TiDB 底层架构 管理与运维 TiDB 源码解读 TiKV 源码解读

深入理解Java虚拟机!京东大佬耗时半年肝出来的HotSpot VM源码剖析笔记真香(附完整源码)

Java全栈架构师

Java 源码 面试 程序人生 JVM

参加java培训和自学技术有什么区别

小谷哥

java学习过程中要注意哪些方面?

小谷哥

SENSORO 智慧城市平台中的延时队列设计

SENSORO

大数据 物联网 智慧城市 延时队列

融云移动办公协同平台,助力政企数智化转型升级

融云 RongCloud

企业 即时通讯

RT-Thread记录(十七、AT组件 — ESP8266使用 at_device 软件包联网)

矜辰所致

esp8266 RT-Thread 8月月更 AT组件

华为云算法零门槛:零基础教你AI试伊妆

程思扬

华为 API 华为云 开发者说

前端开发技术培训班靠谱吗

小谷哥

2022 全球 AI 模型周报

Zilliz

人工智能 深度学习 计算机视觉

SBOM落地的关键一步——漏洞可利用性交流(VEX)

SEAL安全

软件供应链安全 漏洞管理

C/CPP基础练习题(一)运算符,判断

CtrlX

c c++ C# 8月月更

RT-Thread记录(十六、SFUD组件 — SPI Flash的读写)

矜辰所致

RT-Thread 8月月更 SFUD SPI设备

阿里巴巴全新出品Spring全家桶笔记:(Spring+SpringBoot+SpringCloud)

Java永远的神

Java spring 程序员 面试 程序人生

历时10个月,1300+队伍参赛 第二届HarmonyOS开发者创新大赛奖项揭晓

Geek_2d6073

开放下载 | 飞天技术峰会-云原生加速应用构建分论坛资料开放下载

阿里巴巴云原生

阿里云 云原生

师文汇:OceanBase 4.0 产品核心能力解读

OceanBase 数据库

去中心化交易所swap系统开发功能以及逻辑分析

开发微hkkf5566

看完年薪30W~120W程序员分别需要掌握的技能栈,我彻底悟了!

程序员小毕

Java 程序员 程序人生 后端 架构师

多种姿势搞定Tidb集群监控大屏

TiDB 社区干货传送门

监控

TCP异常场景:三次握手四次挥手丢包情况解析

Java全栈架构师

程序员 面试 TCP 计算机网络 秋招

实战-记录一次大版本升级

TiDB 社区干货传送门

新版本/特性解读

Dijkstra(迪杰斯特拉算法)的实现(C,C++,Matlab)

Five

算法 图论 8月月更

数字藏品:为何深受年轻人喜爱,到底有何魔力?

开源直播系统源码

数字藏品 数字藏品开发 数字藏品系统

MySQL的redolog如何保证数据不丢?其中原理你真的知道吗?

Java全栈架构师

Java MySQL 数据库 程序员 程序人生

OceanBase 亮相2022全国CIO大会,荣获“2022年度CIO信赖品牌”

OceanBase 数据库

PCTP考试学习笔记之一:深入TIDB体系架构(上)

TiDB 社区干货传送门

管理与运维 TiDB 源码解读 TiKV 源码解读 TiKV 底层架构

大数据Hadoop解决方案:2014年第1季度形势_DevOps & 平台工程_Boris Lublinsky_InfoQ精选文章