10 月,开发者不可错过的开源大数据大会-2021 WeDataSphere 社区大会深圳站 了解详情
写点什么

Oracle 大数据机和连接器产品支持与 Hadoop 和 Cloudera Manager 集成

2012 年 3 月 02 日

Oracle 大数据机和大数据连接器软件支持与 Hadoop、Cloudera Manager 以及 Oracle NoSQL 数据库的集成。上月 Oracle宣布携手Cloudera 进军大数据机和连接器软件领域。

大数据机融合了Cloudera 公司的 Apache Hadoop (CDH)和 Cloudera Manager 管理应用,以及一个开源统计性编程语言 R 。它采用 Oracle Enterprise Linux 5.6 作为其操作系统,配备有 HotSpot Java 虚拟机。大数据机能够运行 Oracle NoSQL 数据库社区版和企业版。它同时能与 Oracle 的其他产品,如 Exadata、以及配备有 Oracle 大数据连接器软件的 Oracle 数据库进行集成,以此分析企业内部那些结构化数据和非结构化数据。

大数据连接器软件:

Oracle 的大数据连接器软件产品可利用 Oracle 数据库 11g 整合储存在 Hadoop 及 Oracle NoSQL 数据库中的数据。通过在 Hadoop 数据上直接使用 Oracle 的开源 R 语言可实现对数据的分析。大数据连接器软件包包含以下组件:

  • 针对 Hadoop 的 Oracle 加载器:这是一种 MapReduce 应用,用以优化从 Hadoop 下载到 Oracle 数据库中的数据。它可以用来在 Hadoop 中对数据进行筛选、分区以及转换成 Oracle 数据库的数据格式。它还可以以 Hadoop 集群中的一项 Hadoop 任务的形式来对数据进行预处理,然后再将转换过的数据加载入数据库中。该特性同样支持在线或离线选项,负载均衡及多种输入格式(如定界文本文件、 Hive 表以及自定义格式)。

  • 针对 Hadoop 分布式文件系统(HDFS)的 Oracle 直连器: 支持从 Oracle 数据库中直连在 HDFS 上的数据,并且通过在 Oracle 数据库中创建某外部表,用户能够从 HDFS 访问和导入数据。在 HDFS 中存储的数据可通过 SQL 进行查询,这些数据会与 Oracle 数据库中存储的数据相关联,或被加载至 Oracle 数据库中。HDFS 中的数据可以存在于界定文件中,或者是由 Oracle 加载器为 Hadoop 创建的 Oracle 数据 pump 文件中。

  • 针对 Hadoop 的 Oracle 数据集成(ODI)应用适配器:该适配器提供了与 ODI 的原始 Hadoop 集成。ODI 模块可用于在 ODI 内部构建 Hadoop 元数据、加载数据到 Hadoop、在 Hadoop 内部转换数据以及利用针对 Hadoop 的 Oracle 加载器直接将数据加载到 Oracle 数据库中。

  • 针对 Hadoop 的 Oracle R 连接器:该组件是一个 R 语言包,用来帮助访问 Hadoop 以及存储在 HDFS 中的数据。它可用于创建 R 模块来应对使用 MapReduce 处理的海量数据。

Cloudera Manager:

包含在大数据机捆绑包中的 Cloudera Manager 提供一个集群范围的、实时的运行节点及服务视图,它能够用来改变跨集群内的配置。它还包括了报告和诊断工具来观察集群的性能和利用率。

Oracle Advanced Analytics:

Oracle 近期还发布了一款新的针对大数据的产品 Oracle Advanced Analytics ,它将统计式编程语言 R 集成至 Oracle 数据库 11g 产品中。 Oracle Data Mining ,作为内嵌于 Oracle Advanced Analytics 的数据挖掘软件,能够帮助客户构建并部署预测分析应用从而获悉更多应用性能方面的信息。

查看英文原文: Oracle Big Data Appliance and Connectors Support Integration with Hadoop and Cloudera Manager

2012 年 3 月 02 日 01:561575
用户头像

发布了 52 篇内容, 共 14.8 次阅读, 收获喜欢 2 次。

关注

评论

发布
暂无评论
发现更多内容

管理笔记[3]:各得其所,各尽其才

俊毅

腾讯会议增长背后的技术实践

李忠良

28天写作

机器学习·笔记之:Gradient Descent For Linear Regression

Nydia

与前端训练营的日子 --Week14

SamGo

学习

作业二

KYoKO

一致性hash算法

MR.X

极客大学产品经理训练营 解决方案的设计与积累 第6课总结 John 易筋 ARTS 打卡 Week 37

John(易筋)

ARTS 打卡计划 极客大学产品经理训练营 解决方案的设计与积累

java import 导入包时,我们需要注意什么呢?

看山

Java import

创业失败启示录|舌尖辨茶

青城

28天写作 创业失败启示录

【初级】个人分享Vue前端开发教程笔记

魔王哪吒

程序员 面试 Vue 前端 2月春节不断更

第5周课后总结-技术选型一

潘涛

架构师训练营 4 期

算法训练营总结

Geek_ac4080

壁纸欣赏

小马哥

七日更

马克吐温关于拖延症的几个段子

Justin

心理学 工作效率 拖延症 28天写作

Elasticsearch Document 增删改内部原理

escray

七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

第10周作业&总结

胡益

终于用我的那个二手显卡搭建好了TF2的环境

IT蜗壳-Tango

七日更

为什么太过努力有时候也会造成问题

熊斌

学习方法 个人成长 28天写作

写一个玄幻的序章——梦想种植「幻想短篇 24/28」

道伟

28天写作

创业公司如何做技术品牌? | 视频号28天(25)

赵新龙

28天写作

产品经理训练营-第三周学习总结

月亮 😝

第5周课后练习-技术选型一

潘涛

架构师训练营 4 期

PMI 项目管理认证体系

Ian哥

28天写作

如何理解平行宇宙

陈东泽 EuryChen

科普 物理 平行宇宙 平行世界

进入最佳汇报状态的反思

JiangX

28天写作

第十周学习总结

Binary

【Animate.css】CSS动画库

学习委员

CSS css3 html/css 28天写作

工具词典: MIT

lidaobing

MIT 28天写作 Slidepad Roam Research

人员培养,不是捷径的捷径(上)

一笑

管理 人才培养 28天写作

python subprocess-更优雅的创建子进程

jeffery

Python

五种C语言非数值计算的常用经典排序算法

华为云开发者社区

算法 记录 C语言 排序 非数值计算

Oracle大数据机和连接器产品支持与Hadoop和Cloudera Manager集成-InfoQ