写点什么

谷歌发布可在 Hadoop 中运行原生代码的 C 语言版本 MapReduce 开源框架

2015 年 2 月 28 日

谷歌上周宣布发布C 语言版本的MapReduce 开源框架 MR4C ,利用该框架开发者可以在 Hadoop 框架中运行原生代码。

MR4C 框架将原生开发算法的性能和灵活性与 Hadoop 执行框架的可扩展性和生产力相结合。该项目的目标是抽象化 MapReduce 框架的细节,让用户将精力集中在开发定制化算法之上。

该框架最初由 Skybox 团队开发,用于卫星图像处理和地理空间数据科学的用例。该团队希望既能利用用 C 和 C++ 语言开发的图像处理库又能利用适于可扩展数据处理的 Hadoop 框架的作业跟踪和集群管理能力。

在 MR4C 中,算法存储在原生共享对象中,这些对象通过本地文件或统一资源标识符(URI)访问数据。输入 / 输出数据集、运行时参数和外部函数库都通过 JavaScript 对象表示法(JSON)文件进行配置。映射器分裂和资源分配可以用基于 Apache YARN (适用于 Hadoop v2)的工具配置或在集群层级配置(适用于 MapReduce v1(MRv1))。多个算法的工作流可以通过自动生成的配置连接在一起。该框架还支持用 Hadoop JobTracker 接口浏览日志回调和过程报告。而且还可以用与目标 Hadoop 集群所用的相同接口在本地机器上对工作流进行测试。关于这个框架更多详细信息,可以从 MR4C GitHub网站上检出该框架的相关文档和源码。如果有兴趣参与到项目中,MR4C 团队已经创建了一个网页来帮助项目贡献者。

查看英文原文: Google Open Sources MapReduce Framework for C to Run Native Code in Hadoop

2015 年 2 月 28 日 08:422139
用户头像

发布了 75 篇内容, 共 58.0 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

万字多图 | UML 入门指南

白色蜗牛

Java 程序员 架构设计 UML 后端编程

用AI「驯服」人类幼崽,手头有娃的可以试试

博文视点Broadview

人工智能 联邦学习 强化学习 集成学习 技术宅

区块链十年与传统金融的变化

CECBC区块链专委会

区块链 金融

不同公司产品经理岗位对比

LouisN

在数据分析、挖掘方面,有哪些ETL工具值得推荐?

会飞的鱼

大数据处理 kettle 海豚调度 批量任务 ETL

公安指挥中心大屏可视化系统开发,情报研判分析平台建设

WX13823153201

一文带你探究Sentinel的独特初始化

华为云开发者社区

redis sentinel 框架

初识ClickHouse——安装与入门

Simon

Clickhouse

iOS性能优化 — 五、App启动优化

iOSer

ios 性能优化 性能分析

『CDN』让你的网站访问起来更加柔顺丝滑

古时的风筝

CDN

我在极客时间录课的故事(一):从源码管理聊到一体化学习环境

李艺

我在极客时间录课的故事

当音乐学博士搞起编程...

程序猿DD

Spring Frame

即构小程序直播组件集成教程

ZEGO即构

为什么我认为 Deno 是一个迈向错误方向的 JavaScript 运行时?

hylerrix

typescript rust nodejs deno V8

「产品经理训练营」第一章作业

Sòrγy_じò ぴé

产品经理训练营

一文解析DDD中台和微服务设计

欧创新

中台 微服务 领域驱动设计 DDD 微服务划分

Volcano架构设计与原理介绍

华为云原生团队

大数据 AI 云原生 高性能 批量计算

物流快递公司APP架构设计

jorden wang

敏捷里为何倡导固定迭代周期?

万事ONES

敏捷开发 研发管理 迭代

DevSecOps安全检查清单

啸天

安全 DevSecOps 应用安全

矿机挖矿APP系统模式开发平台

v16629866266

架构师训练营第十三周作业

李日盛

PageRank

来不及解释!Linux常用命令大全,先收藏再说

华为云开发者社区

Linux 编程 命令行 命令

“反垄断”来袭,对产业区块链有什么启发

CECBC区块链专委会

市场垄断

区块链科普系列:区块链是什么?

CECBC区块链专委会

区块链

面试官:你真的了解Redis分布式锁吗?

鄙人薛某

redis 分布式锁 线程安全 RedLock

自动量化搬砖套利交易机器人系统软件APP开发

开發I852946OIIO

系统开发

生产者与消费者模式,数组阻塞队列(ArrayBlockingQueue)

码农架构

Java 学习 并发编程 架构、

架构师训练营W13作业

Geek_f06ede

4大应用场景,16张高阶布局大屏,最具价值的数据可视化都在这里!

一只数据鲸鱼

物联网 数据可视化 智慧大屏可视化 3D可视化

特斯拉自建ERP的背后

明道云

InfoQ 极客传媒开发者生态共创计划线上发布会

InfoQ 极客传媒开发者生态共创计划线上发布会

谷歌发布可在Hadoop中运行原生代码的C语言版本MapReduce开源框架-InfoQ