抖音技术能力大揭密!钜惠大礼、深度体验,尽在火山引擎增长沙龙,就等你来! 立即报名>> 了解详情
写点什么

Google 可拓展性会议报告

2007 年 6 月 26 日

在一篇 blog 文章中,微软的 Dare Obasanjo 为大家分享了 Google 在 Seattle 召开的有关可拓展性(Scalability)的会议笔记,笔记的内容由 Google 员工 Jeff Dean 的发言整理而来,内容包括“MapReduce,BigTable,以及其他处理大规模数据集的分布式系统抽象方式”。根据 Dare 的笔记,讨论内容涉及 Google 目前三种主要的大规模可拓展架构: GFS (Google File System),提供大规模数据集并行处理能力的软件基础设施 MapReduce ,以及为结构数据提供分布式存储的 BigTable

报告包含 Google 软件基础设施许多引人入胜的特性。关于 GFS:

目前 Google 拥有超过 200 个的 GFS 集群,其中有些集群的计算机数量超过 5000 台。Google 现在拥有数以万计的连接池从 GFS 集群中获取数据,集群的数据存储规模可以达到 5 个 PB,并且集群中的数据读写吞吐量可达到每秒 40G。

MapReduce 方面:

开发者只需要为数据集编写特定的 Map/Reduce 操作,有时甚至只需 25-50 行代码就够了,而 MapReduce 软件微架构会处理并行任务并且向分布在各处的计算机分发任务,同时处理机器错误和数据中的错误条件并进行优化操作,例如把计算过程推移到靠近数据的一方执行来减少 I/O 带来的带宽消耗,还提供了系统监控并且通过数以千计的计算机保持服务的可拓展性。

关于 BigTable:

BigTable 不是一个关系型的数据库。它不支持关联或是类似于 SQL 的高级查询。取而代之的是多级映射的数据结构。这是一种面向大规模处理、容错性强 的自我管理系统,拥有 TB 级的内存和 PB 级的存储能力,每秒可以处理数百万的读写操作。目前,BigTable 正在为 Google 六十多种产品和项目提供 存储和结构化数据获取的支撑平台。

对于那些想自己尝试 Map/Reduce 操作的人来说,Apache Lucene 的子项目 Hadoop 提供了 MapReduce 的实现方式,以及类似于 GFS 的分布式文件系统 HDFS,Hadoop 项目对于你来说将可能会是个不错的开始。

查看英文原文: Google Scalability Session Report

2007 年 6 月 26 日 21:00455
用户头像

发布了 74 篇内容, 共 97346 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

【涂鸦物联网足迹】涂鸦云平台接口列表—万能红外遥控器

IoT云工坊

人工智能 云计算 物联网 API 红外遥控器

从应用开发角度认识K8S

LorraineLiu

云原生 容器技术 k8s入门

年末十家手机银行数字化升级大盘点:谁家开发更全面?谁家建设更到位?

CECBC区块链专委会

疫情 银行 手机银行

要求自愿降薪,员工内心普遍满意:“服从”是如何发生的?

脑极体

《我想进大厂》之Java基础夺命连环16问

艾小仙

Java 面试 编程语言 面试技巧

面试官问我redis数据类型,我回答了8种

云流

数据库 学习 java面试

Java批量导入去除重复数据并返回结果,我差点就被放倒了

小Q

Java 学习 程序员 架构

【概念篇】你真正了解越来越火的“数据驱动” 吗?

Java架构师迁哥

MySQL 的 join 功能弱爆了?

程序员历小冰

MySQL postgres 多表join

我终于拥有自己的独立博客了。

彭宏豪95

GitHub 写作 博客 IT

奈学教育荣获“中关村高新技术企业”认证

奈学教育

奈学教育

腾讯云直播全解析,双11怎么买才不亏?

腾讯云音视频

腾讯云 阿里云 云直播 直播 视频

11.11 程序员的 1111 种死法

京东科技开发者

程序员 程序人生

科技助力餐饮,普渡送餐机器人在餐博会上被众人围观!

DT极客

浅谈程序员的“内卷化”

数据社

腾讯WeMap,一颗“孢子”的数智化之旅

脑极体

奈学教育荣获“中关村高新技术企业”认证

古月木易

教育 IT

iptables 端口转发

田振宇

SpringBoot启动原理

云流

编程门槛 框架设计 spring Boot Starter】

架构训练营-week8-数据结构与算法,网络,IO

于成龙

极客大学架构师训练营 架构训练营

LeetCode题解:剑指 Offer 22. 链表中倒数第k个节点,使用栈,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

CloudQuery v1.2.1 版本发布

CloudQuery社区

数据库 开发者 运维 工具 开发工具

当Nginx遇上Tomcat集群,又是一场负载均衡的爱恨情仇

小Q

nginx tomcat 学习 架构 面试

重拳出击!平台经济反垄断,互联网巨头市值蒸发千亿

CECBC区块链专委会

小额贷款 反垄断

当Tomcat遇上Netty,我这一系列神操作,同事看了拍手叫绝

小Q

Java 学习 程序员 架构 面试

「架构师训练营」第 4 周作业

小黄鱼

极客大学架构师训练营

对比一下,你的简历是不是也写成了这样,能拿高薪才怪了

小Q

Java 学习 架构 面试 简历

践行新基建,共建城市智能体,为数字经济发展提供新动能

CECBC区块链专委会

云计算 大数据

第七周作业

Geek_4c1353

极客大学架构师训练营

阿里首发MySQL“完美日记”,基础+优化+事务+集群+锁+主从复制+安全备份

Java架构追梦

Java MySQL 数据库 架构 面试

搞微服务用阿里开源的 Nacos 真香啊!

云流

阿里巴巴 编程 开源项目

Study Go: From Zero to Hero

Study Go: From Zero to Hero

Google可拓展性会议报告-InfoQ