NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

金山云存储研发总监分享存储服务的产品化经验

  • 2013-12-10
  • 本文字数:1618 字

    阅读完需:约 5 分钟

InfoQ 编辑最近跟金山云存储研发总监朱桦进行了一次交流,了解其团队情况、业务情况、以及产品化方面的一些思考。朱桦在 2013 年 5 月加入金山云,此前在搜狐做过研发。在搜狐微博数据中心基础设施部门时,是最早接触 HBase、Hadoop、Hive 并将其引入搜狐的工程师之一。目前,朱桦在金山云主要负责云存储的研发和产品化探索,技术层面主要关注文件系统和 KV 存储。

团队与业务状态

金山云存储团队在 2013 年下半年从 10+ 人增长到现在的 40+,人员主要来自大型互联网公司,这为传统软件模式的金山引入了大量互联网基因。

据称金山云存储今年(2013 年)的业务增长量超过了之前两年的总和,明年预计会达到更高的增长量。仅快盘在全国就有上亿级用户,背后包括千万级的小米用户;整体数据量已经达到百 PB 级,预备容量达到 EB 级。

产品路线

朱桦认为在当前的公有云领域,跟着业内老大 AWS 的路线走是必然的选择。云存储产品在起步阶段按照 AWS S3 的路线走,随着用户量增大,将会针对更多的细分需求推出细分的服务。朱桦列出了一些可以细分的点:

  • 冷热数据
  • 冗余策略
  • 可用性
  • 存储加密
  • 信道加密
  • 文件类型和大小

朱桦认为,公有云服务走细分道路是必须的,良好的技术体系能够更便捷的支持不同的细分道路:

把行业做细,就是把蛋糕做大。蛋糕怎么切完全取决于需求,技术上要更加便捷的支持这种不同的需求。良好的技术体系足够 open,可以按照不同的需求直接提供接口出去;不好的技术体系不够 open,面对不同的需求只好硬生生在上面打个洞,时间长了就无法维护。

走细分道路最直接的好处之一就是节省成本:

现在有客户想要冗余级别达到 6 份的服务,但不愿意支付比正常的 3 份冗余更高的价格。如果你按照他的要价卖给他,你就要亏本;如果你不卖,你就赚不到钱。但是,如果我们能够把 6 份的成本压低到原本 3 份的程度,甚至更低,我们就能赚钱。

金山云存储目前已经启动了类 AWS Glacier 服务的研发,即冷数据、非高可用的低成本存储服务解决方案。该方案适合存放 log 等可以异步进行分析处理的数据。

此外,金山云存储的路线图也参考了 S3 路线图中的 EMR,即 MapReduce 服务,朱桦表示可能会在未来推出相关产品线以满足数据分析的需求。

研发的挑战

根据朱桦的介绍,金山云设置了专门做新技术研究测试的科研部门,定期会发布研究报告分享给内部,覆盖硬件和软件。但是,具体将新技术应用到产品的过程是非常慎重的。

互联网工程师要 open,但不能盲目追新。云存储是一头奔跑中的大象,体量很大,技术体系的调整是一个巨大的挑战。实际上业界一般会认为 10 倍的规模必然会带来技术体系结构的变化,我们应该清楚认识到技术体系的变动是一个必然会发生的事件。因此必须保持对新技术的探索精神,但也应该慎重的将之产品化。当然这中间有一个度的问题,技术领域中平衡也是所有攻城狮每天要头痛的地方。目前得益于我们在软件体系上的灵活与强大,可以在硬件上采用相对激进更高性价比的技术来保证我们在成本上的优势。

相对于技术理论,朱桦认为将技术产品化的过程要更加重要:

现在云计算领域的这些理论都已经很成熟了,比如网络相关的重量级论文有些是上世纪 70 年代的,Google 的三驾马车是 2000 年代初的,到现在仍然管用。重点在于将理论产品化,让用户用得起、会用。业务推动技术研发,技术再推动业务发展,这个循环基于双方互相信任。作为技术,如果要让业务信任你,你必须要给他制造惊喜,要给你的用户 surprise。

相对于美国的 Amazon、Google 等理论和产品都很先进的巨头,朱桦认为中国本土的云计算公司还是有优势的,因为中国的网络环境非常复杂,而做存储最大的成本就在于网络。金山云对于自己在带宽成本控制方面有很大的自信,这主要来自两方面的解决思路:

  1. 就近调度,就近存储,这需要强大的调度机制。快盘商业版支持局域网文件共享,走 P2P 协议
  2. 碰撞重复数据,建立异步的快速流动机制

相关报道:金山云总裁谈为什么要做云主机、为什么只有大公司能做公有云、以及为什么创业者不应该再盲目涌入游戏行业了

2013-12-10 02:221627

评论

发布
暂无评论
发现更多内容

【源码篇】Handler那些事(万字图文)

小呆呆666

Java android 源码 Android Studio Android进阶

高性能计算与人工智能何处去?英特尔剑指XPU

E科讯

为你的身份证“加盾”,鉴伪更精准,传输更安全

百度大脑

人工智能 数据安全 身份证

解放生产力,自动化生成Vue组件文档

vivo互联网技术

Vue 自动化 大前端 组件

前端 JavaScript 中 JSON.stringify() 的基本用法

编程三昧

JavaScript 大前端

JavaScript中的Set数据操作:交集、差集、交集、对称差集

devpoint

set JavaScrip 6月日更

Flutter GetX使用---简洁的魅力!

小呆呆666

flutter android 大前端 iOS Developer

5分钟速读之Rust权威指南(三十二)互斥体

wzx

rust

秋招冲刺:网络安全工程师入围成功之旅!!

网络安全学海

面试 运维 网络安全 信息安全 渗透

密码合规测评新服务:“微咨询”正式发布

腾讯安全云鼎实验室

密码合规 微咨询

科技前沿:一张图数字孪生北京大兴国际机

一只数据鲸鱼

数据可视化 智慧城市 指挥交通 智慧航空

百度AICA迎来毕业季,55位新晋“首席AI架构师”推进产业智能化

百度大脑

人工智能 百度 架构师

DNS劫持该如何处理

网络安全学海

程序员 运维 网络安全 信息安全 DNS

【视频】51CTO专访博睿数据COO吴静涛,解读IT运维“新范式”

博睿数据

国足晋级12强!看人工智能如何更好地预测世界级赛事!

亚马逊云科技 (Amazon Web Services)

【源码篇】ThreadLocal的奇思妙想(万字图文)

小呆呆666

Java 源码 架构 源码分析 设计

eKuiper 与百度智能边缘框架 BIE 集成方案

EMQ映云科技

边缘计算 边缘技术 边缘流式数据 #百度# 智能IoT边缘服务

为什么要学习JVM,仅为面试?又该如何学习?

Java架构师迁哥

为什么很多时候,我们会感觉企业越大,效率越低呢?

石云升

职场经验 管理经验 6月日更

【案例】消除隐患,基于电力大数据的群租房智能分析

星环科技

您的出门“最后三公里”问题解决啦!

亚马逊云科技 (Amazon Web Services)

一种更优雅的Flutter Dialog解决方案

小呆呆666

flutter android 大前端 iOS Developer

Flutter 改善套娃地狱问题(仿喜马拉雅PC页面举例)

小呆呆666

flutter android 大前端 iOS Developer

新常态下的CMDB系统规划与落地

云智慧AIOps社区

CMDB 智能运维

北鲲云超算平台如何加速生命科学研究

北鲲云

Dubbo 3.0.0 来了!还学得动吗?

青年IT男

dubbo

《原则》(二十九)

Changing Lin

千古无同局?围棋在线教育还有这样的打开方式!

亚马逊云科技 (Amazon Web Services)

一妹子揭露美团面试中一些不愉快的事情(Java岗)

Java架构师迁哥

混合推荐系统介绍(二十二)

数据与智能

推荐系统 计算

如何优雅的设计DWS层?

云祁

大数据 数据仓库 维度建模

金山云存储研发总监分享存储服务的产品化经验_服务革新_sai_InfoQ精选文章