写点什么

刘金明:微信、QQ 都在用的腾讯云 EB 级对象存储架构剖析

  • 2019-10-29
  • 本文字数:2495 字

    阅读完需:约 8 分钟

刘金明:微信、QQ都在用的腾讯云EB级对象存储架构剖析

5 月 23-24 日,以“焕启”为主题的腾讯“云+未来”峰会在广州召开,广东省各级政府机构领导、海内外业内学术专家、行业大咖及技术大牛等在现场共议云计算与数字化产业创新发展。


腾讯云存储业务中心副总监-刘金明,在云+未来峰会上做了主题为《腾讯云 EB 级对象存储架构深度剖析及实践》的分享,以下内容整理自当天演讲。



关于对象存储,我们先从腾讯存储平台 TFS 开始说起,早在 2016 年腾讯推出了自研的云存储平台 TFS,几年间为相册、QQ、微信、微云、腾讯视频等腾讯内部产品提供了优质的存储服务。


2013 年,腾讯云把存储能力包装之后开始对外开放。


2014 年,腾讯存储突破 500PB,数据量达到万亿级别。


2015 年,引擎升级商用标准化,数据量达到 EB 级别。


2016 年,对存储引擎和架构优化之后,性能得到了更好的提升,同时基于存储之上的智能数据分析也应运而生。



COS 的产品生态可以分为三层:


最底层为 COS 存储层,提供了多种语言的 SDK 开发包和完全兼容 S3 的 API 供客户使用。

中间的应用接入层为 COS 提供一些高级扩展能力和解决方案,比如图片鉴黄、视频转码等数据处理和识别服务,以及智能安防、大数据、医疗影像等行业解决方案。

最上层为 CDN 加速层,视频、手机应用商店等大流量客户可以选择通过 CDN 加速上传和下载。



目前 COS 已经在亚洲、欧洲、美洲等全球 13 个园区开放,在世界杯来临之际,俄罗斯园区也即将开放。



COS 是典型的三层架构:


最上层的网络接入层提供多级 BGP 接入,通过腾讯接入网关 TGW 可以实现智能的负载均衡,同时接入层可以对一些攻击流量进行清洗。

应用接入层无状态管理,集群横向无限扩展。

数据层跨机架跨交换机部署,索引和数据模块 SET 化扩展,冷热数据智能调度。对存储产品来说想让客户放心的将自己的核心数据上云,大家比较关心的问题是什么?



无外乎以上的 5 点,服务足够稳定,数据不能丢失足够可靠,数据足够安全,性能足够好,并且价格最低。


总而言之就是物美价廉。



除了通过常规的单点故障自动剔除、防过载、失败有限重试外,一旦遇到突发事件时,COS 增加了业务突发自动隔离、频控、流控等手段避免雪崩效应,保障系统有效输出,可用性达到 99.95%。


同时对于一些可预见的突发,比如春节期间的微信祝福视频,电商大促的活动等等,可以通过提前评估扩容、热点数据自动分发到大流量平台等技术方案保障业务高可用,当平台资源达到瓶颈时也可以采用将拓展功能屏蔽只保留核心功能的方法进行柔性服务,或者按用户感知度如视频降码率等方法降级服务。



通过多副本、纠删码,故障快速发现并重建,以及从磁盘到机房多维度进行容灾,使得数据的可靠性达到 11 个 9。



在安全性方面,COS 打造了从传输、访问、存储全链路安全加密存储。


在最近与腾讯影业的合作探讨中,有两部科幻探索方向的电影作品,一部是陆川导演执导的《两万里计划》,一部是改编自腾讯动漫同名 IP 的《拓星者》。约 2 个小时的电影,前期需要进行数百 T 的图片、视频、音频的素材拍摄,再经过全球多个后期特效优秀团队数月的跨国合作,最终我们才能在大荧幕观赏到这两部作品。


其中,跨国合作涉及的数据传输尤其复杂,过往的合作通常需要专人携带硬盘出差到各国,拷贝数据给当地团队。不仅费时(往往多耗时一个月)、费力、更费心,硬盘丢失、内容泄露等情况屡屡发生。


而通过和 COS 的合作,可以帮助腾讯影业的影视项目实现快速安全的数据存储与传输。



性能方面,对视频、图片、安装包等不同大小、不同类型的文件采用不同的优化策略。


以上传为例,对于大文件可以采用分块并发上传,小文件通过架构、引擎以及协议栈层面的优化使得访问路径更短,延时更低,同时客户可以选择通过 CDN 就近接入加速上传。


而对于不同的文件类型,比如图片客户可以选择 Guetzli 或者 WebP 等格式,在保证图片视觉质量,不改变分辨率的前提下,生成的图片更小,性能和成本双赢。



成本方面,除了前面提到的图片、视频等可以采用压缩转码等技术实现成本优化外,COS 本身提供了标准、低频、归档三级存储产品,客户可以按自身的业务特点,选择自己的存储级别,同时可以通过生命周期在不同级别之间灵活的调度数据,在极限情况下,客户的成本可以降低 80%。


在硬件层面,在存储密度和机房功耗方面也在不断的优化。


我们所做的一切优化最终都会通过降价把这个红利让给用户,西南区(成都、重庆)降价 24%,达到全球最低价。



除了上文提到的几个基本功能以外,腾讯云 COS 也在陆续推出一些高级功能。


生命周期:客户只需在 COS 控制台配置一个规则就可以很方便的让数据在各级存储之间流动和删除。


跨区域复制:既可以通过异地容灾进一步提升可靠性外还可以达到加速的目的,比如之前提到的和腾讯影业的合作可以通过跨区域复制更快的将在海外拍摄的素材同步到国内给后期制作团队使用。


多版本:一方面作为跨区域复制的必选项,保证数据的有序可靠,另外还可以在客户误删除的情况下恢复数据。


标签:可以帮助客户对数据进行分类和处理,现在很多识别场景都需要打标签,比如直播,会有人物、风景、游戏等各种标签,可以通过 COS 的标签服务更好的分类和推荐。另外也可以通过标签对视频的各种码率进行标记,和生命周期一起将标记为原始视频的定期沉降,标记为低码率的视频定期删除。


清单:可以快速的列表,加速大数据分析或对账,客户只需配置一个规则,清单就会定时将列表投递到客户的 bucket。



在做好平台的同时,COS 也推出了一系列的解决方案。


比如智能安防解决方案可以很好的支撑那些对监控视频有进一步挖掘的客户。网络摄像头的所有视频流上传至 COS,云端闭环推流解码、人脸检测、人脸比对并实时输出对比结果。


原始视频文件在 COS 通过生命周期智能调度,需要远程调取摄像头数据时,只需从 COS 下载相关视频即可。



在大数据方面,客户可以通过 HDFS to COS 的迁移工具很方便的将本地 HDFS 的数据迁移到 COS 上,配合腾讯云大数据套件可以对 COS 中的数据进行实时和离线分析。另外可以利用前文说到的清单和生命周期提升性能并降低成本。


未来腾讯云 COS 会推出更多应用类的解决方案给广大客户。


本文转载自公众号云加社区(ID:QcloudCommunity)。


原文链接:


https://mp.weixin.qq.com/s/z1uEiZxElxosr02_19GNIg


2019-10-29 10:361595

评论

发布
暂无评论
发现更多内容

TiDB x Flink x Iceberg 实时 ODS 实践

TiDB 社区干货传送门

软件测试/测试开发丨利用ChatGPT自动生成测试用例思维导图

测试人

软件测试 自动化测试 测试开发 测试用例 ChatGPT

BSN-DDC基础网络详解(十):官方DDC应用SDK

BSN研习社

长春市做等保评测的公司有几家?名单有哪些?

行云管家

等保 等保测评 长春

你不想成长,生活总会逼着你成长,阿里P8架构师分享十年学习生涯

程序知音

Java redis spring java架构 后端技术

从不均匀性角度浅析AB实验 | 京东云技术团队

京东科技开发者

A/B 测试 AB实验 企业号 4 月 PK 榜 不均匀 实验准确度

Confidential Containers发布0.5.0版本,龙蜥将基于八大特性构建开箱即用的机密容器解决方案

OpenAnolis小助手

开源 云原生 龙蜥社区 机密计算 机密容器

任务编排:CompletableFuture从入门到精通

做梦都在改BUG

Java CompletableFuture

干货好文 | 两地三中心到异地双活演变及关键技术探讨

沃趣科技

MySQL 数据库 opengauss

如何优雅的使用策略模式

做梦都在改BUG

eBPF的发展演进---从石器时代到成为神(五)

统信软件

操作系统 Linux Kenel

全球首个开发者村启动开村,产业聚力松山湖,共创大湾区创新高地

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

springboot升级过程中踩坑定位分析记录 | 京东云技术团队

京东科技开发者

spring Spring Boot release 企业号 4 月 PK 榜

浅谈复杂业务系统的架构设计 | 京东云技术团队

京东科技开发者

架构 DDD 架构设计 企业号 4 月 PK 榜 复杂系统

GitHub下载已过百万!阿里这份Java虚拟机源码剖析手册真的绝了

做梦都在改BUG

Java JVM 虚拟机

GitHub经典教材!阿里P8的这份SpringBoot精髓到底厉害在哪里?

做梦都在改BUG

Java spring 微服务 Spring Boot 框架

Matlab实现神经网络

袁袁袁袁满

三周年连更

中移链控制台对接4A平台功能验证介绍

BSN研习社

ShareSDK 新浪微博平台注册指南

MobTech袤博科技

2023年免费的堡垒机就用行云管家!安全感满满!

行云管家

网络安全 等保 小微企业

节前超级干货福利放送!这可能是最实用的 Conan 管理依赖贴

Zilliz

非结构化数据 Milvus Zilliz 向量数据库 依赖管理

新浪张俊林:大语言模型的涌现能力——现象与解释

NLP资深玩家

软件测试/测试开发丨面试题之软素质与反问面试官篇(附答案)

测试人

软件测试 自动化测试 测试开发 测试用例 ChatGPT

Matlab实现PCA算法

Shine

三周年连更

政务智能办体验升级、乳腺癌创新药加速研发,飞桨和文心大模型驱动应用智能涌现

飞桨PaddlePaddle

百度飞桨

TiSpark v3.0.3 & v3.1.3 发布

TiDB 社区干货传送门

新版本/特性解读

深度学习模型可视化-keras版

AIWeker

Python 深度学习 可视化 keras 三周年连更

5月7日【飞天Club × 云原生技术实践营—飞天免费计划实践专场】开启报名

阿里巴巴云原生

阿里云 云原生 飞天Club

刘金明:微信、QQ都在用的腾讯云EB级对象存储架构剖析_文化 & 方法_云加社区_InfoQ精选文章