写点什么

腾讯 TECHO 开发者大会召开 首次揭秘腾讯基础架构演进历程

  • 2019-11-11
  • 本文字数:2049 字

    阅读完需:约 7 分钟

腾讯TECHO开发者大会召开 首次揭秘腾讯基础架构演进历程

11 月 6 日,腾讯 Techo 开发者大会在北京召开。会上,腾讯云副总裁、云架构平台部总经理谢明首次对外披露了腾讯基础设施演进与创新历程。他介绍,在微信、QQ 等国民级业务不断发展的背后,包括服务器、网络、IDC、计算、存储、数据库等在内的基础设施和技术架构一直在不断进化,目前已经进入“生而为云”的新阶段。


腾讯今年在基础设施建设方面迎来了重要里程碑。其中,腾讯全网服务器总量超过 100 万台,是中国首家服务器总量超过百万的公司,也是全球五家服务器数量过百万的公司之一。腾讯网络带宽峰值也突破 100T,是中国第一家达到 100T 的公司。


谢明表示,在云时代,腾讯基础架构还将继续通过自研、定制化等手段,向极致弹性和智能化的方向进化。


基础架构升级演进,实现降本增效

随着腾讯业务发展,服务器、网络、IDC、计算、存储、数据库等基础架构也在不断演化。


在服务器方面,腾讯走过了早年使用通用服务器到定制服务器,再到目前推出自研服务器的路径。谢明介绍,出于对服务器性能、成本、安全性等方面更高的需求,腾讯云启动了自研服务器的进程。腾讯自研服务器星星海采用可信链传递的硬件防篡改能力、先进的热虹吸管散热技术以及精细化的风道设计和风扇控制,实现了 TCO 降低 30%、负载能效提升 50%、实例综合性能提升 35%。


腾讯数据中心则在高速化、规模化、集约化、智能化方面不断取得突破。谢明提到,腾讯云第四代数据中心 T-Block 按照搭积木的方式,实现了全数据中心的模块化配置及快速建设,相比于传统大规模数据中心,现场施工周期缩短一半,自然冷却技术可以将 PUE 降低至业界领先的 1.2 以下。采用 T-Block 方案,一个拥有 30 万台服务器的园区一年可节省 2.5 亿度电。


随着全球化业务的快速发展,腾讯也在网络层面不断精进。目前,腾讯已经与全球超过 800 家运营商建立了网络互连。同时,腾讯还基于 SDN 和 NFV 自研分布式路由器集群替换传统商业大型路由器,实现全网所有的软件路由器的集中管控,能做到根据目的 IP 做单个用户的流量调度;通过构建开放光网络,基于 SONiC 自研交换机等,将网络设备 TCO 下降 20%+。


针对云上用户计算资源获取需求,腾讯云云计算操作系统 VStation 目前做到了每分钟交付千台虚拟机的能力,使得一个中等规模公司的计算需求可以快速得到满足。同时,腾讯通过 DPDK、智能网卡等软硬件方案,将网络、存储等 IO 消耗卸载到硬件上,实现了虚拟机零损耗和虚拟机之间的零干扰。


在存储方面,腾讯早在 2006 年便针对 Q-zone 相册业务场景自研了分布式存储 TFS,支持了 Qzone 相册每天亿级别的图片上传。目前,腾讯云对象存储 COS 实现了集群全体节点参与系统吞吐,磁盘利用率达到 90%以上,同时系统的完全自治也大幅降低了运维的人工投入。


数据库的演进也与腾讯业务发展节奏一脉相承。从最早的 MySQL 开始,经历 QQ、Q-zone 等业务爆发增长的腾讯逐渐选择了数据库自研路线。目前,腾讯云也通过开源托管、商业合作、自主研发三管齐下,提供了接近 20 种数据库产品,让用户从选云、上云、用云全流程畅通无阻,获取最佳体验。

追求极致弹性,智能化实现技术普惠

随着云计算的快速发展,云计算用户对对资源管理粒度、资源调度和隔离能力以及计算/存储解耦的技术架构都提出了更高的要求。谢明将这种更高的要求称之为“极致弹性”。


谢明认为,极致弹性首先是性能和容量要既能帮助大客户扛住业务洪峰,又能让小客户不浪费一分钱,需要对计算、存储、网络资源进行细粒度的划分。其次,需要通过提升库存管理和调度能力以及相应的产品能力,真正做到按使用量计费。最后是快速的交付能力,需要计算、存储等各类资源能够充分解耦,满足秒升秒降、快上快下的要求。


腾讯云的基础产品也在朝极致的弹性方向努力。其中,腾讯云打造的第三代通用计算平台无服务函数计算能够提供更好的弹性能力,真正意义上做到资源使用率 100%,用户相应成本下降 50%以上。值得一提的是,腾讯云通过函数并发监控数据实时计算,提前扩容,使函数冷启动率降低到万分之一以内。而自研的轻量级虚拟化技术,能在 35ms 内启动一台虚拟机,创造了业界目前能最快启动一台虚拟机的记录,这一技术还被稳定应用于“小程序·云开发”。


同时,腾讯云对象存储 COS 还提供了不同地域不同计费的方式,用户根据使用场景,按需选择最划算的方案。数据库产品 CynosDB 则基于计算存储解耦架构,支持超大实例并实现更好的弹性能力。单实例最多可以达到百 TB 级别,而多计算节点间的存储共享,可以使同一实例的计算节点扩展到 15 个。


谢明还认为,未来云计算会结合智能化来提供更好的服务,包括智能运营和智能服务,将更好的提升服务质量和降低服务成本、为更多的用户提供 VIP 级别的云服务。以数据库为例,腾讯云基于强化学习的数据库性能优化系统 CDBTune,提供在线的性能优化服务,甚至比专职 DBA 做得还好。


“今天,用云、上云已经成为大势所趋,更有越来越多的产品直接诞生于云中,成长于云中。”谢明表示,腾讯希望将经过腾讯海量业务充分验证的基础架构能力,通过腾讯云开放给广大开发者,助力产业互联网更好发展。


2019-11-11 21:39758

评论

发布
暂无评论
发现更多内容
腾讯TECHO开发者大会召开 首次揭秘腾讯基础架构演进历程_云计算_云加社区_InfoQ精选文章