【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

喜马拉雅 CTO 陆栋栋:从技术“土话”开始,解析 7 年技术管理实践

  • 2019-06-27
  • 本文字数:6365 字

    阅读完需:约 21 分钟

喜马拉雅 CTO 陆栋栋:从技术“土话”开始,解析 7 年技术管理实践

近日,在极客邦科技旗下品牌 TGO 鲲鹏会举办的 GTLC 全球技术领导力峰会上海站上,我们邀请到喜马拉雅 CTO 陆栋栋带来「喜马拉雅技术团队管理实战」主题演讲,陆栋栋在演讲中分享了喜马拉雅的成长历程以及成长过程中经历的成功与挫败,从中得到的关于组织管理实践的思考。以下为陆栋栋现场分享内容:

喜马拉雅成长历程

在做喜马拉雅前,我总共经历过三次产品的失败。刚开始做喜马拉雅 FM 时,我们的产品愿景是“随时随地,听我想听”,当时团队只有 40 人左右。



2013-2015 年间,数据和业务快速发展,团队得到了成就感的驱动,成就感来自于创始团队的初心,我们想做一款可以让亿万人使用的产品,并能够帮助到他们的生活。


2016-2017 年,我们开始探索商业模式,同时形成了业务线,业务线是围绕着商业目标做闭环。商业目标往往是短期的,所以为防止动作的变形,我们提出了以用户为中心经营管理原则。


2018 年,在验证商业模式后,我们开始思考未来往哪个方向走。因此,我们重新看使命和愿景,梳理了未来五年的发展战略,开始深度做运营模式,提升用户的服务质量。


2019 年,我们按照 2018 年梳理的战略,围绕音频生态,开始做业务的创新和变革。在做业务创新和变革的过程中,我们发现缺少业务 Leader,并且业务 Leader 在市场上也很难找,因此我们想建一套培养体系,自己培养人才。于是,我们做了喜马拉雅 BOSS 营。


目前,喜马拉雅共有 2000 多名员工,组织形成了网络协同。我们从价值观开始,把意识深入到每个人的脑子里,减少沟通和协作的成本。


文化是解决组织发展瓶颈的手段,是战略落地的手段。



我们再从战略、文化、人才、组织四条线看一下发展过程。


战略方面,最早的时候是很简单的产品原型。2013-2015 年,我们首先做了验证业务模式,接着,在业务模式得到认可后,我们开始验证它的商业模式;之后,商业模式得到认可,我们再深度做运营模式,想未来的战略;最后,才是做生态价值和创新变革。


文化方面,我们最早是讲究机会和初心,慢慢地变成了创始团队的初心,得到的是团队的成就感。之后,我们梳理了经营管理的原则、使命、愿景。最后,形成了客户导向、提升内聚力价值观。


人才方面,最早时,我们是单个突破,招了很多性价比很高的人才。因为是创业公司,所以很多人才都来自于传统行业。业务快速发展时,我们引进了批量的专业人才来解决专业问题;到了突破管理瓶颈时,我们会引进职业经理人解决管理实践的问题。最终,我们形成了自己培养人才的体系。


组织方面,我们刚开始时是个人分工,程序员大都是全栈工程师出身;之后,我们开始进行细化分工,再到前台业务线的形成,业务线逐渐形成了事业部,再把事业部进行聚合,成立前中台,最后形成网络协同。



2012 年,我们是最简单的分层架构;2013 年,随着用户量的增加,当时处于创业初期,为了节省成本,我们开始了机制性能优化之路,同时也提高了团队技术理论和实践水平;2015 年,我们开始冷静下来,想技术的竞争力在哪里,之后我们组建了 AI 大数据、算法等团队;2016 年,用户开始大规模增长,着手把按业务垂直的架构变成分布式架构,这时候我们引入 BAT 的专业人才解决专业的问题;2017 年,前台业务线琳琅满目,每个人都开始做自己移动端的组件,于是我们开始梳理移动端的架构;2018 年,我们开始深度做运营模式,很多团队都在重复造轮子,于是我们提出了中台概念;2019 年,我们形成了网络协同,在网络协同里,信息化是很重要的催化剂,于是我们把信息化提高到战略的角度。

喜马拉雅技术管理实践

接下来,我将介绍在喜马拉雅的技术管理实践和故事。



2014 年,我们开始做服务治理,2018 年把业务服务升级成了中台。现在基本每个公司都在做中台,不能为做中台而做中台,需要想清楚中台服务的目标是什么呢?


我们做中台目标是为了孵化更多的新产品,除了把产品技术放在中台外,我们还把内容和生态运营也放在了中台,以便于快速地孵化新产品。


业务快速发展往往需要强大的研发运维支撑体系,最早创业时,我们都是星期四晚上上线。从周一规划上线,到周四才能规划完毕,周四是一周能上线的最后一天,周六周日放假,周五是不能上线的。周四上线时,我们首先开上线会议,给用户发公告,然后 2-6 点开始上线,往往到了 6 点钟还有些边缘的服务没有能够正常上线和服务,这就意味着,我们周五、周六还要改代码。记得有一次,我们做了三天两夜都没有睡觉,人的精神状态和体力状态都达到了极致。



2015 年,我们提出不再通宵上线的口号。我们第一步就是做数据的迁移平台、一站式发布平台、自动化灰度发布,开发 Momoda 自动化接口测试的系统。


2016 年,我们做到了所有开发功能发布,但发布时,在用户使用 APP 过程中,APP 会突然卡一下,隐秘地弹了一个小窗口说服务出错了。这时我们发现,完全去中心化以后,缺少很好的流程和规范,于是便再次梳理发布的流程和规范。


2017 年,随着前台事业部的增加,客户端组建越来越多,我们做了组件化发布平台,把 APP 拆成了各种各样的组件,导致我们打包的速度越来越慢,有时打渠道包需要几十个小时。于是,我们重新梳理打包性能,把打包性能压缩到分钟级别。


2018 年,很多前台业务线之间的团队都是技术 Leader 来管理项目。但是这让我们发现,技术 Leader 往往过度专注于自己模块,协调的地方会出现 waitting。导致版本的发布出现了很多的延期,因此我们引入了项目经理的角色。


在项目经理引入后,他们专注于项目节点把控和客户端 Leader 定发版的时间。项目经理还有一个重要的职能是关注人效,上线以后,整个产品质量的把控,从最早的接口自动化测试,到服务端的智能播音、预警机制、客户端 APM 性能管理、产品质量实时分析。



2016 年时性能方面经常会出现瓶颈,开始往分布式迁移,另外发布过度频繁,定了事故规则,营造共担责任,对线上敬畏心的技术文化。喜马拉雅技术有“冰淇凌文化”,如果你今天发现哪位同学请大家吃冰淇凌就知道是出现了事故,还可以根据冰淇淋的大小和价格判断事故的级别大小。图中的这次事故把我和同学们一起做了通报批评。


这让所有的技术管理人不仅仅重视眼前 KPI,还会关注未来性能的扩展和架构的稳定性。文化就是借事修人,借事情把文化传承给更多的人。



文化除了仪式外还有哪些内容?


上图左边是喜马拉雅形成的“土话”,这个“土话”来源于很多公司的日常。比如线上无小事,配置查三遍,很多时候,当我们在 TEST,UAT 都测试完后,往往再出问题就是开发人员出现了配置问题。于是,我们就把故事总结出来形成土话,告诉所有的开发人员应该怎么做。


除了形成的“土话”外,从最外层的行为表现到形成规则、形成意识都是文化,我们对文化的愿景是最深层的潜意识,所有的潜意识都会指导我们形成规则和动作。最后,我们把动作总结成文化和意识。


文化包含很多东西,如绩效指标、激励考核、人才选择、流程规范等,这些全部属于文化的范畴。



要建立技术氛围,最好的方式就是做分享。一开始,喜马拉雅做分享都是我来指定人分享,慢慢地我发现所有分享的都是老面孔,过了半年发现没人讲,那我们该如何把分享的氛围建立起来?


1、把分享作为 KPI 定下去,每个 Leader 根据团队的不同大小、团队的业务属性来定。比如,研究型的团队分享次数应该增加,所有的分享都有质量的考核。


2、把分享和布道放在了人才选拔标准里,让每个人知道你的分享是可以获得成长的。


3、把分享内容好的人员作为团队的优秀骨干和标兵进行宣传,给大家传播文化的导向是什么。


分享是帮助我们培养人才的,那么我们该如何形成自己的一套培养人才的体系呢?


除了“培”之外,更重要的是“训”,培养人才不是上几个课分享,更重要的是在实战中训练人才。



喜马拉雅有技术管理平台,技术管理平台是在解决技术管理的实际问题,通过解决实际问题才能帮助他们获得更多的成长。


比如高潜制,每个月技术委员会都会和高潜制的人才交流,交流后会给他们布置相应的任务,最后检查他们任务完成情况。



2017 年,我们做了很大组织架构的变化,这引起了很多技术 Leader 的顾虑。我们让所有的技术 Leader 都和业务闭环,所有的技术都向业务老大汇报,实际的考核都由业绩产生。技术老大产生了很多疑问,比如销售运营老大怎么管理好技术?技术会不会成为外包工程师,从此没法拒绝他们的需求?形成好的技术标准怎么推下去?


人的问题往往通过组织来补:


第一,让业务管绩效。真正的技术是负责所有技术人员的成长,所有人员的面试技术线、成长线都需要参与,形成跨部门的面试。


第二,给业务老大搭配有综合性素质的小 CTO 的角色,这致使他会站在业务老大的角度思考问题。


第三,引入项目经理的角色,项目经理有很多职责是关注人效的,关注人效就避免了所有技术成为外包工程师,每个项目迭代都会做复盘。


第四,引入 HRBP 和 OD 的角色,让专业的 HRBP 和 OD 关注人员的成长并形成轮岗的价值。


第五,搭建日常技术管理平台,有助于建技术文化、推技术标准。



现在,喜马拉雅逐渐形成了前中台实体组织架构,因为组织架构已经形成了网络协同,于是我们开始思考如何管理好网络型组织。在网络中实体架构往往需要横向型组织,横向型组织的作用是打穿所有垂直事业部的部门如商业职能部。很多横向型组织其实是通过虚拟组织方式存在的,如技术委员会。


除了自顶向下设计的虚拟组织外,那么如何形成自下而上的自组织,比如说在喜马拉雅有兴趣小组的概念,在各个部门往往有一个或多个特别感兴趣的人员,我们给他们提供平台组建兴趣小组,给兴趣小组一定的经费做日常的小组运营,可以做培训、分享、活动等。每个小组在业务部门都有类似于 agent 成员,这样可以直接解决实际问题。比如 docker 兴趣小组,在每个业务部门的小组成员能帮助业务团队其他同学解决使用 docker 时遇到的实际问题,推广 docker 新的使用标准等。



“信息化”是网络中非常重要的催化剂,它保障的是信息的流通,网络中每一个节点都要保证稳定高效的运行,不出问题而且效率要高。我们做信息化主要有 5 个目的:


1、统一认证审计。对员工的加入和离职要做到一键入职和一键离职,员工到离职的那天办完退工单,就可以一键离开所有的系统。


2、统一流程规范。流程的本质不是减缓效率,流程的本质是保证产品的质量,接着是提高效率。流程梳理出来后都会标准化、在线化。


3、统一数据产品化。将公司的所有数据都整理到中台,辅助所有的业务做数据决策,为了决策的高效往往直接产品化、可视化出来。


4、统一资源资产管理。客户资源、资源位资源、公司资产,这些都是公司最重要的资源。比如人才,我们把所有人才的管理放在系统里,每个人每年 OKR 的完成情况,如做过哪些事、培养过哪些人才、大家对他的评价如何,都做在系统里。当我们有新事情时,就可以知道该如何选拔人才,做人才盘点时,也知道每个人的情况如何。


5、统一信息在线到达。相信大家都做内部的信息系统,当达到一定个数时,信息系统会有非常多,散落在各个角落里,运营每天的工作要经历 7、8 个系统,所以我们整合所有的系统做运营工作台。运营登录后,就会得到所有的通知看基础的数据。因此,我们要做到信息到达的边界性,提高员工的工作效率。

我的技术管理思维

在组建实践思考中,我也形成了一定的管理思维,我将分享给大家。



我将管理者分为:


1、带头大哥,带着你的一帮小伙伴打仗;


2、教练员,更多地培养他人,告诉他人应该怎么做,以培养他人为自己的成就感;


3、平台搭建者,搭平台搭标准,让教练员在平台上指导别人;


4、定方向的人,让所有人按照他的方向往前冲。


在现实工作中,每个管理者都要同时担任这四个角色,只是不同的事情定位角色不同,同一事情不同阶段角色定位不同。



闭环和核心思维是业务落地的思维,往往一个良性的业务是闭环的。规划出业务闭环后,根据当前最重要的目标,标识出核心节点,再将核心节点小闭环规划出,找到小闭环中的核心节点。



比如内容闭环,从版权的引入登记到内容分发到版权评估,这是简单的基于版权和内容的闭环。如果目标是提升内容创作的效率,那内容创作一定是核心节点,内容创作核心节点中如何快速地把内容和有声播讲者匹配,如何给有声播讲者提供方便使用的录音工具就会成为核心节点小闭环的核心节点。最终勾画出当前业务落地的最小闭环。


如果现在的重要目标是分发头部内容,那么核心节点就是内容分发,内容分发小闭环里的核心节点是如何利用资源推广头部和热门内容,因此把核心节点找出来,会更有助于把业务和战略进行落地。



中控和去中心化的思维,其实是组织建设的思维。在中控和去中心化思维里,往往中控的是 数据、人才、战略和资源。中控的资源要想办法去中心化,去中心化后网络才能更高效地并行运行,才能更贴近炮火。


什么是去中心化?行动、思考、沟通、决策等。


中控的东西怎么去中心化?要做到对组织的保障,要使用组织、文化、项目、产品四个手段。



在喜马拉雅所有产品内的资源位是中控的,资源位如何分给各个业务部门去中心化使用?我们成立了资源管理中心(组织),定出了很多资源管理的规则、资源投放的规则、资源使用的规则(文化)。


将文化进行定义后,我们把资源包拆解到各个业务团队,业务团队要到资源投放的系统(产品)上投放内容,内容会通过资源投放系统产品把投放的效果进行计算收集反馈给业务、资源管理中心。每个月资源管理中心会重新复盘,哪个业务使用的好,哪个业务使用的差,会把资源包进行重新分配(项目),这就是项目的迭代,每个迭代会往更好的方向走。



中国有一句古话“形而上者谓之道,形而下者谓之器”,很多时候好的动作和行为没法传播,必须要提炼成文字、道理才能有效地进行传承。而文化道理比如说“追求极致”,却没有体感,必须通过具体的实践才能落地,所以虚和实往往是结合在一起使用的。


所有技术 Leader 中,往往有两个经常参加的周会:技术业务周会和技术管理培训双周会。


技术业务周会咋以看起来是很实的”讨论业务“,规则是不允许迟到,但背后首要目的是”虚“的,是为了让所有的业务 Leader 知道,我们这里有个场,可以把大家连接起来,大家的心都在一起。而每个团队做的业务,其他业务线都在关心,整个公司都在关心。


技术管理培训双周会,”管理培训“一听起来就很虚,可以迟到,可以不来,形式也不固定,但其实目的是”实“的,为了解决管理当中遇到的实际问题,通过互相学习,让所有人的管理水平都得到提升包括我自己。所以虚和实往往都是结合在一起使用的。



每个人做所有事情都需要有思考的原点,我思考的原点有 3 个:


1、价值导向。做所有事情都要能产生价值。对于做互联网产品的人来说,最好的价值就是“用户体验 * 商业价值”;对于业态来说,最好的价值就是生态价值,把生态价值全部量化,可以通过数据计算生态价值;对于客诉率来说,把客诉率做在 KPI 里,如果你的客诉率增加,那么业务绩效直接降 1-2 个等级。


2、质量基线。做任何事情都要把握质量的基线,质量的基线往往包括流程、包括安全。比如我们定的基线是 99.99%,我们做所有业务都不能因为盲目追求项目进度,突破基线。基线在不同时期是可以动态调整的,不同的业务也可以定义不同的指标,比如 SLA 服务标准,不同业务也不同。


3、效能追求。有了基线外往价值方向上跑,在过程中,我是在追求极致的效能,要超过竞争对手一定是整合资源的效率比他高,对效能的极致追求是我做过程迭代的最重要方法论。




TGO鲲鹏会,是极客邦科技旗下高端技术人聚集和交流的组织,旨在组建全球最具影响力的科技领导者社交网络,线上线下相结合,为会员提供专享服务。目前,TGO 鲲鹏会已在北京、上海、杭州、广州、深圳、成都、硅谷、台湾、南京、厦门、武汉、苏州十二个城市设立分会。现在全球拥有在册会员 800+ 名,60% 为 CTO、技术 VP、技术合伙人。


会员覆盖了 BATJ 等互联网巨头公司技术领导者,同时,阿里巴巴王坚博士、同程艺龙技术委员会主任张海龙、苏宁易购 IT 总部执行副总裁乔新亮已经受邀,成为 TGO 鲲鹏会荣誉导师。


2019-06-27 16:075698
用户头像
刘家宇 InfoQ 编辑

发布了 176 篇内容, 共 53.2 次阅读, 收获喜欢 281 次。

关注

评论

发布
暂无评论
发现更多内容

文心一言 VS 讯飞星火 VS chatgpt (184)-- 算法导论13.5 1题

福大大架构师每日一题

福大大架构师每日一题

一些无人不知的命名规范

小魏写代码

Led显示屏同步和异步控制的原理是什么

Dylan

控制 LED显示屏 全彩LED显示屏 led显示屏厂家

秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作

阿里巴巴云原生

阿里云 云原生

面试官:Redis持久化能关吗?怎么关?

王磊

Java 面试题

数字人直播软件源码需要多少钱?

青否数字人

【Mac&win】datagrip2023安装教程与激活码分享 亲测有效

Rose

ide DataGrip2023激活 DataGrip2023安装

速看,速进。一起学习一起交流。

薛定谔的皮皮虾

BOE(京东方)携手新浪微博举办手机影像艺术展 创新科技赋能数字影像

科技热闻

可观测实践丨如何利用 AI 算法解决告警配置三大难题?

阿里巴巴云原生

阿里云 云原生 可观测

恭喜 Nacos 和 Sentinel 荣获 2023 开源创新榜“优秀开源项目”

阿里巴巴云原生

阿里云 云原生

推荐收藏 | 【Git实战专题】「必坑宝典」带你深入剖析Git操作指令下的奥秘原理和运作机制

洛神灬殇

Java git 原理分析 后端处理 2024年第十八篇文章

texifier mac LaTeX编辑工具下载安装(原Texpad)

Rose

Mac软件 LaTeX 编辑器 Texpad Texifier激活码

Rainbond v5.17 版本发布,统一管理离线镜像和私有仓库

北京好雨科技有限公司

Kubernetes 云原生 容器云 离线

Spark SQL五大关联策略

京东科技开发者

十家传统企业数字化转型的心得体会:10大关键方面、拆解74 小点

天津汇柏科技有限公司

数字化转型

如何使用 Helm 在 K8s 上集成 Prometheus 和 Grafana|Part 3

SEAL安全

Kubernetes Helm Grafana

Jira 母公司全面停服 Server 产品,用户如何迁移至极狐GitLab

极狐GitLab

为什么人工智能与软件测试的结合话题开始火爆

测试人

软件测试 自动化测试 测试开发

魔搭×函数计算:一键部署,缩短大模型选型到生产的距离

阿里巴巴云原生

阿里云 云原生

弹性调度助力企业灵活应对业务变化,高效管理云上资源

阿里巴巴云原生

阿里云 云原生 弹性计算

云消息队列 Kafka 版阿里云 SAE 2.0 正式商用:极简易用、百毫秒弹性效率,降本 40%生态谈第一期:无代码转储能力介绍

阿里巴巴云原生

阿里云 Serverless 云原生

【2024开年必备】最全面的Macbook/苹果电脑必备实用软件推荐

Rose

苹果软件 装机必备 Mac应用

画眉(京东科技设计稿转代码平台)介绍

京东科技开发者

XMind 2024思维导图:新增 310 张 AI 原创插画

Rose

XMind 2024思维导图 XMind 2024下载 XMind 2024中文 思维导图下载

荣耀时刻 | 第七在线荣获艾媒2023中国企业服务年度企业

第七在线

Linux 中常见目录的作用

emanjusaka

Linux 目录

DvD刻录软件DVD Cloner 2024 for Mac,现已支持最新的蓝光电影复制

Rose

mac软件下载 DVD克隆 DVD Cloner 2024下载 DVD Cloner 2024 Mac

顺丰科技LaaS实现产品化,数字生态战略提速

新消费日报

基础架构即代码 | 亚马逊如何在现实生活中实践 DevOps

亚马逊云科技 (Amazon Web Services)

DevOps 微服务 架构设计 Amazon Lambda Amazon API Gateway

ElasticSearch集群灾难:别放弃,也许能再抢救一下 | 京东云技术团队

京东科技开发者

喜马拉雅 CTO 陆栋栋:从技术“土话”开始,解析 7 年技术管理实践_文化 & 方法_刘家宇_InfoQ精选文章