AICon全球人工智能与机器学习技术大会9折特惠中,点击立减¥480>> 了解详情
写点什么

不想浪费时代机遇,这群内心狂野的程序员用 5 年时间把产品卖到了全球丨开源创新 30 人

2020 年 12 月 07 日

不想浪费时代机遇,这群内心狂野的程序员用5年时间把产品卖到了全球丨开源创新30人

嘉宾 | PingCAP 联合创始人兼 CTO 黄东旭

采访 | 极客邦科技 CEO 霍太稳

编辑 | 周文猛


在 IT 基础软件领域,由于起步晚、技术底子薄弱等方面的原因,国内长期落后于国外。与此同时,由于市场认可度低、需要长期高投入等方面条件限制,敢于亲自到这一领域尝试创业的人更是“凤毛麟角”。用此前大众口中的话来说便是——国内企业想要发展自己的底层基础软件,这是一件很不“中国”的事情。


然而,对于 PingCAP 的三位创始人而言,他们正在成为打破外界这一顽固认知的破局者。


今年 11 月 17 日, PingCAP 宣布获得由包括纪源资本、Access Technology Ventures、贝塔斯曼亚洲投资基金、经纬中国、云启资本等顶尖投资机构共同出资的 2.7 亿美元 D 轮融资,一举跃身成为国内唯一一家以开源模式推动基础软件研发的独角兽企业。资本市场的一致认可,表明了 PingCAP 长期以来坚持的发展方向与实践成果获得了资本的肯定。


在此之外,市场方面也给出了 PingCAP 很高的评价。数据显示,截止 2020 年 11 月,TiDB 的用户数也已经突破 1500 家,涉及互联网、游戏、金融、制造业、电信、零售、政府等多个行业。包括日本最大在线支付公司 PayPay,美国 Square,越南独角兽 VNG,东南亚最大电商 Shopee,法国最大的在线视频公司 Dailymotion 等企业,也均先后成为了 PingCAP 的用户。


2015 年 4 月,当黄东旭、刘奇、崔秋这三位 PingCAP 身后的创造者们辞职出来创业的时候,CEO 刘奇曾在微博上发了一条招聘信息,传播效果很好,阅读量一度高达 47 万,但却没有收到一封简历,批评的声音却雪片般飞来。


“数据库就是一个大坑,而且一听就是外国人的事,很不中国。”有人评论表示。更有人站出来泼冷水:“如果本职工作都做不好,却一味忙活开源、框架,以提高影响力,那未必说明他们是技术大牛,也更未必是创业企业需要的人。”


如今,伴随着资本、市场、国际化等方面认可的声音不断出现,国人做一款通用数据库就是一个坑的论断正在被有力击破,而 PingCAP 的创始人们,也逐渐把曾经那一件很不“中国”的事情做到了全球认可。


对于 PingCAP 而言,这一家屡次打破外界认知边界的开源基础软件独角兽企业究竟有何特色?他身后的创始人们又有着怎样的故事?而众多的企业当中,为何又是 PingCAP 首先走出来了呢?


11 月 19 日,在宣布获得 2.7 亿美元融资两天后,PingCAP 创始人兼 CTO 黄东旭出席了 InfoQ 高端内容访谈栏目,将创业多年的技术实践、商业思考以及创业心路历程,以视频访谈的形式做了一个全景式的输出。



视频观看地址:https://v.qq.com/x/page/d3208ynp9vg.html

到 GitHub 下载 PingCAP TiDB 开源项目:https://github.com/pingcap/tidb

Nothing to lose,去试试吧,别浪费了这个时代的机遇


从 0 到 1 创立一家公司,最近的一次融资额度高达 2.7 亿美元, PingCAP 最开始的创业初衷是什么呢?面对镜头,当被问到这一问题的时候,黄东旭给出了自己的答案。


在 2015 年正式创业之前,黄东旭与 PingCAP 的另外两位联合创始人刘奇、崔秋均在豌豆荚上班。当时,三人经常一起吃饭散步,讨论一些 “Boring” 的技术性话题。期间,黄东旭和刘奇还一起做过一个叫做 Codis 的项目,用于解决 Redis 拓展性的问题,并将其开源了。


由于 Codis 项目开源后在业界引发了不少关注,远远的超出了当初的预期,这给了黄东旭和刘奇不少信心,既然 Redis 的问题解决了,那是不是可以往更难的数据库领域深挖一下呢?


当时,行业内可供选择的数据库方案只有传统关系型数据库与 NoSQL 数据库两种。其中,传统关系型数据库在面对企业业务数据量激增时,将会遇到扩展性问题,对企业的数据库管理团队提出了极大的挑战甚至是折磨;NoSQL 虽然解决了数据库水平扩展的问题,但却无法处理交易类数据及复杂的业务逻辑特性,对于金融、电信、电力等行业极不友好,行业内没有一款完美的数据库解决方案。


于是,能不能像当时 Codis 解决 Redis 扩展性的问题一样,开发一个产品也把 MySQL 这一类关系型数据库的扩展性问题解决了。这成为了吸引黄东旭不断思考的问题。恰巧,当时学术界也有了一些突破性进展,Google 在 2012 年发表了 Spanner 和 F1 论文,这正是 Google 内部用来替换 MySQL 扩展性的方案;到了 2014 年,第一次可以绕开 Paxos 实现等价的工业级别的分布式一致性协议也开始出现。


刘奇、黄东旭和崔秋看到了想要去做的事情在理论层面已经开始成熟。“每一个很难的技术都像一座珠穆朗玛峰,Spanner 和 F1 这两个论文给我最大的震撼并不在于具体的技术细节,而是在于,它告诉了我们,这件事情是人类能够做得到的。”黄东旭如此解释谷歌论文对于当初自己决定开始创业的启发。


在看到了登顶“珠峰”的可能性之后,黄东旭、刘奇、崔秋三人一致觉得这件事情太有价值了,“不管怎样一定要去试一试,不做简直是浪费了这个时代的机遇”。于是,三位创始人便抱着即使做不成,大不了就再回去上班的心态,毅然决然的辞职创业。


“因为年轻,反正 Nothing to lose ”,在黄东旭的介绍中,当时他们连融资的 BP 是什么都不知道,便在崔秋的带领之下跟投资人见了一面,聊了三个小时后便意外的获得了投资人的支持,从此走上了创业之路。


TiDB 是个“魔法杯子”,但第一个客户我们等了两年


决定创业的想法是浪漫而充满理想主义的,也很激动人心,但是创业的过程却是残酷的。


2015 年 4 月份出来创业的时候,当时刘奇、黄东旭、崔秋觉得三个月内就可以把项目写出来。结果三个月过去了,却什么都没有写出来,投资人过来问还需要多久?三人思索后觉得半年后应该可以了,然而半年后投资人再来问,却只能说估摸着还得再给半年……


作为 PingCAP 创业至今就一直在专注于打造的新型数据库—— TiDB 至今仍然是 PingCAP 内部唯一的拳头产品,同时也是撑起公司持续多轮融资的关键之一。在黄东旭的介绍中, TiDB 的定位首先是一个 HTAP 混合负载型通用数据库,能够满足强一致性事务处理与分析,具有故障自恢复的高可用及跨数据中心多活等方面技术特性。


除此之外, TiDB 最大的一项优势是具备在线弹性水平扩展能力,在黄东旭的介绍中,TiDB 就像是一个可以自动扩容的“魔法杯子”,由于采用了分布式技术,同时基于 HTAP 架构实现了对于事务 / 分析型数据的读写处理,TiDB 能够更加高效的解决 MySQL 等关系型数据库无法解决的数据扩容、管理等难题,具有更为广泛的场景适配能力,能帮助企业工程人员快速上手,并最大化发挥数据价值,释放企业增长空间。


然而,就是这样一款能够“魔法扩容”的神奇数据库产品,他第一笔商业订单的得来却极为不易。从 2015 年开始创业,一直到 2017 年,黄东旭的老朋友盖娅互娱 CTO 焦洋( TGO 鲲鹏会会员)迫于业务需要却找不到更好的方案,才冒险选择了 TiDB 作为尝试。


黄东旭回忆,由于当时盖娅互娱一套基于 MySQL 的广告投放系统在进行复杂数据查询处理时响应非常缓慢,广告投放出去 20 多分钟后,钱也花了,但是却没什么效果,公司使用体验很差。于是焦洋抱着试一试的心态,采用了 PingCAP 的 TiDB 数据库,几经周折成功部署后,效果却出奇的好,原来二十几分钟没出来的结果,十秒左右就出了结果,效果非常理想。


在有了第一单商业客户的成功转化之后,PingCAP 的商业化探索之路也开始步入正轨,有越来越多的游戏、互联网领域企业采用 TiDB ,并进一步转化成为商业客户。


2018 年,北京银行的一套银行联机交易系统正式基于 TiDB 数据库实现落地,PingCAP 拿下了金融行业高等级安全保障级别订单,公司的产品也快速覆盖到金融领域,同时在电信、制造、零售、政府等领域也开始被广泛使用。


随后到了 2019 年,随着 TiDB 开始被东南亚最大的电商公司 Shopee 采用,PingCAP 进一步走向了海外市场。截止目前,海外市场的营收已经超过 PingCAP 国内营收。


在大学时期上数据库课程时,老师一般只会教一些比较基础的数据库增、删、改、查等基本操作,很少会介绍 Hadoop、Hive、Presto、ClickHouse、Greenplum  等这些时下工业界比较热门的数据库产品,最终的结果就是,大多数工程人员其实大学里学到的东西,与工作中真实运用到的技术之间,存在着巨大的差距。


“数据库本就该只有增删改查这些基本朴素的功能,安全稳定是必须的,最好能高可用,数据量大了可以通过弹性伸缩来实现,而且最好别让使用者学太多新东西,用起来跟过去使用的产品差不多。”在黄东旭的介绍中,一款完美的数据库产品就该像家里的自来水一样,使用者拧开水龙头水就能出来,但是背后自来水厂是怎么处理的却不用知道。


基于这样的理念, TiDB 将传统的关系型数据库与现在工业界比较流行的 NoSQL 型数据库做了结合,提出了自己基于 HTAP 架构的 NewSQL 数据库概念。


在黄东旭看来,NoSQL 数据库的出现有其特殊的时代背景,由于当时一批快速发展的互联网公司自身的业务发展需求量过于庞大,但是具体的业务需求却并不复杂,于是开发人员出于快速满足业务发展需要,才提出了 NoSQL 型数据库。然而伴随着互联网上半场的告一段落,进入下半场的互联网行业对于数据处理的需求越来越高,复杂度开始提升,于是,业界开始呼唤新的 NewSQL 数据库产品出现。


“对于开发者而言,SQL 一直是我们这个时代最友好的去处理数据的语言。伴随着互联网行业发展逐步进入‘深水期’,我们看到类似于 Hive、Spark、Kafka、Presto、ClickHouse 等与数据相关的基础软件都在向下提供 SQL 接口。”黄东旭表示。


在他看来,历史总是螺旋式发展的,在经历了从关系型数据库到 NoSQL 数据库的发展阶段之后,如今的 NoSQL 数据库技术发展,正在向关系型数据库领域适当的做一些回归。而这一过程中,从一开始就定位在这两者之间提供连接的 TiDB ,则生逢其时。


回顾十年前的电子产品,当时人们打电话用诺基亚,拍照用数码相机,听歌用的 MP3,导航也需要专门的 GPS 独立设备,各种种类繁多的电子设备围绕在我们身边提供各种服务。但是现在看来,仅一台智能手机把大多数这些碎片化的设备统一替代了,人们对于统一用户体验的追求驱动了整个科技界产品翻天覆地的变化,一台智能手机基本解决了我们生活中百分之七八十的数字化生活场景需求。


“我们的目的就是做数据库时代的「智能手机」,用 TiDB 可以解决未来数据场景大多数的数据问题。”黄东旭说。


开源与国际化,从创业之初就坚持至今的企业战略


开源与国际化,这是 PingCAP 的创始人们在创立之初就定下的企业发展战略,沿着这两条主线,如今发展了 5 年的 PingCAP 也开始在这两个方向上收获了属于自己的果实。


在开源社区,目前 PingCAP TiDB 项目的 GitHub Star 数已经超过 25000,Contributors 也超过 1200 位,主要成员包括来自中国、美国、欧洲、日本、印度等全球各地区。在世界范围内,TiDB 已然成为了基础架构领域的顶级开源项目。


在 TiDB 的开源社区取得巨大成功的背后,看不见的却是 PingCAP 团队长期的坚持与付出。


据黄东旭透露,从 TiDB 开源的第一天起,三位创始人在发现代码问题的时候,即使是三人面对面坐在一起,他们选择的方式也是首先通过 GitHub 将问题提交,然后再由三人中的一人通过 GitHub 回复处理,即使没有一个观众也没有任何人监督,三人都坚持全程纯英文线上交流,全程公开透明。


“战略和战术的区别很简单,如果一个人早上七点到办公室上班,坚持了三天,这叫战术。但是如果一个人每天七点钟到公司坚持了五年,那这就是战略。”在黄东旭的介绍中,从 TiDB 开源的第一天起,他们就坚持让每一次提交,每一行 Commit ,每一个 Review 记录,都能够被查询到,这一习惯至今依然在 PingCAP 内部被很好的传承延续着。


从发展之初就对于开源战略的长期坚持,让 TiDB 在 GitHub 上的活跃度得到了快速的提升,项目也很快获得了外界的认可,PingCAP 的商业化进程逐渐步入正轨。


与此同时,由于基于 GitHub 的开源项目天然就适合于开展国际化业务,再加上 PingCAP 从成立之初就给自己定下的国际化战略,公司在团队组建、人员素质要求等方面也提前做了准备,当 TiDB 在 GitHub 上得到广泛认可之后,PingCAP 的国际化业务也迅速的打开了局面。


据黄东旭介绍,在先后获得包括日本最大在线支付公司 PayPay、美国 Square、越南独角兽 VNG、东南亚最大电商 Shopee、法国最大在线视频公司 Dailymotion 等企业的商务订单后,目前 PingCAP 的海外业务营收已经超过了公司整体营收的一半。


对于非开源领域人士而言,开源商业公司如何盈利?这一直是一个值得思考的问题。事实上,褪去纯粹的开源情怀的外衣,商业公司开源最好的理解方式是通过源码开放,实现快速的商业获客以及市场用户教育。因此,对于开源商业企业而言,代码本身并不具备太大的价值,而代码背后所承载的价值与服务,才是真正值得关注的。


在黄东旭看来,在开源商业模式的 1.0 版本中,通过将代码开源之后,当客户用了自己开源的软件并产生长期使用、风险保障等需求之后,开源商业公司便可以通过提供技术支撑以及服务保障的模式,输出技术支撑能力服务,进而实现商业营收。


但除此之外,伴随着云技术的不断发展演进,在国外,以 Snowflake 为代表的数据仓储基础软件企业已经成功的探索出了另外一条 Pay As You Go 的商业 2.0 模式,基于云的方式,动态弹性的为客户提供了灵活的数据仓储服务,使得成本计算以及服务获取的模式都更加的灵活便捷。


“打个比方,我们假设要去外地出差,大概率不会为了出差而在当地买个房,而是会选择住酒店或者租房子,但是在 IT 领域,过去我们经常为了做一个新业务,提前锁定硬件和网络资源,这就好比为了出差而先买个房。对于云计算这个渠道而言,它带给基础软件的是通过提供一个全托管平台的方式,让数据库这一类基础服务能够通过类似于「租房」或者「酒店预定」的模式,对外提供服务。”在黄东旭看来,租房与住酒店跟卖房是完全不同的两种商业模式,前者比后者更加灵活,能够提供一种贴合用户使用曲线的服务。


因此,对于 PingCAP 而言,虽然对于开源商业模式 1.0 版本与 2.0 版本的盈利方式都有涉及,但是由于基于分布式技术实现了弹性可伸缩的数据库服务输出,因此 PingCAP 的未来将会更倾向于 2.0 模式。


云数据库时代,新的基础软件之上将诞生新物种  


“创业啦,如果你受够了 Cassandra、Hbase、MongoDB,饱受各种政治迫害,大公司病,或者认为自己看懂了 Spanner、CockroachDB……”。创业之初,当内心狂野、任性又放肆的 PingCAP CEO 刘奇在微博上发了下面这条招聘微博的时候,网络上批评的声音也随之而来。


据黄东旭回忆,当时自己也一度很受挫。而 5 年后的今天,在先后获得资本、国内外市场等方面的认可之后,当众人的目光再一次聚焦到 PingCAP 身上时,画风却开始不一样了。


镜头中,黄东旭扎着一头“摇滚范儿”的长发,言谈之间也平静了不少。“融资到账之后,我们都很淡定,不像当初出来创业的时候,什么事都容易激动得睡不着觉。”据黄东旭透露,下一步,PingCAP 将会把更多的资金投入到研发、开源社区、云数据库服务全球覆盖等方面。同时,公司将进一步推动人才队伍、客户、合作伙伴生态建设,真正做到把钱花在刀刃上,为企业后续发展打下更多基础。


访谈接近尾声,谈及对于数据库行业时下发展现状以及未来趋势的思考,黄东旭对于云数据库的进一步发展普及表示高度看好。“我们很多的基础软件,其实都会在云时代被重构一遍,未来很多企业应用都会在云端落地,都将可能产生非常多意想不到的效果。”


“在用诺基亚的时代,人们是无法想象到微信、抖音这一类应用的。”在黄东旭看来,未来伴随着 Cloud-native、AI、Serverless 等新技术的普及,以及 TiDB 这一类基于云的新型基础软件形态的不断发展成熟,这些底层基础设施的变革,将带来更多应用层的商业模式变革,进而催生出更多令人意想不到的新兴物种。


未来,只会更加精彩。


限量免费采访报道名额推荐[strong_begin][新基建50人]、[开源创新30人][strong_end]



「中国技术力量」之「新基建 50 人」以及[开源创新 30 人]系列专题报道火热进行中,我们长期专注于发现新基建以及技术开源领域内驱动产业数字化转型、智能升级、融合创新的科技型组织机构、企业部门 ,并将重点采访其中的产业发展引领者,技术部门中坚力量等人士,深度传播他们对于新基建、开源创新等方面的技术理解、产业需求以及商业化探索尝试。[strong_begin]欢迎大家点击超链接申请免费采访报道名额:>> [新基建50人]、[开源创新30人][strong_end]


2020 年 12 月 07 日 16:302167

评论 1 条评论

发布
用户头像
哈哈,所以吃饭时候多讨论些技术问题有助于激发灵感,而不是家长里短
2020 年 12 月 21 日 22:19
回复
没有更多了
发现更多内容

[git使用技巧] git提交忽略不必要的文件或文件夹

xcbeyond

git 七日更

如何成为架构师?

xcbeyond

个人成长 架构师 七日更

Serverless 落地之痛怎么解?

阿里巴巴中间件

Serverless

语音助手中的复杂语义表达方法

DataFunTalk

AI nlp

FastAI:滴普技术荟:基于机器视觉的典型多目标追踪算法应用实践

目标追踪 目标检测 追踪算法

用大白话给你解释Zookeeper的选举机制

爱笑的架构师

zookeeper ZooKeeper原理 七日更

业务中台建设 - 配置化

孝鹏

中台 微服务 配置化开发

揭秘大流量场景下发布如丝般顺滑背后的原因

阿里巴巴中间件

阿里巴巴

代码零改动Serverless架构升级?这家在线编程教育企业是这么做的

阿里巴巴中间件

Python Serverless

Shell简介

入门小站

Shell

低代码与零代码工具的这些特征,弥补了所有人和IT之间的差距!

J2PaaS低代码平台

程序员 互联网 开发者 软件开发 开发工具

数据为墨,智能作笔:画一卷新姑苏繁华图

脑极体

Nginx常见典型故障|Linux干货

赖猫

c++ nginx Linux

FastAI:滴普技术荟:某工业产品内部结构尺寸图像测量和缺陷检测分析

目标检测 图像处理 缺陷检测 AI测量 图像检测

SQL优化最干货总结-MySQL「2020年终总结版」

Java架构师迁哥

《数据分析》PDF免费下载

计算机与AI

数据分析

世界之书:《禅与摩托车维修艺术》与发现良质

lidaobing

禅与摩托车维修艺术 28天写作

附PPT丨AWS基于数据湖构建云上的数据分析架构

dbaplus社群

数据湖 AWS

夜莺二次开发指南-监控系统(1)

秦叶宁

滴滴夜莺 夜莺监控

夜莺二次开发指南-监控系统(2)

秦叶宁

滴滴夜莺 夜莺监控

“社恐”独处好去处:无人自习室,一个人的“世外桃源”

IoT云工坊

物联网 无人自习室 智能门禁 智能灯控 线上预约

JDK 16 即将发布,新特性速览!

xcbeyond

Java 七日更

TypeScript | 第三章:函数、泛型和枚举

梁龙先森

typescript 编程 前端 七日更

FastAI:滴普技术荟:基于深度学习的云边一体化OLED屏缺陷自动光学检测技术

学习 缺陷检测 云边一体 自动光学检测

彩色的线,数据的诗,你好——贵州鲲鹏!

脑极体

wildfly 21的domain配置

程序那些事

程序那些事 wildfly wildfly21 配置管理 domain模式

单点破局思维|技术人应知的创新思维模型(8)

Alan

个人成长 技术人应知的创新思维模型 七日更 28天写作

12张图带你彻底理解分布式事务!!

冰河

分布式事务 BASE理论 TCC ACID CAP理论

生产环境全链路压测建设历程 18:某快递 A 股上市公司的生产压测案例之中篇

数列科技杨德华

全链路压测 七日更

比特币的安全性到底有多高?

CECBC区块链专委会

比特币

职业规划

HQ数字卡

职业规划 七日更

数据cool谈(第1期)数据库寻路,开源有态度

数据cool谈(第1期)数据库寻路,开源有态度

不想浪费时代机遇,这群内心狂野的程序员用5年时间把产品卖到了全球丨开源创新30人-InfoQ