【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰

  • 2022-12-02
    北京
  • 本文字数:3067 字

    阅读完需:约 10 分钟

如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰

入行近 20 年,张颖峰先后负责搜索引擎内核、大数据系统、分布式高可用基础架构,一路见证了互联网科技的发展与变迁。回忆创业之初,他便想寻找一种能够将互联网核心技术标准化的载体。直到目前,他仍然在该领域深耕,并担任着矩阵起源创始人兼研发负责人一职。

 

恰逢 2022 QCon 全球软件开发大会·上海站召开之际,InfoQ 记者有幸在活动现场采访到了张颖峰。在采访过程中,他谈到了 HSTAP 这一概念被提出的初衷和背景,以及他对于国产数据库发展现状的理解。

 

以下是视频采访的全部内容,为方便读者查看,视频下方也附上了文字内容。

 

00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    InfoQ:感谢张老师来参加 QCon 全球软件大会上海站,首先请张老师做下自我介绍

     

    张颖峰:我早年从事芯片行业、物理基础设施,后来很快就创业了,创业时我主要做企业信息化软件开发。在这个过程中,我发觉自己其实不太喜欢定制化的策略,也不认为这就是 To B 软件的发展趋势,所以我一直在寻找应用软件中相对标准化的领域,后来我加盟到一家海外创业的搜索引擎公司,我认为这个领域确实是能够做到这一点。在这个公司我做了很长时间,不仅参与了搜索引擎从零到一的完整开发过程,还参与了以搜索引擎为核心的整套互联网业务,包括电商、广告、交友、社区等等。这些业务全部参与过后,我离开了这家公司,又到了多家甲方公司、乙方创业公司等等,在这些公司当中我的角色一样,一直是负责基础架构的建设,包括数据智能建设。


    将近 20 年下来,我的初衷一直没有发生变化,就是想寻找一种在应用软件领域能够标准化的东西,它能够将互联网科技以标准化的方式去展现给一些企业,让企业能够受惠于这些科技,直到最后我发现这种载体只能是数据库,所以我就开始参与创业,创立了矩阵起源这家公司。

     

    InfoQ:矩阵起源所提的 MatrixOne 是面向未来的超融合异构数据库,光是听到这个概念我想就会让很多人眼前一亮,也请您来聊一聊我们打造 MatrixOne 这款产品的初衷、背景?以及我们为何会选择提出 HSTAP 这一概念,希望它解决行业中哪些现存的问题?

     

    张颖峰:刚才我在介绍自己经历的时候也提到了,创业的初衷就是给企业提供一种相对标准化的解决方案,过去我们经历了早期的互联网大爆炸,也经历了后面的移动互联网大爆炸,所以在一开始的互联网早期架构,我们造了最原始的、最简陋的轮子,一直到后面跟随着业务发展,跟上了整个工业界最新的技术,在整个过程当中我们其实一直都围绕 ABC 三个领域去做,就是 AI、大数据、云,这些技术本质上就是互联网科技最核心的体现。

     

    再后面我又进入到传统企业,我发现这些公司想要用到这些互联网科技非常难,根本原因就在于他们缺乏人才的积累和沉淀。如果能够有一种载体把这些互联网核心技术标准化起来,就能帮助其他行业很快地应用起来,这个是创办矩阵起源的初衷。

     

    这个梦想是比较大的,但是所谓千里之行总要从第一步走起,所以我们一开始决定还是先解决企业从信息化到数字化过程中的核心问题,就是它的业务中台和数据中台怎么来建设,怎么样能够以更低的成本建设。所以我们现在提出来“HSTAP”的概念,它分别对应企业的业务中台、企业的数据中台还有数据如何流转。我们希望用一款数据库把企业最基础的业务中台和数据中台以最低的成本建设好,这样企业就不用操心技术上的事情,它只关心自己的业务就可以了。

     

    InfoQ:在选择一款数据库产品时,除了考虑性能、引入成本以外,学习成本也是需要考虑的核心要素之一,想了解下 MatrixOne 对于开发者以及运维人员的学习门槛是怎样的?

     

    张颖峰:我们现在以云上数据库为更主导的方向,对于云上来讲,用户是免运维的;另一方面,我们是开源数据库,我们把数据运行在 Kubernetes 里面,通过对整个弹性架构的屏蔽,尽力屏蔽掉了数据库内部对于外部的复杂度。


    对于开发者来说,他只需要关心自己所用的 SQL 语言是什么就可以了;对于运维人员,特别是云下这里,我们会提供可观测性的平台,支持将数据库内部的一些指标或者日志导出,随时去观测。但这并不意味着我们把这些数据提供出来之后,就把复杂度暴露给用户,这只是帮助用户去做一些监控方面的事情。

     

    InfoQ:您刚才提到在整个研发过程当中相当于把技术难度留给我们团队自己,所以在研发的过程中,我们有遇到过最大的技术挑战是什么?后面是怎么解决的?

     

    张颖峰:我觉得最大的技术挑战其实是联调,就像前面提到的,我们数据库是从头来写,这里面包含三块:一块是我们计算从头开始写,一块是存储引擎也从头开始写,还有一块是架构也需要从头开始搭建。大家分别从头开始去干这件事,最后总要有交汇的时候,这个交汇就比较痛苦,因为不仅仅需要自己组件的联通和稳定,还要确保整条链路从头到尾串下来,这里面需要协调和需要相互协作的事情非常多,这个过程我们前前后后经历了不止一次,这是我们整个开发过程当中遇到的最主要挑战。

     

    后来是怎么解决的呢?实际上也没有太多的秘密,主要是依靠大家的协作意识,很多时候要站在对方角度去看这个问题应该怎么去做,然后通过紧密的沟通和协作,在比较短的时间内把整个流程调通。

     

    InfoQ:MatrixOne 从一开始就坚定地选择了开源这条路,原因是什么?

     

    张颖峰:首先,我们作为一家数据库公司,一定是技术驱动的,开源本质上就比较技术范儿,或者说是工程师范儿一点,这样也可以吸引优秀的人才更愿意加入我们公司。因为对于初创公司来说,招募团队也是件很难的事情,为了让更多的人关注我们,开源也是非常友好的。截止为止,我们已经收到来自开源社区的重要贡献,也有人因为开源加入到了我们团队。

     

    另外就是站在产品角度,让用户能够快速地根据他的诉求不断去试错,他能够体验到跟随一款数据库成长的过程,然后在这个过程当中建立信任感。最后,从开源的本质上来说,它其实是国产数据库技术走向国际舞台过程中,不可或缺的一件事情。我们大家不能总认为开源软件是拿来主义,我们也要回馈社区。

     

    InfoQ:展望明年, MatrixOne 还将有哪些迭代计划?

     

    张颖峰:目前,我们刚刚完成了整个云原生 HTAP 架构的联调,预计在明年让云原生 HTAP 这套体系能够稳定地对用户提供服务。同时,云上数据库托管平台也会同期提供服务,这是我们从中期来看最直接的目标。但这只是我们的 baseline,接下来会把 HTAP 逐渐升级到 HSTAP,这就是我演讲中提到的 transform 能力,这个对于整个 HTAP 布局的成功应该说是至关重要的。

     

    InfoQ:近几年,我们能看到国内数据库行业的发展是非常迅猛的,无论是在创新、差异化还是生态方面,大家都开始“卷”起来了。若想在国内数据库市场中拉开更具竞争的格局,您觉得需要在哪些方面持续投入?

     

    张颖峰:我倒不认为这是卷起来,因为相对 To C,中国 To B 的发展一直处于比较弱势的局面,目前大家也都意识到了这个问题,都希望 To B 能够成长起来,而 To B 成长起来最应该做到各层次的标准化,数据库首当其冲就应该先标准化起来。


    因此,数据库作为 To B 行业的一个先锋领域,如果有更多厂商能够一起进入到这个行业,把这个行业真得做大,可能是更加重要的一件事情。我们非常高兴看到有那么多伙伴能关注数据库革新与发展,并有越来越多的人加入,共建优良的数据生态。矩阵起源也很高兴一起贡献力量,未来,我们也会基于 MatrixOne 培养和建设整个数据大生态。

     

    然而,要想把这个领域做大需要多方面投入。站在我们自身的角度出发,对人才一直有更进一步的需求。我们需要更多对基础架构,对底层领域熟悉的人才参与进来。尤其是站在整个 To B 行业来说,这个行业为什么发展难,因为全部都是定制化的,若想在这个过程中帮助到企业,也能够培养他们自己的数字化人才,这其实也是一件双赢的事情。

    公众号推荐:

    跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

    2022-12-02 11:395396

    评论

    发布
    暂无评论
    发现更多内容

    经典计算机课程

    Joseph295

    记一次HEX和RGB互换算法的思考及应用

    徐小夕

    Java 面试 算法 大前端

    LeetCode069-x的平方根-easy

    书旅

    数据结构 算法 Go 语言

    华为云MVP付健权:从机械工程师到AI开发者的华丽转身

    华为云开发者联盟

    AI 转型 工程师

    Week_09 总结

    golangboy

    极客大学架构师训练营

    展现非凡领跑力,京东会展云斩获“十大云原生行业落地典范”奖项

    京东科技开发者

    云计算 AI 云原生

    为什么你写的拦截器注入不了 Java bean?

    Java旅途

    Java spring Spring Boot 拦截器

    【薪火计划】04 - 心态和角色

    AR7

    管理

    还在用分库分表?看TiDB如何解决海量数据无感扩容难题

    京东科技开发者

    数据库 分布式数据库 #TiDB

    第九周作业

    智能灯串开发资料全开源!为这个冬天装点烂漫“星空”

    智能物联实验室

    人工智能 物联网 智能硬件 智能家居

    Istio 中的智能 DNS 代理功能

    Jimmy Song

    开源 云原生 Service Mesh istio 服务网格

    排序与二分

    落曦

    第五周作业

    jizhi7

    week5-(2选1)

    未来已来

    vivo 调用链 Agent 原理及实践

    vivo互联网技术

    Java 架构 调用链

    5G革命:如何让「数据」实现最大性能?

    VoltDB

    数据库 数据分析 5G 工业互联网

    架构训练营 - 第9周课后作业 - 学习总结

    Pudding

    Week_09 作业

    golangboy

    极客大学架构师训练营

    第9周学习总结

    饭桶

    极客大学 - 架构师训练营 第十周作业

    9527

    鹿鼎记 · 韦小宝,丽春院、天地会、入皇宫等五个场景的恶搞版多线程锁学习!

    小傅哥

    Java 程序员 小傅哥 多线程

    《Elasticsearch服务器开发》.pdf

    田维常

    elasticsearch

    讲武德,你们要的高性能日志工具 Log4j2,来了

    沉默王二

    Java log4j

    田哥:面试被问== 与equals 的区别,该怎么回答?

    田维常

    面试

    第九周总结

    0到1产品需求整理分析模型参考

    燕陈华

    产品设计 产品需求

    week5-根据当周学习情况,完成一篇学习总结

    未来已来

    第九周课后练习

    饭桶

    架构师训练营 - 第 9 周课后作业(1 期)

    Pudding

    第九周作业

    Geek_4c1353

    极客大学架构师训练营

    如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰_数据库_郑思宇_InfoQ精选文章