【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰

  • 2022-12-02
    北京
  • 本文字数:3067 字

    阅读完需:约 10 分钟

如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰

入行近 20 年,张颖峰先后负责搜索引擎内核、大数据系统、分布式高可用基础架构,一路见证了互联网科技的发展与变迁。回忆创业之初,他便想寻找一种能够将互联网核心技术标准化的载体。直到目前,他仍然在该领域深耕,并担任着矩阵起源创始人兼研发负责人一职。

 

恰逢 2022 QCon 全球软件开发大会·上海站召开之际,InfoQ 记者有幸在活动现场采访到了张颖峰。在采访过程中,他谈到了 HSTAP 这一概念被提出的初衷和背景,以及他对于国产数据库发展现状的理解。

 

以下是视频采访的全部内容,为方便读者查看,视频下方也附上了文字内容。

 

00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    InfoQ:感谢张老师来参加 QCon 全球软件大会上海站,首先请张老师做下自我介绍

     

    张颖峰:我早年从事芯片行业、物理基础设施,后来很快就创业了,创业时我主要做企业信息化软件开发。在这个过程中,我发觉自己其实不太喜欢定制化的策略,也不认为这就是 To B 软件的发展趋势,所以我一直在寻找应用软件中相对标准化的领域,后来我加盟到一家海外创业的搜索引擎公司,我认为这个领域确实是能够做到这一点。在这个公司我做了很长时间,不仅参与了搜索引擎从零到一的完整开发过程,还参与了以搜索引擎为核心的整套互联网业务,包括电商、广告、交友、社区等等。这些业务全部参与过后,我离开了这家公司,又到了多家甲方公司、乙方创业公司等等,在这些公司当中我的角色一样,一直是负责基础架构的建设,包括数据智能建设。


    将近 20 年下来,我的初衷一直没有发生变化,就是想寻找一种在应用软件领域能够标准化的东西,它能够将互联网科技以标准化的方式去展现给一些企业,让企业能够受惠于这些科技,直到最后我发现这种载体只能是数据库,所以我就开始参与创业,创立了矩阵起源这家公司。

     

    InfoQ:矩阵起源所提的 MatrixOne 是面向未来的超融合异构数据库,光是听到这个概念我想就会让很多人眼前一亮,也请您来聊一聊我们打造 MatrixOne 这款产品的初衷、背景?以及我们为何会选择提出 HSTAP 这一概念,希望它解决行业中哪些现存的问题?

     

    张颖峰:刚才我在介绍自己经历的时候也提到了,创业的初衷就是给企业提供一种相对标准化的解决方案,过去我们经历了早期的互联网大爆炸,也经历了后面的移动互联网大爆炸,所以在一开始的互联网早期架构,我们造了最原始的、最简陋的轮子,一直到后面跟随着业务发展,跟上了整个工业界最新的技术,在整个过程当中我们其实一直都围绕 ABC 三个领域去做,就是 AI、大数据、云,这些技术本质上就是互联网科技最核心的体现。

     

    再后面我又进入到传统企业,我发现这些公司想要用到这些互联网科技非常难,根本原因就在于他们缺乏人才的积累和沉淀。如果能够有一种载体把这些互联网核心技术标准化起来,就能帮助其他行业很快地应用起来,这个是创办矩阵起源的初衷。

     

    这个梦想是比较大的,但是所谓千里之行总要从第一步走起,所以我们一开始决定还是先解决企业从信息化到数字化过程中的核心问题,就是它的业务中台和数据中台怎么来建设,怎么样能够以更低的成本建设。所以我们现在提出来“HSTAP”的概念,它分别对应企业的业务中台、企业的数据中台还有数据如何流转。我们希望用一款数据库把企业最基础的业务中台和数据中台以最低的成本建设好,这样企业就不用操心技术上的事情,它只关心自己的业务就可以了。

     

    InfoQ:在选择一款数据库产品时,除了考虑性能、引入成本以外,学习成本也是需要考虑的核心要素之一,想了解下 MatrixOne 对于开发者以及运维人员的学习门槛是怎样的?

     

    张颖峰:我们现在以云上数据库为更主导的方向,对于云上来讲,用户是免运维的;另一方面,我们是开源数据库,我们把数据运行在 Kubernetes 里面,通过对整个弹性架构的屏蔽,尽力屏蔽掉了数据库内部对于外部的复杂度。


    对于开发者来说,他只需要关心自己所用的 SQL 语言是什么就可以了;对于运维人员,特别是云下这里,我们会提供可观测性的平台,支持将数据库内部的一些指标或者日志导出,随时去观测。但这并不意味着我们把这些数据提供出来之后,就把复杂度暴露给用户,这只是帮助用户去做一些监控方面的事情。

     

    InfoQ:您刚才提到在整个研发过程当中相当于把技术难度留给我们团队自己,所以在研发的过程中,我们有遇到过最大的技术挑战是什么?后面是怎么解决的?

     

    张颖峰:我觉得最大的技术挑战其实是联调,就像前面提到的,我们数据库是从头来写,这里面包含三块:一块是我们计算从头开始写,一块是存储引擎也从头开始写,还有一块是架构也需要从头开始搭建。大家分别从头开始去干这件事,最后总要有交汇的时候,这个交汇就比较痛苦,因为不仅仅需要自己组件的联通和稳定,还要确保整条链路从头到尾串下来,这里面需要协调和需要相互协作的事情非常多,这个过程我们前前后后经历了不止一次,这是我们整个开发过程当中遇到的最主要挑战。

     

    后来是怎么解决的呢?实际上也没有太多的秘密,主要是依靠大家的协作意识,很多时候要站在对方角度去看这个问题应该怎么去做,然后通过紧密的沟通和协作,在比较短的时间内把整个流程调通。

     

    InfoQ:MatrixOne 从一开始就坚定地选择了开源这条路,原因是什么?

     

    张颖峰:首先,我们作为一家数据库公司,一定是技术驱动的,开源本质上就比较技术范儿,或者说是工程师范儿一点,这样也可以吸引优秀的人才更愿意加入我们公司。因为对于初创公司来说,招募团队也是件很难的事情,为了让更多的人关注我们,开源也是非常友好的。截止为止,我们已经收到来自开源社区的重要贡献,也有人因为开源加入到了我们团队。

     

    另外就是站在产品角度,让用户能够快速地根据他的诉求不断去试错,他能够体验到跟随一款数据库成长的过程,然后在这个过程当中建立信任感。最后,从开源的本质上来说,它其实是国产数据库技术走向国际舞台过程中,不可或缺的一件事情。我们大家不能总认为开源软件是拿来主义,我们也要回馈社区。

     

    InfoQ:展望明年, MatrixOne 还将有哪些迭代计划?

     

    张颖峰:目前,我们刚刚完成了整个云原生 HTAP 架构的联调,预计在明年让云原生 HTAP 这套体系能够稳定地对用户提供服务。同时,云上数据库托管平台也会同期提供服务,这是我们从中期来看最直接的目标。但这只是我们的 baseline,接下来会把 HTAP 逐渐升级到 HSTAP,这就是我演讲中提到的 transform 能力,这个对于整个 HTAP 布局的成功应该说是至关重要的。

     

    InfoQ:近几年,我们能看到国内数据库行业的发展是非常迅猛的,无论是在创新、差异化还是生态方面,大家都开始“卷”起来了。若想在国内数据库市场中拉开更具竞争的格局,您觉得需要在哪些方面持续投入?

     

    张颖峰:我倒不认为这是卷起来,因为相对 To C,中国 To B 的发展一直处于比较弱势的局面,目前大家也都意识到了这个问题,都希望 To B 能够成长起来,而 To B 成长起来最应该做到各层次的标准化,数据库首当其冲就应该先标准化起来。


    因此,数据库作为 To B 行业的一个先锋领域,如果有更多厂商能够一起进入到这个行业,把这个行业真得做大,可能是更加重要的一件事情。我们非常高兴看到有那么多伙伴能关注数据库革新与发展,并有越来越多的人加入,共建优良的数据生态。矩阵起源也很高兴一起贡献力量,未来,我们也会基于 MatrixOne 培养和建设整个数据大生态。

     

    然而,要想把这个领域做大需要多方面投入。站在我们自身的角度出发,对人才一直有更进一步的需求。我们需要更多对基础架构,对底层领域熟悉的人才参与进来。尤其是站在整个 To B 行业来说,这个行业为什么发展难,因为全部都是定制化的,若想在这个过程中帮助到企业,也能够培养他们自己的数字化人才,这其实也是一件双赢的事情。

    公众号推荐:

    跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

    2022-12-02 11:395415

    评论

    发布
    暂无评论
    发现更多内容

    「你说,PC做」AIGC智能体产品化时代到来

    ToB行业头条

    生成式AI掀起创意革命

    百度开发者中心

    人工智能 文心一言

    mac电脑必备:Paste for Mac(剪切板管理工具) v3.1.5直装版

    mac

    苹果mac Windows软件 Paste 剪切板管理工具

    龙举云兴|顶级项目 Apache InLong 核心技术探秘

    腾讯云大数据

    Apache

    三分钟上手!一文看懂 Git 的底层工作原理

    高端章鱼哥

    git

    软件测试 |web测试—截获和修改POST请求

    测吧(北京)科技有限公司

    深入探索智能未来:文本生成与问答模型的创新融合

    汀丶人工智能

    自然语言处理 文本生成

    异常追踪频道与 IM 双向互动

    观测云

    可观测性用观测云 异常追踪

    九科信息成功中标中国核动力研究设计院安全自动化应用开发项目

    九科Ninetech

    生成式AI:内容创作的新革命

    百度开发者中心

    生成式AI引领视频制作创新

    百度开发者中心

    人工智能 视频 文心一言

    5个实用的 Vue 技巧

    这我可不懂

    Vue 技巧 代码编写

    社交软件源码的核心,IM即时通讯技术

    山东布谷网络科技

    源码 IM

    【墨菲安全实验室】企业微信私有化2.5-2.6.93版本后台API未授权访问漏洞

    墨菲安全

    网络安全 安全 企业微信 漏洞分析

    【墨菲安全实验室】jeecg-boot/积木报表基于H2驱动的任意代码执行漏洞

    墨菲安全

    网络安全 安全 漏洞 JeecgBoot MPS-bjs4-n6dm

    中小企业数字化转型系列研究——CLM测评报告

    向量智库

    生成式AI助力中国汽车产业发展

    百度开发者中心

    人工智能 汽车 文心一言

    机器学习完整路径

    木南曌

    机器学习

    在 React 中获取数据的6种方法

    互联网工科生

    JavaScript React Promise

    生成式AI的数据需求与保障

    百度开发者中心

    人工智能 文心一言

    生成式AI:改变生活与工作的未来力量

    百度开发者中心

    人工智能 文心一言

    生成式AI助力搜索应用创新

    百度开发者中心

    人工智能 百度文心一言

    软件测试 | 以编程方式对时间值进行编码

    测吧(北京)科技有限公司

    测试

    生成式AI:企业创新与效率的新引擎

    百度开发者中心

    人工智能 文心一言

    生成式AI助力开发者创新

    百度开发者中心

    人工智能 百度文心一言

    Python案例|Pandas正则表达式

    TiAmo

    Python pandas 数据清洗

    一次网络不通"争吵"引发的思考

    阿里巴巴云原生

    阿里云 云原生

    解锁数据潜力:信息抽取、数据增强与UIE的完美融合

    汀丶人工智能

    人工智能 自然语言处理 信息抽取

    【墨菲安全实验室】jeecg-boot/积木报表基于SSTI的任意代码执行漏洞

    墨菲安全

    漏洞 jeecg-boot MPS-4hzd-mb73

    生成式AI:游戏研发的新革命

    百度开发者中心

    人工智能 文心一言

    软件测试 | web测试-辨别时间格式

    测吧(北京)科技有限公司

    测试

    如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰_数据库_郑思宇_InfoQ精选文章