用过去的智慧引导 AI 变革,《架构师 2024 年(第二季)》开放下载。 了解详情
写点什么

如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰

  • 2022-12-02
    北京
  • 本文字数:3067 字

    阅读完需:约 10 分钟

如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰

6 月 17 日,极客时间《企业级 Agents 开发实战营》正式上线,10 周掌握企业级 Agents 从设计、开发到部署全流程。

入行近 20 年,张颖峰先后负责搜索引擎内核、大数据系统、分布式高可用基础架构,一路见证了互联网科技的发展与变迁。回忆创业之初,他便想寻找一种能够将互联网核心技术标准化的载体。直到目前,他仍然在该领域深耕,并担任着矩阵起源创始人兼研发负责人一职。

 

恰逢 2022 QCon 全球软件开发大会·上海站召开之际,InfoQ 记者有幸在活动现场采访到了张颖峰。在采访过程中,他谈到了 HSTAP 这一概念被提出的初衷和背景,以及他对于国产数据库发展现状的理解。

 

以下是视频采访的全部内容,为方便读者查看,视频下方也附上了文字内容。

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    InfoQ:感谢张老师来参加 QCon 全球软件大会上海站,首先请张老师做下自我介绍

     

    张颖峰:我早年从事芯片行业、物理基础设施,后来很快就创业了,创业时我主要做企业信息化软件开发。在这个过程中,我发觉自己其实不太喜欢定制化的策略,也不认为这就是 To B 软件的发展趋势,所以我一直在寻找应用软件中相对标准化的领域,后来我加盟到一家海外创业的搜索引擎公司,我认为这个领域确实是能够做到这一点。在这个公司我做了很长时间,不仅参与了搜索引擎从零到一的完整开发过程,还参与了以搜索引擎为核心的整套互联网业务,包括电商、广告、交友、社区等等。这些业务全部参与过后,我离开了这家公司,又到了多家甲方公司、乙方创业公司等等,在这些公司当中我的角色一样,一直是负责基础架构的建设,包括数据智能建设。


    将近 20 年下来,我的初衷一直没有发生变化,就是想寻找一种在应用软件领域能够标准化的东西,它能够将互联网科技以标准化的方式去展现给一些企业,让企业能够受惠于这些科技,直到最后我发现这种载体只能是数据库,所以我就开始参与创业,创立了矩阵起源这家公司。

     

    InfoQ:矩阵起源所提的 MatrixOne 是面向未来的超融合异构数据库,光是听到这个概念我想就会让很多人眼前一亮,也请您来聊一聊我们打造 MatrixOne 这款产品的初衷、背景?以及我们为何会选择提出 HSTAP 这一概念,希望它解决行业中哪些现存的问题?

     

    张颖峰:刚才我在介绍自己经历的时候也提到了,创业的初衷就是给企业提供一种相对标准化的解决方案,过去我们经历了早期的互联网大爆炸,也经历了后面的移动互联网大爆炸,所以在一开始的互联网早期架构,我们造了最原始的、最简陋的轮子,一直到后面跟随着业务发展,跟上了整个工业界最新的技术,在整个过程当中我们其实一直都围绕 ABC 三个领域去做,就是 AI、大数据、云,这些技术本质上就是互联网科技最核心的体现。

     

    再后面我又进入到传统企业,我发现这些公司想要用到这些互联网科技非常难,根本原因就在于他们缺乏人才的积累和沉淀。如果能够有一种载体把这些互联网核心技术标准化起来,就能帮助其他行业很快地应用起来,这个是创办矩阵起源的初衷。

     

    这个梦想是比较大的,但是所谓千里之行总要从第一步走起,所以我们一开始决定还是先解决企业从信息化到数字化过程中的核心问题,就是它的业务中台和数据中台怎么来建设,怎么样能够以更低的成本建设。所以我们现在提出来“HSTAP”的概念,它分别对应企业的业务中台、企业的数据中台还有数据如何流转。我们希望用一款数据库把企业最基础的业务中台和数据中台以最低的成本建设好,这样企业就不用操心技术上的事情,它只关心自己的业务就可以了。

     

    InfoQ:在选择一款数据库产品时,除了考虑性能、引入成本以外,学习成本也是需要考虑的核心要素之一,想了解下 MatrixOne 对于开发者以及运维人员的学习门槛是怎样的?

     

    张颖峰:我们现在以云上数据库为更主导的方向,对于云上来讲,用户是免运维的;另一方面,我们是开源数据库,我们把数据运行在 Kubernetes 里面,通过对整个弹性架构的屏蔽,尽力屏蔽掉了数据库内部对于外部的复杂度。


    对于开发者来说,他只需要关心自己所用的 SQL 语言是什么就可以了;对于运维人员,特别是云下这里,我们会提供可观测性的平台,支持将数据库内部的一些指标或者日志导出,随时去观测。但这并不意味着我们把这些数据提供出来之后,就把复杂度暴露给用户,这只是帮助用户去做一些监控方面的事情。

     

    InfoQ:您刚才提到在整个研发过程当中相当于把技术难度留给我们团队自己,所以在研发的过程中,我们有遇到过最大的技术挑战是什么?后面是怎么解决的?

     

    张颖峰:我觉得最大的技术挑战其实是联调,就像前面提到的,我们数据库是从头来写,这里面包含三块:一块是我们计算从头开始写,一块是存储引擎也从头开始写,还有一块是架构也需要从头开始搭建。大家分别从头开始去干这件事,最后总要有交汇的时候,这个交汇就比较痛苦,因为不仅仅需要自己组件的联通和稳定,还要确保整条链路从头到尾串下来,这里面需要协调和需要相互协作的事情非常多,这个过程我们前前后后经历了不止一次,这是我们整个开发过程当中遇到的最主要挑战。

     

    后来是怎么解决的呢?实际上也没有太多的秘密,主要是依靠大家的协作意识,很多时候要站在对方角度去看这个问题应该怎么去做,然后通过紧密的沟通和协作,在比较短的时间内把整个流程调通。

     

    InfoQ:MatrixOne 从一开始就坚定地选择了开源这条路,原因是什么?

     

    张颖峰:首先,我们作为一家数据库公司,一定是技术驱动的,开源本质上就比较技术范儿,或者说是工程师范儿一点,这样也可以吸引优秀的人才更愿意加入我们公司。因为对于初创公司来说,招募团队也是件很难的事情,为了让更多的人关注我们,开源也是非常友好的。截止为止,我们已经收到来自开源社区的重要贡献,也有人因为开源加入到了我们团队。

     

    另外就是站在产品角度,让用户能够快速地根据他的诉求不断去试错,他能够体验到跟随一款数据库成长的过程,然后在这个过程当中建立信任感。最后,从开源的本质上来说,它其实是国产数据库技术走向国际舞台过程中,不可或缺的一件事情。我们大家不能总认为开源软件是拿来主义,我们也要回馈社区。

     

    InfoQ:展望明年, MatrixOne 还将有哪些迭代计划?

     

    张颖峰:目前,我们刚刚完成了整个云原生 HTAP 架构的联调,预计在明年让云原生 HTAP 这套体系能够稳定地对用户提供服务。同时,云上数据库托管平台也会同期提供服务,这是我们从中期来看最直接的目标。但这只是我们的 baseline,接下来会把 HTAP 逐渐升级到 HSTAP,这就是我演讲中提到的 transform 能力,这个对于整个 HTAP 布局的成功应该说是至关重要的。

     

    InfoQ:近几年,我们能看到国内数据库行业的发展是非常迅猛的,无论是在创新、差异化还是生态方面,大家都开始“卷”起来了。若想在国内数据库市场中拉开更具竞争的格局,您觉得需要在哪些方面持续投入?

     

    张颖峰:我倒不认为这是卷起来,因为相对 To C,中国 To B 的发展一直处于比较弱势的局面,目前大家也都意识到了这个问题,都希望 To B 能够成长起来,而 To B 成长起来最应该做到各层次的标准化,数据库首当其冲就应该先标准化起来。


    因此,数据库作为 To B 行业的一个先锋领域,如果有更多厂商能够一起进入到这个行业,把这个行业真得做大,可能是更加重要的一件事情。我们非常高兴看到有那么多伙伴能关注数据库革新与发展,并有越来越多的人加入,共建优良的数据生态。矩阵起源也很高兴一起贡献力量,未来,我们也会基于 MatrixOne 培养和建设整个数据大生态。

     

    然而,要想把这个领域做大需要多方面投入。站在我们自身的角度出发,对人才一直有更进一步的需求。我们需要更多对基础架构,对底层领域熟悉的人才参与进来。尤其是站在整个 To B 行业来说,这个行业为什么发展难,因为全部都是定制化的,若想在这个过程中帮助到企业,也能够培养他们自己的数字化人才,这其实也是一件双赢的事情。

    公众号推荐:

    AGI 概念引发热议。那么 AGI 究竟是什么?技术架构来看又包括哪些?AI Agent 如何助力人工智能走向 AGI 时代?现阶段营销、金融、教育、零售、企服等行业场景下,AGI应用程度如何?有哪些典型应用案例了吗?以上问题的回答尽在《中国AGI市场发展研究报告 2024》,欢迎大家扫码关注「AI前线」公众号,回复「AGI」领取。

    2022-12-02 11:395457

    评论

    发布
    暂无评论
    发现更多内容

    有奖活动 | 以代码之名,写出对Ta的爱

    HarmonyOS开发者

    HarmonyOS

    死锁产生的条件及解决方法

    红袖添香

    Java 多线程 死锁

    五种 CSS 位置类型以实现更好的布局

    这我可不懂

    CSS web开发

    在数字化时代的挑战与解决:跨国大文件传输方法

    镭速

    大文件跨国传输 跨国快速传输大文件

    Lightroom下载 图像处理软件Lightroom Classic 2023 mac完美激活版

    mac

    苹果mac Windows软件 Lightroom Classic 2023 lrc2023 数字图像处理软件

    电脑硬件迭代快,对仿真软件有什么影响?

    智造软件

    仿真软件 电脑硬件 结构仿真 电脑配置 硬件配置

    《守望先锋 2》性能提升高达33%!英特尔锐炫从未止步

    E科讯

    用案例带你认识决策树,解锁洞察力

    华为云开发者联盟

    人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

    头脑风暴小工具-影响地图

    Bruce Talk

    敏捷开发 Agile Product Owner 影响地图

    生成式AI:内容创作新革命

    百度开发者中心

    自然语言处理 内容 #人工智能 文心一言

    技术领先的用友iuap平台,助力升级数智化底座、驾驭数智未来

    用友BIP

    2023全球商业创新大会

    生成式AI助力智能未来

    百度开发者中心

    #人工智能 ChatGPT 生成式AI 文心一言

    生成式AI引领未来传媒业发展趋势

    百度开发者中心

    媒体 #人工智能 生成式AI 文心一言

    Easysearch 跨集群复制实战

    极限实验室

    easysearch

    企业国际大数据传输必须了解的5种跨国快速传输大文件工具

    镭速

    大文件传输 跨国传输大数据

    和鲸 × 临床医学丨“人”作为一生命体在 AI for Science 过程中的作用与交互

    ModelWhale

    数据科学 临床医学 AI for Science 交叉学科 临床研究

    分布式数据库架构:高可用、高性能的数据存储

    互联网工科生

    分布式数据库 高性能 高可用性

    容器化微服务:用Kubernetes实现弹性部署

    高端章鱼哥

    Kubernetes 微服务 容器化

    第三周作业

    大肚皮狒狒

    软件测试|人工智能如何帮助测试工程师解决问题?

    霍格沃兹测试开发学社

    低成本生成式AI技术:推动AI普及的关键

    百度开发者中心

    医疗 #人工智能 ChatGPT 文心一言

    2023 年如何将您的应用提交到 App Store

    雪奈椰子

    ios 开发 Windows ios 开发证书

    ​Elastic Stack最佳实践系列:Beats->ES,一个更轻型的架构选择

    腾讯云大数据

    ES

    AI与众包平台共铸新机遇

    知者如C

    生成式AI:全球科技革命的驱动力

    百度开发者中心

    教育 #人工智能 ChatGPT 生成式AI

    华为云GaussDB打造最可信的数据库,给世界一个更优选择

    华为云开发者联盟

    数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

    ETL 小技巧:文件输出插件数据写入空闲时间阈值配置及作用

    大河

    缓冲区 ETL bboss 文件输出

    生成式AI助力高效写作

    百度开发者中心

    大模型 #人工智能 ChatGPT 生成式AI

    又一可视化低代码神器!云耀云服务器L实例正式发布

    mecchi

    软件开发 云主机 云服务器 博客搭建

    软件测试|如何使用ChatGPT生成思维导图

    霍格沃兹测试开发学社

    生成式AI技术市场现状与发展前景展望

    百度开发者中心

    #人工智能 生成式AI 文心一言

    如何用一款数据库解决企业的核心问题?|专访矩阵起源创始人兼研发负责人张颖峰_数据库_郑思宇_InfoQ精选文章