写点什么

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京

  • 2025-03-30
    北京
  • 本文字数:1032 字

    阅读完需:约 3 分钟

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百度智能云高级架构师曹彪已确认出席并发表题为《百度沧海·存储:新一代元数据架构体系设计与实践》的主题分享。在 AI 时代,云存储系统面临着海量数据的挑战,其中元数据管理成为扩展性和性能瓶颈的关键所在。从传统的单机元数据服务到通用分布式数据库,再到如今的专用数据库解决方案,百度沧海存储团队经历了数次元数据管理的范式转变。本次演讲将深入探讨 TafDB 的设计理念、技术架构和实践效果,分享如何通过自研专用分布式数据库解决大规模存储系统的元数据管理难题。



曹彪是百度智能云高级架构师,云存储技术底座团队技术负责人。自 2014 年加入百度以来,一直聚焦于基础架构领域,带领团队从 0 到 1 构建了百度沧海·存储的元数据新架构体系。这一新架构已在百度沧海·存储的对象存储 BOS、文件系统 CFS 以及百度内部的类 HDFS 分布式文件系统 AFS 大规模应用,显著提升了系统的扩展性和性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 元数据管理的痛点与挑战

  • 分布式存储系统中的元数据挑战

  • 通用分布式数据库在元数据管理领域的局限性


2. 设计理念与系统架构

  • 设计理念

  • 系统架构


3. 核心技术与优化策略

  • 消除单目录操作的分布式事务

  • 元数据感知的乐观并发控制

  • 生命周期感知的垃圾回收


4. 实践效果

  • 相比通用方案的性能对比

  • 生产规模

5. 经验总结

  • 跨团队协作与系统协同设计

  • 领域专用设计的必要性

6. 未来展望


演讲亮点

  • 架构创新:分享 TafDB 基于 meta-aware 的设计理念的架构创新

  • 工程实践:分享 TafDB 在百度大规模生产环境中的部署经验


听众收益

  • 了解分布式存储系统中元数据管理的挑战与解决方案

  • 获得可直接借鉴的工程实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


报名或了解详情可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-30 12:265495

评论

发布
暂无评论

终端闲思录(2)- 终端的源流嬗变

蓬蒿

终端 终端仿真

一套分布式IM即时通讯系统的技术选型和架构设计

JackJiang

网络编程 即时通讯 IM

软件测试/测试开发|一文详解Linux grep命令

霍格沃兹测试开发学社

2023年度技术卓越奖名单揭晓,天翼云TeleDB数据库荣誉上榜

编程猫

营销科学AIA:汽车企业坚定长期主义的秘密武器

新消费日报

AI原生企业级Agent构建平台具备哪些特性?一篇文章看明白

王吉伟频道

生成式AI AI Agent AI智能体 数据飞轮 Agent构建

苏宁易购商品详情API:电商实时数据

Noah

轻应用市场兵分小程序快应用两路,熟好熟坏?

Onegun

小程序 小程序容器 轻应用 快应用

同事突然问我:异步网络请求编码的方法

华为云开发者联盟

开发 华为云 华为云开发者联盟

数据库编程大赛:一条SQL计算扑克牌24点

NineData

数据库 sql SQL开发 NineData 编程大赛

Java第一个程序——Hello,World!

小魏写代码

深度解析英特尔,以全方位产品技术创新,助大语言模型应用落地

E科讯

深度解析阿里巴巴API,关键字搜索和商品详情接口

tbapi

阿里巴巴API接口 阿里巴巴商品列表数据接口 阿里巴巴商品详情接口 阿里巴巴数据采集 阿里巴巴商品数据API

大厂面试题集合之阿里一面[1]

派大星

Java 面试题

强烈推荐的前端学习资源,先收藏!

伤感汤姆布利柏

前端 工具

高级数据库数据安全保障方法就是使用靠谱的工具!

行云管家

数据库 数字化 数据安全 数据安全运维

软件测试/测试开发|Python selenium CSS定位方法详解

霍格沃兹测试开发学社

聚焦“工程师文化”,TDengine 创始人陶建辉在 TOP100Summit 上发表演讲

TDengine

tdengine 时序数据库

打造高效用户旅程:埋点分析系统的实操指南

ClkLog

开源 埋点分析系统

HarmonyOS应用事件打点开发指导

HarmonyOS开发者

HarmonyOS

软件测试/测试开发|测试用例设计方法——边界值

霍格沃兹测试开发学社

一键在线获取APP公钥、包名、签名及备案信息方法介绍

Geek_66e2f3

AI Native工程化:百度App AI互动技术实践

百度Geek说

人工智能 大数据 12 月 PK 榜 Prompt

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京_百度_QCon全球软件开发大会_InfoQ精选文章