写点什么

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京

  • 2025-03-30
    北京
  • 本文字数:1032 字

    阅读完需:约 3 分钟

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百度智能云高级架构师曹彪已确认出席并发表题为《百度沧海·存储:新一代元数据架构体系设计与实践》的主题分享。在 AI 时代,云存储系统面临着海量数据的挑战,其中元数据管理成为扩展性和性能瓶颈的关键所在。从传统的单机元数据服务到通用分布式数据库,再到如今的专用数据库解决方案,百度沧海存储团队经历了数次元数据管理的范式转变。本次演讲将深入探讨 TafDB 的设计理念、技术架构和实践效果,分享如何通过自研专用分布式数据库解决大规模存储系统的元数据管理难题。



曹彪是百度智能云高级架构师,云存储技术底座团队技术负责人。自 2014 年加入百度以来,一直聚焦于基础架构领域,带领团队从 0 到 1 构建了百度沧海·存储的元数据新架构体系。这一新架构已在百度沧海·存储的对象存储 BOS、文件系统 CFS 以及百度内部的类 HDFS 分布式文件系统 AFS 大规模应用,显著提升了系统的扩展性和性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 元数据管理的痛点与挑战

  • 分布式存储系统中的元数据挑战

  • 通用分布式数据库在元数据管理领域的局限性


2. 设计理念与系统架构

  • 设计理念

  • 系统架构


3. 核心技术与优化策略

  • 消除单目录操作的分布式事务

  • 元数据感知的乐观并发控制

  • 生命周期感知的垃圾回收


4. 实践效果

  • 相比通用方案的性能对比

  • 生产规模

5. 经验总结

  • 跨团队协作与系统协同设计

  • 领域专用设计的必要性

6. 未来展望


演讲亮点

  • 架构创新:分享 TafDB 基于 meta-aware 的设计理念的架构创新

  • 工程实践:分享 TafDB 在百度大规模生产环境中的部署经验


听众收益

  • 了解分布式存储系统中元数据管理的挑战与解决方案

  • 获得可直接借鉴的工程实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


报名或了解详情可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-30 12:265130

评论

发布
暂无评论

新手必看:Bitget Wallet 上购买 ETH 的步骤解析

鳄鱼视界

“CCF 科技成果奖”获奖名单公布,龙蜥荣获技术发明一等奖

OpenAnolis小助手

阿里云 互联网 云原生 龙蜥社区 CCF

只需10分钟!ER图理论知识新手速学

职场工具箱

Proxy下的Prepare透传,让GaussDB(for MySQL)更稳固,性能更卓越

华为云开发者联盟

数据库 后端 华为云 SQL语句 华为云开发者联盟

前端如何防止数据被异常篡改并且复原数据

不在线第一只蜗牛

前端 教程分享

好用到哭!2024年值得你尝试的15款在线画图神器

职场工具箱

适用于即席查询(Ad-Hoc)的OLAP引擎

Western Panda

数据库 大数据 开源 数据分析 OLAP

有关java设置图片DPI

夜的第七章

base64 图片处理 Java’

如何选择一个向量数据库|Qdrant Cloud v.s. Zilliz Cloud

Zilliz

Milvus Zilliz zillizcloud qdrant

覆盖13个行业,数据分类分级标准汇编更新啦!(附下载)

极盾科技

数据分类分级

ARBT阿尔比特共识铸币模式系统开发源码搭建

l8l259l3365

OpenTiny Vue 组件库支持 Vue2.7 啦!

OpenTiny社区

开源 前端 Vue组件库

对话在行人|安恒信息:通过企业数智化建设实现主营业务100%增长

用友BIP

数智化领先实践

新华冶金∣打造业财深度一体化运营模式

用友BIP

调用API接口获取淘宝商品数据:实践指南与代码解析

Noah

Java基础面试题【分布式】三 ZAB协议

派大星

分布式, Java 面试题

解密 deepin-IDE:如何实现简单灵活的调试技术?

nn-30

ide Linux 调试 操作系统 deepin

消息中间件(rocketMQ 和 kafka 区别)

红袖添香

kafka RocketMQ 消息中间件 分布式消息

Embedding技术与应用(3):Embeddings技术的实践应用

Baihai IDP

人工智能 深度学习 AI Embedding 白海科技

王文京:中国智能会计将引领全球会计创新

用友BIP

智能会计

架构实战营 - 模块五作业

王朝阳

架构实战营

简单好用的Xliff文件编辑工具 Xliff Editor激活最新版

胖墩儿不胖y

Mac软件 文件编辑器

区块链开发:区块链和物联网的融合

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

使用Python调用API接口获取淘宝商品数据

Noah

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京_百度_QCon全球软件开发大会_InfoQ精选文章