写点什么

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京

  • 2025-03-30
    北京
  • 本文字数:1032 字

    阅读完需:约 3 分钟

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


百度智能云高级架构师曹彪已确认出席并发表题为《百度沧海·存储:新一代元数据架构体系设计与实践》的主题分享。在 AI 时代,云存储系统面临着海量数据的挑战,其中元数据管理成为扩展性和性能瓶颈的关键所在。从传统的单机元数据服务到通用分布式数据库,再到如今的专用数据库解决方案,百度沧海存储团队经历了数次元数据管理的范式转变。本次演讲将深入探讨 TafDB 的设计理念、技术架构和实践效果,分享如何通过自研专用分布式数据库解决大规模存储系统的元数据管理难题。



曹彪是百度智能云高级架构师,云存储技术底座团队技术负责人。自 2014 年加入百度以来,一直聚焦于基础架构领域,带领团队从 0 到 1 构建了百度沧海·存储的元数据新架构体系。这一新架构已在百度沧海·存储的对象存储 BOS、文件系统 CFS 以及百度内部的类 HDFS 分布式文件系统 AFS 大规模应用,显著提升了系统的扩展性和性能。他在本次会议的详细演讲内容如下:


演讲提纲

1. 元数据管理的痛点与挑战

  • 分布式存储系统中的元数据挑战

  • 通用分布式数据库在元数据管理领域的局限性


2. 设计理念与系统架构

  • 设计理念

  • 系统架构


3. 核心技术与优化策略

  • 消除单目录操作的分布式事务

  • 元数据感知的乐观并发控制

  • 生命周期感知的垃圾回收


4. 实践效果

  • 相比通用方案的性能对比

  • 生产规模

5. 经验总结

  • 跨团队协作与系统协同设计

  • 领域专用设计的必要性

6. 未来展望


演讲亮点

  • 架构创新:分享 TafDB 基于 meta-aware 的设计理念的架构创新

  • 工程实践:分享 TafDB 在百度大规模生产环境中的部署经验


听众收益

  • 了解分布式存储系统中元数据管理的挑战与解决方案

  • 获得可直接借鉴的工程实践经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


报名或了解详情可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-30 12:264662

评论

发布
暂无评论

酷炫3D效果在瘦设备上也能实现?|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」RocketMQ消息发送的全部流程和落盘原理分析

码界西柚

RocketMQ 消息队列 Apache RocketMQ 12月日更

升级过log4j,却还没搞懂log4j漏洞的本质?

华为云开发者联盟

Java log4j 漏洞 JNDI rmi

一站式云安全保障,就用行云管家!完美保障!

行云管家

云计算 云安全 企业上云 云资源 云管理

实用机器学习笔记二十:偏差和方差

打工人!

机器学习 深度学习 算法 学习笔记 12月日更

给弟弟的信第19封|年轻人要注意养生

大菠萝

28天写作

熟悉又陌生的白帽黑客组织OWASP

喀拉峻

黑客 网络安全 安全 OWASP

(转)大数据开发之Hive中UDTF函数

@零度

大数据 hive

CRM系统如何帮助企业改变销售周期

低代码小观

程序员 销售管理 销售 CRM CRM系统

Ajax+SSM实现客户端开发 实现简单的前后端分离

Bug终结者

Java ajax 前后端分离

在线JSON转Csharp工具

入门小站

工具

2021数据技术嘉年华 | OceanBase 技术盛宴ON LINE ,我们不见不散!

OceanBase 数据库

数据库 OceanBase 社区版 技术嘉年华 DTC

从Hadoop框架讨论大数据生态

编程江湖

大数据 hadoop

视频通信中的码率控制算法

拍乐云Pano

音视频 RTC 视频编码 码率控制

「Oracle」数据库字符集编码修改

恒生LIGHT云社区

数据库 oracle

10 个打造 React.js App 的最佳 UI 框架

编程江湖

前端开发

Linux云计算好学吗?Linux云计算运维学习资料,手把手教你学 条件测试语句和流程控制语句的使用

学神来啦

Linux centos Shell if linux云计算

30个类手写Spring核心原理之动态数据源切换(8)

Tom弹架构

Java spring 源码

【等保小知识】等保一级需要测评吗?

行云管家

网络安全 等保 等级保护 等保一级

波卡生态的去中心化存储Crust Network | Hoo虎符研究院

区块链前沿News

波卡生态挖矿 Hoo虎符 虎符交易所 虎符研究院 去中心化存储

2021低代码平台推荐,每一个都具有10年行业开发经验!

J2PaaS低代码平台

低代码 低代码开发 低代码开发平台 地代码平台

语音信号处理 4:汉语中语音的分类及韵律特性

轻口味

28天写作 12月日更

「猿桌派」即将开播,聚焦客户端埋点和大数据分析

融云 RongCloud

大数据 程序员 埋点

从 Discord 看未来社交的「超级群」模式

融云 RongCloud

如何跟踪log4j漏洞原理及发现绕WAF的tips

H

网络安全 漏洞

6000 字干货详解:直播聊天室的无限用户优化

融云 RongCloud

高并发 直播 直播聊天室 海量用户

30个类手写Spring核心原理之自定义ORM(下)(7)

Tom弹架构

Java spring 源码

超市发:多措并举 提振销售 服务顾客

科技热闻

恒源云(GPUSHARE)_[文本分类] 文本数据增强1(论文笔记)

恒源云

深度学习 语音识别

安全漏洞之任意文件上传漏洞分析

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

【MongoDB学习笔记】-使用 MongoDB 进行 CRUD 操作(上)

恒生LIGHT云社区

数据库 mongodb

百度沧海·存储:新一代元数据架构体系设计与实践|QCon 北京_百度_QCon全球软件开发大会_InfoQ精选文章