AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么

大数据

 关注

收录了大数据频道下的 10299 篇内容
讲述数据获取、存储、管理、分析的方方面面，关注软件、实践、生态，挖掘最新的前沿技术，同时也思考大数据与AI和云计算的深度结合。

全部
DataOps
数据集成
DataMesh
数据编织
数据湖仓
在离线混部
实时计算
其他

得物新一代可观测性架构：海量数据下的存算分离设计与实践

目录一、引言二、Kafka 的演进：AutoMQ 存算分离的创新与实现 Apache Kafka 在大规模数据下的挑战

ClickHouse

20 小时前

2008

扩展可观测性平台至 100 PB：通过拥抱宽事件并替换 OTel 实现突破

越来越多的团队正在将 ClickHouse 用于可观测性场景，并惊喜地发现可以以极低的成本存储和查询海量数据。

ClickHouse

07-07

5239

Databricks 为 Apache Spark 提供了 Spark 声明式管道

在 6 月 10 日至 12 日于美国旧金山举行的 Databricks Data+AI 峰会上，Databricks 宣布将 Delta Live Tables（DLT）背后的技术贡献给 Apache Spark 项目，这个项目中，它将被称为 Spark 声明式管道（Spark Declarative Pipelines）。这一举措将使 Spark 用户更容易开发和维护流式管道，并进一步体现了 Databrick 对开源的承诺。

作者：Patrick Farry 译者: 刘雅梦策划: 丁晓昀

07-04

8660

腾讯云与 Gartner 联合发布“Data+AI”白皮书，各行业领军企业分享最佳实践

过去二十年，数据平台的发展随着互联网时代的崛起而不断加速。BigTable，奠定了现代大数据技术的基石。

作者 : 凌敏

07-04

8468



计算引擎焕新：MySQL 8.0 内核 + 分布式增强，兼容性与功能双突破

演讲人: 马晓宇

07-03

7278



敏态数据难题：传统分库分表的弹性瓶颈与 TDstore 的破局之道

演讲人: 韩硕

07-03

6885



TDSQL PG 性能优化全景：从分布式交互到单核效率，三维突破实现极致提速

演讲人: 高铭杰

07-03

5990

独家干货！Apache Iceberg 未来蓝图：Open Lakehouse 闭门会核心洞察

说它独特，首先是因为这不是一场对公众开放的会议，而是在 Databricks 的协助和组织下，专门面向全球各大主流数据开源社区核心贡献者、Committer 和 PMC 成员的闭门邀请制（invite-only）峰会。

吴刚策划: Tina

07-02

3742

Data + AI ，下一代数智平台建设指南

AI 决定了产业跃迁的速度，而数据则决定了企业能达到的最终高度。

作者 : 腾讯云

07-01

3519

与 ClickHouse MCP 的集成：打造面向智能体的高效数据体验

我们正看到一个趋势：LLM 正在帮助每个人扩展自己的技能边界 —— 软件工程师能处理更多数据任务，数据工程师能更深入参与开发流程。

ClickHouse

06-30

3676

AI 正在批量 “创建” 数据库：一场由 Agent 引发的千亿级数据架构革命

AI Agent 掀起数据库革命，三十年数据架构体系正遭瓦解。

ProtonBase

06-30

2691

数据库厂商入局 AI 又有新思路，OceanBase 选择“卖铲子”

在国产独立数据库厂商中，OceanBase 是一个独特的存在，他们入局虽晚，但进展迅速，并且有着非常鲜明的“性格特征”。

作者 : 刘杨楠

06-27

6583



解码 TDSQL 内核之分布式 MySQL 架构的成熟进阶与革新实践

TDSQL MySQL 引擎即将迎来全新版本的架构更新，使得在分布式模式下用户可以体验完善的 MySQL 兼容性，更智能的优化器，更灵活的分片管理和更好的 SQL 特性支持。

演讲人: 马晓宇

06-25

7297



探秘 TDSQL TDStore：分布式 KV 存储引擎核心技术架构与优化之道

TDStore 引擎作为新一代腾讯云原生分布式数据库产品，其存储引擎采用了 LSM-tree 结构，具有低存储成本的优势。

演讲人: 韩硕

06-25

7247



TDSQL PG 版本“开挂”：分布式性能飙升，攻克扩展性优化难题

通过对分布式交互上的全面优化，TDSQL PG 再性能方面有了巨大的提升。

演讲人: 高铭杰

06-25

7256

MariaDB LTS 年度发布集成了向量搜索

新版本引入了集成的向量搜索功能，适用于 AI 驱动和相似性搜索应用程序，增强了 JSON 功能，并提供了用于数据历史和审计的时态表。

作者 : Renato Losio 译者: 刘雅梦

06-21

7447

重磅发布 ClickStack：基于 ClickHouse 的高性能开源可观测性栈

构建的全新开源可观测性（Observability）解决方案。提供日志、指标、链路追踪和会话回放等功能的全套体验，即装即用，性能强劲，架构开放，人人可用。

ClickHouse

06-17

5181

传统数据仓库正在被 Agentic AI 吞噬？Agentic Data Stack 初探

Snowflake 换 CEO，不只是人事变动，而是数据架构的时代信号：数仓黄金时代正在谢幕，Agentic Data Stack 正在登场。

作者 : 郭炜策划: Tina

06-16

4745

HTAP：统一数据库系统的兴衰？

Zhou Sun 最近的文章《HTAP 已死》在数据社区引发了一场关于 HTAP 未来的辩论。

作者 : Renato Losio 译者: 刘雅梦

06-16

4122

作业帮基础观测能力之三日志体系建设

目前作业帮有着数千个线上服务，所有服务的日志高峰流量可以达到 5000W+ 条 /S，每天生成的日志大小在 PB 级。

作者 : 作业帮技术团队策划: 蔡芳芳

06-11

4140

4 年融 1 亿美金，ProtonBase 王绍翾揭秘 Data Warebase 核心技术

小质科技团队历时 4 年打造的 ProtonBase ，堪称“六边形战士”

作者 : Luna

06-10

4486

Amazon Aurora DSQL 正式版本发布：分布式、兼容 PostgreSQL 的无服务器数据库

亚马逊最近宣布了 Amazon Aurora DSQL 的全面可用性，这是一个与 PostgreSQL 兼容的无服务器分布式数据库。这项新的托管服务旨在支持双活高可用性和多区域强一致性。

作者 : Renato Losio 译者: 刘雅梦策划: 丁晓昀

06-10

3872



专访小质科技 | ProtonBase 这匹“黑马” 如何搅动数据库市场？

当一位操盘过 Facebook 在线 Infra、阿里搜索数据和机器学习平台、阿里云实时计算平台，以及达摩院机器智能工程的技术领军人，带着 1 亿美金融资与团队杀入市场，数据库行业的游戏规则注定要被颠覆。

演讲人: 王绍翾

06-10

2678

Databricks × Snowflake 纷纷下注，PostgreSQL 成 AI 时代数据库标准？

本文将结合其多年来对数据基础设施的实践与反思，深入探讨生成式 AI 时代对数据系统提出的全新挑战与潜在机遇。

作者 : 王绍翾策划: 蔡芳芳

06-09

4268

ClickHouse 发起十亿 JSON 文档挑战，性能完胜 MongoDB、PostgreSQL、ES 和 DuckDB 等数据库

在本文中，我们将 ClickHouse 的 JSON 实现与其他支持 JSON 的数据存储方案进行对比，测试结果可能会让你大吃一惊。

ClickHouse 策划: Luna

06-09

4473

技术更新 or 组织重塑，企业如何用好“数据智能”？

在 Chat BI 落地过程中，既要关注模型训练的科学性，也必须重视底层数据是否适配 AI 应用需求。

作者 : AICon 全球人工智能开发与应用大会策划: 罗燕珊

06-06

6021

告别 CVE？欧洲漏洞数据库 EUVD 正式上线

欧盟网络安全局（ENISA）近日推出欧洲漏洞数据库（EUVD）的测试版，这一全新公共平台将与广泛使用的通用漏洞披露系统（CVE）并行运作但保持独立。该平台是为提升欧盟内部漏洞处理的协调性与透明度。

作者 : Renato Losio 译者: 马可薇

06-06

5638

Have I Been Pwned 2.0 添加了新的数据泄露监控工具

在接受 InfoQ 采访时，Hunt 强调自动化、家庭账户注册和改进的企业工作流程是接下来的重点，同时呼吁整个行业加强泄露披露的规范。

作者：Matt Foster 译者: 刘雅梦

06-05

4911

OpenSearch 3.0 现已正式发布，重点关注向量数据库的性能和可扩展性

OpenSearch 软件基金会宣布 OpenSearch 3.0 正式发布，这是三年来的第一个主要版本，也是该项目加入 Linux 基金会以来的第一个版本。这个版本引入了对模型上下文协议（MCP）的原生支持，以及基于拉取（pull-based）的数据摄取和 gRPC 支持，旨在提高可扩展性和集成性。

作者 : Renato Losio 译者: 刘雅梦

06-04

5815