大数据

关注
收录了大数据频道下的 10299 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
得物新一代可观测性架构:海量数据下的存算分离设计与实践
得物新一代可观测性架构:海量数据下的存算分离设计与实践

目录一、引言二、Kafka 的演进:AutoMQ 存算分离的创新与实现 Apache Kafka 在大规模数据下的挑战

扩展可观测性平台至 100 PB:通过拥抱宽事件并替换 OTel 实现突破
扩展可观测性平台至 100 PB:通过拥抱宽事件并替换 OTel 实现突破

越来越多的团队正在将 ClickHouse 用于可观测性场景,并惊喜地发现可以以极低的成本存储和查询海量数据。

Databricks为Apache Spark提供了Spark声明式管道
Databricks 为 Apache Spark 提供了 Spark 声明式管道

在 6 月 10 日至 12 日于美国旧金山举行的 Databricks Data+AI 峰会上,Databricks 宣布将 Delta Live Tables(DLT)背后的技术贡献给 Apache Spark 项目,这个项目中,它将被称为 Spark 声明式管道(Spark Declarative Pipelines)。这一举措将使 Spark 用户更容易开发和维护流式管道,并进一步体现了 Databrick 对开源的承诺。

腾讯云与 Gartner 联合发布“Data+AI”白皮书,各行业领军企业分享最佳实践
腾讯云与 Gartner 联合发布“Data+AI”白皮书,各行业领军企业分享最佳实践

过去二十年,数据平台的发展随着互联网时代的崛起而不断加速。BigTable,奠定了现代大数据技术的基石。

计算引擎焕新:MySQL 8.0 内核 + 分布式增强,兼容性与功能双突破
计算引擎焕新:MySQL 8.0 内核 + 分布式增强,兼容性与功能双突破

计算引擎焕新:MySQL 8.0 内核 + 分布式增强,兼容性与功能双突破

敏态数据难题:传统分库分表的弹性瓶颈与 TDstore的破局之道
敏态数据难题:传统分库分表的弹性瓶颈与 TDstore 的破局之道

敏态数据难题:传统分库分表的弹性瓶颈与 TDstore 的破局之道

TDSQL PG 性能优化全景:从分布式交互到单核效率,三维突破实现极致提速
TDSQL PG 性能优化全景:从分布式交互到单核效率,三维突破实现极致提速

TDSQL PG 性能优化全景:从分布式交互到单核效率,三维突破实现极致提速

独家干货!Apache Iceberg未来蓝图:Open Lakehouse闭门会核心洞察
独家干货!Apache Iceberg 未来蓝图:Open Lakehouse 闭门会核心洞察

说它独特,首先是因为这不是一场对公众开放的会议,而是在 Databricks 的协助和组织下,专门面向全球各大主流数据开源社区核心贡献者、Committer 和 PMC 成员的闭门邀请制(invite-only)峰会。

Data + AI ,下一代数智平台建设指南Data + AI ,下一代数智平台建设指南
Data + AI ,下一代数智平台建设指南

AI 决定了产业跃迁的速度,而数据则决定了企业能达到的最终高度。

与 ClickHouse MCP 的集成:打造面向智能体的高效数据体验
与 ClickHouse MCP 的集成:打造面向智能体的高效数据体验

我们正看到一个趋势:LLM 正在帮助每个人扩展自己的技能边界 —— 软件工程师能处理更多数据任务,数据工程师能更深入参与开发流程。

AI 正在批量 “创建” 数据库:一场由 Agent 引发的千亿级数据架构革命
AI 正在批量 “创建” 数据库:一场由 Agent 引发的千亿级数据架构革命

AI Agent 掀起数据库革命,三十年数据架构体系正遭瓦解。

数据库厂商入局AI又有新思路,OceanBase选择“卖铲子”
数据库厂商入局 AI 又有新思路,OceanBase 选择“卖铲子”

在国产独立数据库厂商中,OceanBase 是一个独特的存在,他们入局虽晚,但进展迅速,并且有着非常鲜明的“性格特征”。

解码TDSQL内核之分布式 MySQL 架构的成熟进阶与革新实践
解码 TDSQL 内核之分布式 MySQL 架构的成熟进阶与革新实践

TDSQL MySQL 引擎即将迎来全新版本的架构更新,使得在分布式模式下用户可以体验完善的 MySQL 兼容性,更智能的优化器,更灵活的分片管理和更好的 SQL 特性支持。

探秘TDSQL TDStore:分布式KV存储引擎核心技术架构与优化之道
探秘 TDSQL TDStore:分布式 KV 存储引擎核心技术架构与优化之道

TDStore 引擎作为新一代腾讯云原生分布式数据库产品,其存储引擎采用了 LSM-tree 结构,具有低存储成本的优势。

TDSQL PG版本“开挂”:分布式性能飙升,攻克扩展性优化难题
TDSQL PG 版本“开挂”:分布式性能飙升,攻克扩展性优化难题

通过对分布式交互上的全面优化,TDSQL PG 再性能方面有了巨大的提升。

MariaDB LTS年度发布集成了向量搜索
MariaDB LTS 年度发布集成了向量搜索

新版本引入了集成的向量搜索功能,适用于 AI 驱动和相似性搜索应用程序,增强了 JSON 功能,并提供了用于数据历史和审计的时态表。

重磅发布 ClickStack:基于 ClickHouse 的高性能开源可观测性栈
重磅发布 ClickStack:基于 ClickHouse 的高性能开源可观测性栈

构建的全新开源可观测性(Observability)解决方案。提供日志、指标、链路追踪和会话回放等功能的全套体验,即装即用,性能强劲,架构开放,人人可用。

传统数据仓库正在被 Agentic AI 吞噬?Agentic Data Stack 初探
传统数据仓库正在被 Agentic AI 吞噬?Agentic Data Stack 初探

Snowflake 换 CEO,不只是人事变动,而是数据架构的时代信号:数仓黄金时代正在谢幕,Agentic Data Stack 正在登场。

HTAP:统一数据库系统的兴衰?
HTAP:统一数据库系统的兴衰?

Zhou Sun 最近的文章《HTAP 已死》在数据社区引发了一场关于 HTAP 未来的辩论。

作业帮基础观测能力之三日志体系建设
作业帮基础观测能力之三日志体系建设

目前作业帮有着数千个线上服务,所有服务的日志高峰流量可以达到 5000W+ 条 /S,每天生成的日志大小在 PB 级。

4 年融 1 亿美金,ProtonBase 王绍翾揭秘 Data Warebase 核心技术
4 年融 1 亿美金,ProtonBase 王绍翾揭秘 Data Warebase 核心技术

小质科技 团队历时 4 年打造的 ProtonBase ,堪称“六边形战士”

Amazon Aurora DSQL正式版本发布:分布式、兼容PostgreSQL的无服务器数据库
Amazon Aurora DSQL 正式版本发布:分布式、兼容 PostgreSQL 的无服务器数据库

亚马逊最近宣布了 Amazon Aurora DSQL 的全面可用性,这是一个与 PostgreSQL 兼容的无服务器分布式数据库。这项新的托管服务旨在支持双活高可用性和多区域强一致性。

专访小质科技 | ProtonBase 这匹“黑马” 如何搅动数据库市场?
专访小质科技 | ProtonBase 这匹“黑马” 如何搅动数据库市场?

当一位操盘过 Facebook 在线 Infra、阿里搜索数据和机器学习平台、阿里云实时计算平台,以及达摩院机器智能工程的技术领军人,带着 1 亿美金融资与团队杀入市场,数据库行业的游戏规则注定要被颠覆。

Databricks × Snowflake 纷纷下注,PostgreSQL 成 AI 时代数据库标准?
Databricks × Snowflake 纷纷下注,PostgreSQL 成 AI 时代数据库标准?

本文将结合其多年来对数据基础设施的实践与反思,深入探讨生成式 AI 时代对数据系统提出的全新挑战与潜在机遇。

ClickHouse发起十亿JSON文档挑战,性能完胜MongoDB、PostgreSQL、ES和DuckDB等数据库
ClickHouse 发起十亿 JSON 文档挑战,性能完胜 MongoDB、PostgreSQL、ES 和 DuckDB 等数据库

在本文中,我们将 ClickHouse 的 JSON 实现与其他支持 JSON 的数据存储方案进行对比,测试结果可能会让你大吃一惊。

技术更新 or 组织重塑,企业如何用好“数据智能”?
技术更新 or 组织重塑,企业如何用好“数据智能”?

在 Chat BI 落地过程中,既要关注模型训练的科学性,也必须重视底层数据是否适配 AI 应用需求。

告别 CVE?欧洲漏洞数据库 EUVD 正式上线
告别 CVE?欧洲漏洞数据库 EUVD 正式上线

欧盟网络安全局(ENISA)近日推出欧洲漏洞数据库(EUVD)的测试版,这一全新公共平台将与广泛使用的通用漏洞披露系统(CVE)并行运作但保持独立。该平台是为提升欧盟内部漏洞处理的协调性与透明度。

Have I Been Pwned 2.0添加了新的数据泄露监控工具
Have I Been Pwned 2.0 添加了新的数据泄露监控工具

在接受 InfoQ 采访时,Hunt 强调自动化、家庭账户注册和改进的企业工作流程是接下来的重点,同时呼吁整个行业加强泄露披露的规范。

OpenSearch 3.0现已正式发布,重点关注向量数据库的性能和可扩展性
OpenSearch 3.0 现已正式发布,重点关注向量数据库的性能和可扩展性

OpenSearch 软件基金会宣布 OpenSearch 3.0 正式发布,这是三年来的第一个主要版本,也是该项目加入 Linux 基金会以来的第一个版本。这个版本引入了对模型上下文协议(MCP)的原生支持,以及基于拉取(pull-based)的数据摄取和 gRPC 支持,旨在提高可扩展性和集成性。

加速 AI 推理与检索生成:在 PB 级数据湖上实现 Parquet 查询 1000 倍性能提升|AICon北京
加速 AI 推理与检索生成:在 PB 级数据湖上实现 Parquet 查询 1000 倍性能提升|AICon 北京

直接从 S3 查询 PB 到 EB 级规模的数据湖面临速度挑战,延迟时间通常从数百毫秒到数秒不等。

    大模型安全挑战与实践:构建 AI 时代的安全防线
    大模型安全挑战与实践:构建 AI 时代的安全防线

    Sunny Duan | 京东 信息安全部 AI 安全负责人

    立即下载
    破解病历质控难题:医疗大模型质控优化策略

    凌鸿顺 | 惠每科技 算法专家

    立即下载
    腾讯云云原生分布式云落地与实践

    汝英哲 | 腾讯云 容器高级产品经理

    立即下载