大数据

关注
收录了大数据频道下的 10522 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
借助 Cortex Code 加速构建:全面开放,轻松应对更复杂任务 | 技术趋势
借助 Cortex Code 加速构建:全面开放,轻松应对更复杂任务 | 技术趋势

现在每位 Snowflake 用户都可以在其安全且受治理的 Snowflake 环境中,直接使用 Cortex Code。

试点走向规模化盈利:生成式 AI 与智能体 AI 的 ROI 兑现路径 | 技术趋势
试点走向规模化盈利:生成式 AI 与智能体 AI 的 ROI 兑现路径 | 技术趋势

在生成式 AI 和智能体方面进行战略投资的企业,正在实现规模化加速并获取真实利润。

智能体企业架构浮现:数据、模型、系统之外的控制平面| 技术趋势
智能体企业架构浮现:数据、模型、系统之外的控制平面| 技术趋势

要有效驾驭智能体技术,企业所需要的不仅是模型和应用,还需要一个协调层——即一个中央控制平面,用于统一调配企业内的智能、数据、策略与执行,从而实现智能体之间的协同。

Postgres AI:从 RAG 技术到价值变现的蜕变 | BUILD 2025
Postgres AI:从 RAG 技术到价值变现的蜕变 | BUILD 2025

为何 Postgres 堪称数据团队拥抱 AI 的终极武器?Snowflake Postgres 又如何为开发者提供开箱即用的生产级解决方案?我们将重点剖析其保持强大适应性的核心特性!

基于开源 Arctic 模型强大的Text To SQL | BUILD 2025
基于开源 Arctic 模型强大的 Text To SQL | BUILD 2025

如何基于 Snowflake 开源的 Arctic Text2SQL R1 7B 模型构建一个智能体:它能解析包含多个维度的复杂问题,并将其转换为针对数据集的准确高效 SQL 查询。我们还将现场演示如何通过 LlamaIndex 的 Workflows 数据编排抽象层,像搭积木般轻松设计智能体工作流。

启动快人一步,扩展智高一筹:在 AI 数据云上打造你的下一个智能应用 | BUILD 2025
启动快人一步,扩展智高一筹:在 AI 数据云上打造你的下一个智能应用 | BUILD 2025

全面了解 Snowflake 最新的应用开发能力:包括 Native App Framework 在 Shareback、应用可组合性等方面的大幅升级,以及专为托管类应用打造的更强多租户能力。

开源 Snowflake AI 工具包:数据云中的 AI 创新实践 | BUILD 2025
开源 Snowflake AI 工具包:数据云中的 AI 创新实践 | BUILD 2025

如果你正在寻找一种快速有效实践 Snowflake AI 功能的动手方式,本次分享正是为您量身定制!从编写简单的提示到在无代码环境中使用 Snowflake Cortex 功能(如文本生成、混合搜索、RAG)等)构建完整的智能体工作流,让你可以在几分钟内从想法过渡到原型。

解锁 Snowflake Intelligence, 释放数据潜能 | BUILD 2025
解锁 Snowflake Intelligence, 释放数据潜能 | BUILD 2025

Snowflake Intelligence 全新发布!这款强大工具能助力企业将所有数据转化为实际行动。它支持您使用自然语言对结构化与非结构化数据进行提问,从而即时获取深度洞察并触发工作流,让数据与商业成果之间不再有距离。

新动向:新一代数据产品 | BUILD 2025
新动向:新一代数据产品 | BUILD 2025

学习如何运用最新数据共享功能——包括 Iceberg 共享、语义视图共享、声明式共享、再共享等——来构建、管理并普及业务就绪的数据产品,从而驱动关键业务计划。

新动向:Analytics 更新 | BUILD 2025
新动向:Analytics 更新 | BUILD 2025

准备释放数据的全部潜能了吗? 探索 Snowflake 如何让迁移至 AI 数据云变得前所未有的轻松。通过演示,独家预览我们最新的 AI 驱动 BI 与交互式分析能力,看如何迅速获取深度洞察。同时了解我们是如何在提升价格与性能的同时实现这一切的。

Snowsight 新功能一览:您的数据工作基石 | BUILD 2025
Snowsight 新功能一览:您的数据工作基石 | BUILD 2025

Snowsight 是 Snowflake 专为端到端数据工作打造的用户界面层,我们一直致力于将它打造成您处理数据工作的理想平台。你将收获工程副总裁 Vik Gupta 作为前客户和终端用户的亲身经历与独家见解。

聚焦 Spring Framework 7 与 Spring Boot 4:Spring 团队专访
聚焦 Spring Framework 7 与 Spring Boot 4:Spring 团队专访

InfoQ 近日采访了 Spring 团队核心成员,围绕 Spring Framework 7 和 Spring Boot 4 的架构与功能升级展开交流,重点谈及原生集成重试、并发限流等核心弹性能力,以及模块化自动配置带来的性能优化。

Airbnb 将高吞吐指标采集管道迁移至 OpenTelemetry
Airbnb 将高吞吐指标采集管道迁移至 OpenTelemetry

Airbnb 可观测性工程团队发布详细的大规模迁移方案,新系统在生产环境中每秒可处理超过 1 亿条指标样本。

Agent 下一战,决胜“记忆”之巅——AICon 深度专题前瞻
Agent 下一战,决胜“记忆”之巅——AICon 深度专题前瞻

AICon 我们邀请到了来自 EverMind、MemVerge 和 OPPO 的三位专家。他们将分别从操作系统级长期记忆架构、独立于模型的 AI Memory 中间件、以及端云协同的全模态记忆工程三个硬核维度,为您呈现一场关于 Agent 的技术分享。

开源安全工具 Trivy 遭供应链攻击,引发行业紧急响应
开源安全工具 Trivy 遭供应链攻击,引发行业紧急响应

一款被广泛使用的开源漏洞扫描工具 Trivy 最近发生了一起重大安全事件,暴露了软件供应链中的关键风险。维护团队确认,一个恶意版本曾短暂被分发给用户。这起事件由 Aqua Security 在 GitHub 讨论中披露。信息显示,攻击者成功发布了一个被篡改的版本,可能导致下游系统面临凭证泄露和恶意代码执行的风险。

Kubescape 4.0为Kubernetes带来运行时安全和AI智能体扫描
Kubescape 4.0 为 Kubernetes 带来运行时安全和 AI 智能体扫描

开源的 Kubernetes 安全平台 Kubescape 4.0 版本正式发布,该版本新增了运行时威胁检测功能以及一系列 AI 时代的安全特性。这是该项目在原有扫描能力基础上,首次针对 AI 智能体自身安全展开防护。

Uber Hive联邦架构:1.6万数据集、10PB数据去中心化,支撑大规模分析零停机
Uber Hive 联邦架构:1.6 万数据集、10PB 数据去中心化,支撑大规模分析零停机

Uber 对其 Hive 数据仓库实施去中心化改造,采用基于指针的联邦架构完成超 1.6 万个、总量超 10PB 数据集迁移,实现零停机、严格权限管控与治理优化,为分析及机器学习业务提供可独立扩展的领域化数据集。

Aspire 13.2 正式发布,带来扩展版 CLI、预览版 TypeScript AppHost 及仪表盘改进
Aspire 13.2 正式发布,带来扩展版 CLI、预览版 TypeScript AppHost 及仪表盘改进

上月底,微软发布了 Aspire 13.2,为其云原生开发技术栈带来了大量的更新。这次发布主要致力于提升命令行体验、扩展多语言支持,为开发者和 AI 编码代理简化本地开发流程。

GitHub Actions 正式发布自定义 Runner 镜像
GitHub Actions 正式发布自定义 Runner 镜像

GitHub 刚刚宣布,其托管 Runner 现已支持自定义镜像。借助这一功能,团队可以使用经过 GitHub 批准的基础镜像,构建真正符合其工作流需求的虚拟机镜像。

Anthropic 因 npm 源映射文件意外泄露 Claude Code 源码
Anthropic 因 npm 源映射文件意外泄露 Claude Code 源码

Claude Code CLI 因 npm 包误打包源映射文件导致完整 TypeScript 源码泄露,曝光了未发布功能、内部模型代号及多智能体调度架构。

BUILD 2025 主题演讲:实现 AI 规模化影响力
BUILD 2025 主题演讲:实现 AI 规模化影响力

探索当前即可投入生产的最新 AI 创新技术,聆听客户的成功实践,观看真实的实战演示。您将了解从业者如何轻松运用最新的 AI 能力,实现企业级规模驱动效率、生产力与商业价值的全面提升。

TigerFS:将 PostgreSQL 数据库挂载为文件系统,面向开发者与 AI 智能体
TigerFS:将 PostgreSQL 数据库挂载为文件系统,面向开发者与 AI 智能体

TigerFS 是一款实验性的文件系统,可将数据库挂载为目录并将文件直接存储于 PostgreSQL 中。它通过标准文件系统接口开放数据,让开发者与 AI 智能体无需借助 API 或 SDK,即可使用 ls、cat 等常见 Unix 工具直接交互。

大规模替换数据库序列,保障百余个服务平稳运行
大规模替换数据库序列,保障百余个服务平稳运行

本文围绕关系数据库迁移 NoSQL 的难点展开,聚焦唯一标识所需的数据库序列,介绍了基于 DynamoDB 和双层缓存架构构建的新型序列服务。

“随选随配”的自定义区域:Cloudflare 推出细粒度数据驻留控制
“随选随配”的自定义区域:Cloudflare 推出细粒度数据驻留控制

Cloudflare 最近推出了自定义区域,这是对其区域服务的一次扩展,让客户可以精确定义数据在哪些地方被处理。通过按国家或地区选择特定的数据中心组合,客户可以确保 TLS 终止和应用层处理始终发生在指定的地理范围内,从而满足合规和数据控制需求。

HashiCorp Vault 1.21 带来 SPIFFE 认证、细粒度密钥恢复等新特性
HashiCorp Vault 1.21 带来 SPIFFE 认证、细粒度密钥恢复等新特性

HashiCorp 发布了 Vault 1.21。这个版本为非人类的工作负载引入了原生 SPIFFE 认证,扩展了在 Vault 1.20 中推出的细粒度密钥恢复模型,并新增了 KV v2 密钥归属信息、MFA TOTP 自助注册、一个 Vault Secrets Operator 的 CSI 驱动(可以把密钥直接挂载到 Pod 中且不落盘到 etcd),以及其他多项改进。

实验性 Web Install API 试图改进应用发现与分发方式
实验性 Web Install API 试图改进应用发现与分发方式

一个新的实验性 Web Install API 目前已在微软 Edge 和 Chrome 中进入 Origin Trial(源试用)阶段。这个 API 允许开发者在应用内部的用户交互中,以编程方式触发 PWA 的安装提示。它的目标是简化软件的发现和分发流程,尤其适用于那些不知道浏览器地址栏里有安装图标,或者平时不使用应用商店的用户。

利用 Snowflake Cortex AI 能力,打造高效 IPO 研究智能体 | 技术实践
利用 Snowflake Cortex AI 能力,打造高效 IPO 研究智能体 | 技术实践

本快速入门指南旨在指导您构建一个 IPO 研究智能体,该智能体充分利用 Snowflake Cortex 的核心功能。

Snowpark Connect 完全指南:PySpark 作业执行与生产数据管道构建 | 技术实践
Snowpark Connect 完全指南:PySpark 作业执行与生产数据管道构建 | 技术实践

本综合指南将带您深入了解 Snowpark Connect 如何在 Snowflake 基础设施上高效执行 PySpark 作业,并掌握构建可用于生产环境的数据管道的方法。

AWS S3 推出账户级区域命名空间,结束存在长达 18 年之久的全局存储桶名称冲突
AWS S3 推出账户级区域命名空间,结束存在长达 18 年之久的全局存储桶名称冲突

近日,亚马逊云科技宣布为 S3 通用存储桶推出账户级区域命名空间,解决了困扰开发者 18 年之久的一个限制性问题——全局存储桶名称冲突。

绿色 IT :如何减轻 AI 对环境的影响
绿色 IT :如何减轻 AI 对环境的影响

AI 对绿色 IT 提出了重大挑战:每次查询都会消耗大量的能源,GPU 芯片的使用寿命仅为 2-3 年,而且用户看不到相关成本。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    暂无签名

  • 用户头像
    关注

    暂无签名

    AI 时代超级个体的做事方法论
    AI 时代超级个体的做事方法论

    沈斌 | 众安银行 技术委员会主席

    立即下载
    金山云:大模型推动知识工作领域的创新与变革

    陈海彪 | 金山云 人工智能产品中心总经理

    立即下载
    Coding Agent在企业大规模落地的实践与挑战

    颜志杰 | 百度 资深架构师

    立即下载