大数据

关注
收录了大数据频道下的 10190 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
Apache Doris 和 SelectDB 精选案例集(2024版)Apache Doris 和 SelectDB 精选案例集(2024版)
Apache Doris 和 SelectDB 精选案例集(2024 版)

为提升企业使用体验、提高选型效率并降低实施风险,飞轮科技推出 Apache Doris 和 SelectDB 精选案例集(2024 版)。该案例集汇集 4 大领域、8+ 分析场景、26+ 标杆企业的成功案例与实践经验。以行业为划分标准,辅以使用场景标签,旨在为读者提供一个高度整合、全面涵盖、分类清晰且易于查阅的学习资源库。

优步完成了主要MySQL集群组的升级,提升了性能和安全性
优步完成了主要 MySQL 集群组的升级,提升了性能和安全性

本文提到了优步将 MySQL 数据库从 5.7 升级到 8.0,提升性能和安全性,耗时一年多,涉及 2100 多个集群和 16000 个节点,实现了高并发下显著的性能提升。

中国存储厂,杀入顶分桌
中国存储厂,杀入顶分桌

成立于 2016 年前后的存储企业,即将迈过十周年的门槛,变得不再年轻。而随生成式 AI 的发展而诞生的新兴存储企业,正逐步进入市场主流视野。

寻找AI最佳实践,InfoQ 2024中国技术力量年度榜单开启
寻找 AI 最佳实践,InfoQ 2024 中国技术力量年度榜单开启

让 AI 的力量被看见!

OceanBase 4.3.3发布,面向AI时代升级向量能力
OceanBase 4.3.3 发布,面向 AI 时代升级向量能力

AI 时代,需要怎样的数据库?

腾讯音乐:从 Elasticsearch 到 Apache Doris 内容库升级,统一搜索分析引擎,成本直降 80%
腾讯音乐:从 Elasticsearch 到 Apache Doris 内容库升级,统一搜索分析引擎,成本直降 80%

为满足更严苛数据分析的需求,腾讯音乐借助 Apache Doris 替代了 Elasticsearch 集群,统一了内容库数据平台的内容搜索和分析引擎。

谷歌建议在 SQL 中增加管道语法
谷歌建议在 SQL 中增加管道语法

本文提到谷歌提出在 SQL 中引入管道语法以提高灵活性和易用性,目前已在 GoogleSQL 和 ZetaSQL 中实现,但社区反馈不一。新语法旨在简化 SQL 查询编写,提高开发效率。

是时候刷新数据部门在券商的存在感了
是时候刷新数据部门在券商的存在感了

数据工作的现状与时代赋予的愿景差距大,如何弥合沟壑?

Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化

从 3.0 系列版本开始,Apache Doris 开始支持存算分离模式,用户可以在集群部署时选择采用存算一体模式或存算分离模式。

优化故障影响分析和变更发布流程
优化故障影响分析和变更发布流程

本文讨论了优化故障影响分析和变更发布流程,强调预防、最小化影响、快速检测和恢复,建议建立沙盒环境、严格代码评审、高测试覆盖率、自动化回滚以减少生产环境错误。

京东零售数据湖应用与实践
京东零售数据湖应用与实践

Lambda 架构的优点是保证了数据的完整性,但缺点是系统的复杂性较高,需要维护两套系统,并且服务层的复杂合并逻辑可能会导致延迟。为了解决数据的完整性和实时性之间的矛盾,京东零售在数据架构上做出了一系列的革新。

揭秘下一代 Data for AI 技术架构,六位专家深度剖析未来趋势 | QCon
揭秘下一代 Data for AI 技术架构,六位专家深度剖析未来趋势 | QCon

就在本周五,QCon 上海落地,为你分享下一代 Data for AI 技术架构探索

InfoQ 2024年趋势报告:人工智能、机器学习和数据工程篇
InfoQ 2024 年趋势报告:人工智能、机器学习和数据工程篇

InfoQ 编辑团队和嘉宾讨论了人工智能、机器学习和数据工程领域的当前趋势。

集成困难、数据低效:AI热潮下,存储该怎么跟上?
集成困难、数据低效:AI 热潮下,存储该怎么跟上?

只要有数据,就需要存储。随着数据处理需求呈指数级增长,许多企业在管理 AI 项目和处理大量数据方面面临着挑战。

统一存储、缩短链路,快手从 Clickhouse 到 Apache Doris 实现湖仓分离向湖仓一体的升级
统一存储、缩短链路,快手从 Clickhouse 到 Apache Doris 实现湖仓分离向湖仓一体的升级

快手通过引入 Apache Doris 湖仓一体能力,替换了 Clickhouse ,升级为湖仓一体架构,并结合 Doris 的物化视图改写能力和自动物化服务,实现高性能的数据查询以及灵活的数据治理。

拐点已至? Kafka 如何破局
拐点已至? Kafka 如何破局

Kafka 项目将走向何方?其生态系统将如何演变,Kafka 在快速发展的 AI 领域中将扮演什么角色?

RAG风口十问:大数据与AI是价值落地还是过度炒作?
RAG 风口十问:大数据与 AI 是价值落地还是过度炒作?

过去一年多,RAG 正成为大数据与 AI 融合的“新宠”。想象一下,当你用 AI 助手快速总结论文或分析数据时,背后可能已经是 RAG 技术在默默发力。

该挤掉“大数据+AI”的泡沫了?
该挤掉“大数据 +AI”的泡沫了?

专家张君侠就 AI 大模型和大数据之间的关系和应用进行了交流。AI 的概念,强调了大数据和 AI 之间的相互促进关系。

数据治理如何转化为业务价值?平安产险的探索与实践解析
数据治理如何转化为业务价值?平安产险的探索与实践解析

通过工具和流程的优化,平安产险制定数据标准的速度提高了 20 倍。

Java 虚拟线程:案例研究
Java 虚拟线程:案例研究

本文探讨了 Java 虚拟线程在云原生 Java 负载中的表现,发现其在 CPU 密集型负载下吞吐量低于传统线程池,但在加速时间上表现更优,同时指出虚拟线程在某些情况下可能存在性能问题,需要进一步与 OpenJDK 社区合作解决。

被黑猴子虐爆了! 索尼 8 年耗资 20 亿打造的巨作,14 天速死,成业内最大笑话!
被黑猴子虐爆了! 索尼 8 年耗资 20 亿打造的巨作,14 天速死,成业内最大笑话!

这次事件无疑会成为业内的警示案例,提醒开发者们在 2024 年如何避免打造出一款失败之作。

完整的数仓能力,ByConity 1.0 版本发布!
完整的数仓能力,ByConity 1.0 版本发布!

2024 年 8 月,ByConity 1.0 正式发布,翻开了 ByConity 新的一页。

作业帮在多云环境下的高可用双活架构优化实践
作业帮在多云环境下的高可用双活架构优化实践

目前,作业帮是多云架构(阿里云、百度云、腾讯云),并同时使用 MySQL、Redis-Cluster、MongoDB、Elastisearch、TiDB 、OceanBase 这几款数据库。

单集群 QPS 超 10w,存储成本降低 70%!招联金融基于 Apache Doris 数仓升级实践
单集群 QPS 超 10w,存储成本降低 70%!招联金融基于 Apache Doris 数仓升级实践

在竞争激烈的消费金融市场中,有效利用海量数据、提升业务运营效率是赢得市场的关键。

卷模型还是做平台?落地企业AI,用友这样做!
卷模型还是做平台?落地企业 AI,用友这样做!

能力来赋能业务、创造价值。正如用友网络副总裁罗小江所说:这个时代不缺技术,缺的是方法体系,缺的是让技术真正意义上融入业务。

GitHub遭遇全球宕机,Copilot也瘫痪了!开发者:今天可以光明正大摸鱼了
GitHub 遭遇全球宕机,Copilot 也瘫痪了!开发者:今天可以光明正大摸鱼了

开发者失望吐槽:太不靠谱,是时候逃离了

Netflix 开源下一代数据工作流引擎 Maestro
Netflix 开源下一代数据工作流引擎 Maestro

Maestro 为 Netflix 的数据科学家与需要大量信息的的业务线经理提供了工作流即服务。

AI+全面升级数智底座,用友发布三大行业垂类大模型
AI+ 全面升级数智底座,用友发布三大行业垂类大模型

8 月 10 日下午,由用友主办的“2024 全球商业创新大会 - 企业数智化技术峰会”,在北京市“中国国际展览中心”隆重召开。

业内首家!火山引擎通过中国信通院超低延时直播性能卓越级评估
业内首家!火山引擎通过中国信通院超低延时直播性能卓越级评估

随着直播行业快速发展,如何让直播内容更快、更清晰、更保真、更流畅地抵达用户,成为直播服务提供商重点关注的问题。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    暂无签名

  • 用户头像
    关注

    GMI Cloud China Marketing Manager

    京东物流下一代仓储管理系统的复杂度治理体系
    京东物流下一代仓储管理系统的复杂度治理体系

    高鹏 | 京东 技术与数据智能部架构师

    立即下载
    云原生架构下中间件联邦高可用架构实践

    裴明明 | 网易 资深云原生架构师

    立即下载
    大模型在金融知识和作业密集型场景的挑战和实践

    姜睿思 | 嘉银科技 技术中心人工智能经理

    立即下载