大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他
Apache Doris 和 SelectDB 精选案例集(2024 版)
为提升企业使用体验、提高选型效率并降低实施风险,飞轮科技推出 Apache Doris 和 SelectDB 精选案例集(2024 版)。该案例集汇集 4 大领域、8+ 分析场景、26+ 标杆企业的成功案例与实践经验。以行业为划分标准,辅以使用场景标签,旨在为读者提供一个高度整合、全面涵盖、分类清晰且易于查阅的学习资源库。
优步完成了主要 MySQL 集群组的升级,提升了性能和安全性
本文提到了优步将 MySQL 数据库从 5.7 升级到 8.0,提升性能和安全性,耗时一年多,涉及 2100 多个集群和 16000 个节点,实现了高并发下显著的性能提升。
中国存储厂,杀入顶分桌
成立于 2016 年前后的存储企业,即将迈过十周年的门槛,变得不再年轻。而随生成式 AI 的发展而诞生的新兴存储企业,正逐步进入市场主流视野。
寻找 AI 最佳实践,InfoQ 2024 中国技术力量年度榜单开启
让 AI 的力量被看见!
OceanBase 4.3.3 发布,面向 AI 时代升级向量能力
AI 时代,需要怎样的数据库?
腾讯音乐:从 Elasticsearch 到 Apache Doris 内容库升级,统一搜索分析引擎,成本直降 80%
为满足更严苛数据分析的需求,腾讯音乐借助 Apache Doris 替代了 Elasticsearch 集群,统一了内容库数据平台的内容搜索和分析引擎。
谷歌建议在 SQL 中增加管道语法
本文提到谷歌提出在 SQL 中引入管道语法以提高灵活性和易用性,目前已在 GoogleSQL 和 ZetaSQL 中实现,但社区反馈不一。新语法旨在简化 SQL 查询编写,提高开发效率。
是时候刷新数据部门在券商的存在感了
数据工作的现状与时代赋予的愿景差距大,如何弥合沟壑?
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
从 3.0 系列版本开始,Apache Doris 开始支持存算分离模式,用户可以在集群部署时选择采用存算一体模式或存算分离模式。
优化故障影响分析和变更发布流程
本文讨论了优化故障影响分析和变更发布流程,强调预防、最小化影响、快速检测和恢复,建议建立沙盒环境、严格代码评审、高测试覆盖率、自动化回滚以减少生产环境错误。
京东零售数据湖应用与实践
Lambda 架构的优点是保证了数据的完整性,但缺点是系统的复杂性较高,需要维护两套系统,并且服务层的复杂合并逻辑可能会导致延迟。为了解决数据的完整性和实时性之间的矛盾,京东零售在数据架构上做出了一系列的革新。
揭秘下一代 Data for AI 技术架构,六位专家深度剖析未来趋势 | QCon
就在本周五,QCon 上海落地,为你分享下一代 Data for AI 技术架构探索
InfoQ 2024 年趋势报告:人工智能、机器学习和数据工程篇
InfoQ 编辑团队和嘉宾讨论了人工智能、机器学习和数据工程领域的当前趋势。
集成困难、数据低效:AI 热潮下,存储该怎么跟上?
只要有数据,就需要存储。随着数据处理需求呈指数级增长,许多企业在管理 AI 项目和处理大量数据方面面临着挑战。
统一存储、缩短链路,快手从 Clickhouse 到 Apache Doris 实现湖仓分离向湖仓一体的升级
快手通过引入 Apache Doris 湖仓一体能力,替换了 Clickhouse ,升级为湖仓一体架构,并结合 Doris 的物化视图改写能力和自动物化服务,实现高性能的数据查询以及灵活的数据治理。
拐点已至? Kafka 如何破局
Kafka 项目将走向何方?其生态系统将如何演变,Kafka 在快速发展的 AI 领域中将扮演什么角色?
RAG 风口十问:大数据与 AI 是价值落地还是过度炒作?
过去一年多,RAG 正成为大数据与 AI 融合的“新宠”。想象一下,当你用 AI 助手快速总结论文或分析数据时,背后可能已经是 RAG 技术在默默发力。
该挤掉“大数据 +AI”的泡沫了?
专家张君侠就 AI 大模型和大数据之间的关系和应用进行了交流。AI 的概念,强调了大数据和 AI 之间的相互促进关系。
数据治理如何转化为业务价值?平安产险的探索与实践解析
通过工具和流程的优化,平安产险制定数据标准的速度提高了 20 倍。
Java 虚拟线程:案例研究
本文探讨了 Java 虚拟线程在云原生 Java 负载中的表现,发现其在 CPU 密集型负载下吞吐量低于传统线程池,但在加速时间上表现更优,同时指出虚拟线程在某些情况下可能存在性能问题,需要进一步与 OpenJDK 社区合作解决。
被黑猴子虐爆了! 索尼 8 年耗资 20 亿打造的巨作,14 天速死,成业内最大笑话!
这次事件无疑会成为业内的警示案例,提醒开发者们在 2024 年如何避免打造出一款失败之作。
完整的数仓能力,ByConity 1.0 版本发布!
2024 年 8 月,ByConity 1.0 正式发布,翻开了 ByConity 新的一页。
作业帮在多云环境下的高可用双活架构优化实践
目前,作业帮是多云架构(阿里云、百度云、腾讯云),并同时使用 MySQL、Redis-Cluster、MongoDB、Elastisearch、TiDB 、OceanBase 这几款数据库。
单集群 QPS 超 10w,存储成本降低 70%!招联金融基于 Apache Doris 数仓升级实践
在竞争激烈的消费金融市场中,有效利用海量数据、提升业务运营效率是赢得市场的关键。
《黑神话:悟空》开发者遭猎头疯抢,联创发声求放过:你们不缺人才,别搞我们
认真,便是救赎。
卷模型还是做平台?落地企业 AI,用友这样做!
能力来赋能业务、创造价值。正如用友网络副总裁罗小江所说:这个时代不缺技术,缺的是方法体系,缺的是让技术真正意义上融入业务。
GitHub 遭遇全球宕机,Copilot 也瘫痪了!开发者:今天可以光明正大摸鱼了
开发者失望吐槽:太不靠谱,是时候逃离了
Netflix 开源下一代数据工作流引擎 Maestro
Maestro 为 Netflix 的数据科学家与需要大量信息的的业务线经理提供了工作流即服务。
AI+ 全面升级数智底座,用友发布三大行业垂类大模型
8 月 10 日下午,由用友主办的“2024 全球商业创新大会 - 企业数智化技术峰会”,在北京市“中国国际展览中心”隆重召开。
业内首家!火山引擎通过中国信通院超低延时直播性能卓越级评估
随着直播行业快速发展,如何让直播内容更快、更清晰、更保真、更流畅地抵达用户,成为直播服务提供商重点关注的问题。