收录了 数据存储方式 频道下的 50 篇内容
著名的软件思想领导者Martin Fowler在最近的一篇博文中提到了上周的QCon,他说应用架构中的数据库思想已经有复苏的迹象了。这个世界对每个应用都在使用着RDBMS数据库,但是现在我们还可以考虑使用RISC RDBMS或者分布式的面向文档的数据库。

Snowflake 换 CEO,不只是人事变动,而是数据架构的时代信号:数仓黄金时代正在谢幕,Agentic Data Stack 正在登场。

为了最大限度地保证同一浏览器同一域名下各个网页的用户统一,Web JS SDK 需要及时地将用户标识存入到 Cookie; 为了最大限度地减少关闭页面导致的数据丢失,Web JS SDK 将采集的数据存入到 localStorage 里进行批量发送...

本文以 DeepSeek 对话机器人为例,深入介绍 AI 原生应用架构的可观测需求、挑战与方案实践。比如 DeepSeek 为何频繁出现服务器繁忙?如何评估 DeepSeek 与其他模型的性能、成本与效果差异?如何优化 DeepSeek 对话机器人的终端用户体验?等等。

与开放文件格式相比,开放存储 API 屏蔽了底层的文件格式的具体实现,Doris 可以通过自身存储格式中的高级特性,如丰富的索引机制来加速数据访问。

自AI大模型爆火后,贝壳找房很快加大了对AI的投入。

模块化的Lakehouse架构将成为企业的优选。

本文介绍了焱融的全闪文件存储的整体架构和技术细节,并分享了 YRCloudFile 是如何解决 AI 训练过程中遇到的海量小文件访问慢、 带宽峰值、 内存访问瓶颈和多任务并发访问性能干扰等问题的。

本文分享了流存储和 LakeHouse 架构割裂的现状下用户面临的问题和挑战,以及目前业界在融合两者上的趋势。并介绍了流存储 Fluss 如何完美地融入进 LakeHouse 架构,无缝地将 LakeHouse 架构进行实时化改造,以及基于 Fluss 来构建实时 LakeHouse 架构的最佳实践。

Diskless Kafka 才是破局之道

作业帮构建了高效、稳定的云原生监控体系,支持多云多地域部署,降低成本,提升运维效率。

在本文中,我们将 ClickHouse 的 JSON 实现与其他支持 JSON 的数据存储方案进行对比,测试结果可能会让你大吃一惊。

过去二十年,数据平台的发展随着互联网时代的崛起而不断加速。BigTable,奠定了现代大数据技术的基石。

目前作业帮有着数千个线上服务,所有服务的日志高峰流量可以达到 5000W+ 条 /S,每天生成的日志大小在 PB 级。

谷歌云推出云存储存储桶重定位功能,简化将数据存储桶移动到不同地理位置的过程,同时最大程度降低对应用程序的干扰。

ClickHouse Cloud 现在彻底告别了磁盘。

传统的数据恢复手段往往耗时费力。带来的变革,能让这一切像回滚代码提交一样简单。

“架起数据库与数据湖的桥梁” 并非趋势,而是破局的关键。

随着岚图汽车销量攀升,每日百亿级数据规模持续膨胀,如何从海量数据中快速提炼有价值信息支撑研发、生产、销售等环节,成为迫切需求。