【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

数据规模

收录了 数据规模 频道下的 50 篇内容

规模化时间序列数据存储 Part1

Netflix使用会员的视频观看记录实时准确地记录用户的观看情况,并为会员提供个性化推荐。Netflix的发展,对视频观看记录时序数据存储的规模化提出了挑战,原有的单表存储架构无法适应会员的大规模增长。本文介绍了Netflix团队在规模化时序存储中的做法,包括数据存储方式的改进,以及在存储架构中添加缓存层。存储架构在Netflix的实际应用验证了该时序数据存储的有效性。

从“大数据”到“小数据”,“隐语”开源SCQL助力不同规模数据安全分析
从“大数据”到“小数据”,“隐语”开源 SCQL 助力不同规模数据安全分析

在数据要素战略持续升级的背景下,发展以隐私计算为代表的密态技术,是解决大规模数据安全可信流转的技术手段。

基于动态知识图谱的大规模数据集成技术
基于动态知识图谱的大规模数据集成技术

本文介绍百分点认知智能实验室出品的基于动态知识图谱的大规模数据集成技术。

百度大规模时序数据存储(二)| 存储选型及数据模型设计
百度大规模时序数据存储(二)| 存储选型及数据模型设计

本篇将介绍 TSDB 在方案选型和存储模型设计上的实践。

大规模数据处理初体验:怎样实现大型电商热销榜?
大规模数据处理初体验:怎样实现大型电商热销榜?

今天我们就以大型电商热销榜为例,来谈一谈从 1 万用户到 1 亿用户,从 GB 数据到 PB 数据系统,技术思维需要怎样的转型升级?

EB 级大规模存储的数据面设计与思考
EB 级大规模存储的数据面设计与思考

全文总共分为三个部分,第一部分对大规模数据存储进行概述;第二部分以百度网盘为例介绍百度沧海如何支撑 EB 级大规模存储;第三部分享一些相关的经验与思考。

百度大规模时序数据存储(三)| 核心功能设计
百度大规模时序数据存储(三)| 核心功能设计

本文将着重介绍在 TSDB 中起了重要作用的两个核心功能的设计。

知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计
知乎首页已读数据万亿规模下高吞吐低时延查询系统架构设计

本次分享介绍目前知乎已读服务的整体架构以及如何在这个架构上应对各种挑战满足业务需求。

Apache Doris 在奇富科技的统一 OLAP 场景探索实践
Apache Doris 在奇富科技的统一 OLAP 场景探索实践

作者|奇富科技 中间件团队 & SelectDB 技术团队数科)致力于帮助金融机构提升智能化水平。经过多年金融领域实践,奇富科技以自身强大安全生态为依托,完成了在人工智能、大数据、云计算等技术方面的专业积累。

etcd在超大规模数据场景下的性能优化
etcd 在超大规模数据场景下的性能优化

本篇文章首先介绍etcd优化的背景,为什么要进行优化, 之后介绍 etcd 内部存储系统的工作方式,之后介绍本次具体的实现方式及最后的优化效果。

在数据规模重压、多维度查询需求之下,支付平台的迁移之旅
在数据规模重压、多维度查询需求之下,支付平台的迁移之旅

MySQL的问题:之前的一次二次扩容的经历

金融级分布式数据库打造!TDSQL在微众银行的大规模实践
金融级分布式数据库打造!TDSQL 在微众银行的大规模实践

微众银行在2014年成立之时,就非常有前瞻性的确立了分布式架构的基础架构。当时,腾讯有一款金融级的分布式数据库产品TDSQL,其业务场景和对数据库的可靠性要求,和银行场景非常类似。

今年向量数据库“杀疯了”,但纯向量数据库“凉”了?| 年度技术盘点与展望
今年向量数据库“杀疯了”,但纯向量数据库“凉”了?| 年度技术盘点与展望

2023年,大模型爆火,也给数据库领域带来了一些新风向。

欧伟杰博士:突破算力边界!YashanDB 实现理论与工程双重突围
欧伟杰博士:突破算力边界!YashanDB 实现理论与工程双重突围

随着数字化进程的加速,数据处理的规模和速度需求持续攀升。

云原生数据库 GaiaDB 架构设计解析:高性能、多级高可用
云原生数据库 GaiaDB 架构设计解析:高性能、多级高可用

百度智能云数据库高级架构师邱学达为我们介绍了云原生数据库的不同技术路线及能力对比,并对比传统单体数据库介绍了云原生数据库的技术差异和挑战,同时深入浅出地解析了 GaiaDB 在高性能和多级高可用方向上的技术架构。

零售业海量场景下 ToC 系统的数据库选型和迁移实践
零售业海量场景下 ToC 系统的数据库选型和迁移实践

云盛海宏 To C 系统是如何为用户服务以及成为核心系统的?

ATEC“数星”计划发布,开源亿级工业数据集
ATEC“数星”计划发布,开源亿级工业数据集

这是业内首个基于真实工业场景的大规模研究性数据集开放计划。

AWS 数据底座S3,万亿数据规模下是如何做到数据“强一致性”的
AWS 数据底座 S3,万亿数据规模下是如何做到数据“强一致性”的

AWS S3 是如何在万亿数据规模,每秒千万次请求下,既要保证可用性(99.99%),持久性(11个9)的前提下,同时做到数据强一致性的呢?让我们一探究竟。

云计算
AWS
aws s3
搜索与分析型数据库论坛|2023可信数据库发展大会
搜索与分析型数据库论坛|2023 可信数据库发展大会

近年来,随着非结构化数据成为各类组织数据的增长主力,搜索与分析型数据库发展迅速,关键技术陆续突破,应用场景日益增多,数据规模逐年上升,已成为企业必不可少的核心基础设施。

查询速度提升15倍!银联商务基于 Apache Doris 的数据平台升级实践
查询速度提升 15 倍!银联商务基于 Apache Doris 的数据平台升级实践

在长期服务广大规模商户的过程中,银联商务已沉淀了庞大、真实、优质的数据资产数据,这些数据不仅是银联商务开启新增长曲线的基础,更是进一步服务好商户的关键支撑。

数据规模专题_资料-InfoQ中文网