数据处理

收录了数据处理频道下的 236 篇内容
  • 文章
转转业务开发对 TiDB 的使用心得
转转业务开发对 TiDB 的使用心得

本文介绍业务开发对 TiDB 的使用心得”。

搜索引擎中的 web 数据挖掘
搜索引擎中的 web 数据挖掘

本文介绍全网搜索引擎中的数据挖掘系统的设计方案与核心算法。

Flink 流式计算在节省资源方面的简单分析
Flink 流式计算在节省资源方面的简单分析

小米在流式计算方面经历了 Storm、Spark Streaming 和 Flink 的发展历程。在整个发展历程中,逐步完善了稳定性、作业管理、日志和监控收集展示等关系到用户易用性和运维能力的特性,帮助越来越多的业务接入到了 Flink。

Apache Flink 进阶(八):详解 Metrics 原理与实战
Apache Flink 进阶(八):详解 Metrics 原理与实战

本文对两大问题进行了详细的介绍,即什么是 Metrics、如何使用 Metrics,并对 Metrics 监控实战进行解释说明。

eBay发布分布式事务协议GRIT,多数据库微服务的福音
eBay 发布分布式事务协议 GRIT,多数据库微服务的福音

GRIT 的关键点在于支持跨微服务使用多个数据库,这些微服务通常用不同的语言实现,并且可能使用多个底层数据库。

怎样用Hadoop保护大数据?
怎样用 Hadoop 保护大数据?

通过本文,你可以了解 Hadoop 如何通过网络安全的方法来保护大数据。

Apache Arrow Flight:快速数据传输框架
Apache Arrow Flight:快速数据传输框架

这是一个新的通用客户端服务器框架,用于简化大型数据集通过网络接口的高性能传输。

AI搜索引擎Magi一夜爆红;美国每年将为AI研究投入120亿美元;ICLR 2020近半审稿人没发过相关论文 | AI一周资讯
AI 搜索引擎 Magi 一夜爆红;美国每年将为 AI 研究投入 120 亿美元;ICLR 2020 近半审稿人没发过相关论文 | AI 一周资讯

AI 前线“AI 一周资讯”栏目,甄选全球最新行业动态,着眼影响技术变革的大事件,聚焦业内专家学者的发声,为读者呈现出内容丰富且有价值的新闻资讯。

网易互娱的数据库选型和 TiDB 应用实践
网易互娱的数据库选型和 TiDB 应用实践

本文介绍网易互娱计费组针对自己场景的数据库选型对比方案,以及使用 TiDB 后解决的问题。

Magi搜索引擎红了:我们只是需要一个比百度更好的引擎
Magi 搜索引擎红了:我们只是需要一个比百度更好的引擎

大家期望出现一个更好的搜索引擎,AI 时代的引擎。

基于NVMe SSD的分布式文件存储UFS性能提升技术解析
基于 NVMe SSD 的分布式文件存储 UFS 性能提升技术解析

自主研发的分布式文件存储产品,此前已推出容量型 UFS 版本。UFS 以其弹性在线扩容、稳定可靠的特点,为众多公有云、物理云、托管云用户提供共享存储方案,单文件系统存储容量可达百 PB 级。