收录了 hbase 频道下的 50 篇内容
知乎核心架构团队基于开源容器调度平台 Kubernetes 打造了一整套 HBase 服务平台管理系统,经过近两年的研发迭代,目前已经形成了一套较为完整的 HBase 自动化运维服务体系,能够完成 HBase 集群的快捷部署,平滑扩缩容,HBase 组件细粒度监控,故障跟踪等功能。
本文来自《2019年有赞技术大礼包》系列。
本文来自《2019年有赞技术大礼包》系列。
目前企业软件开发占据主流的开发模式为面向对象模式。无论是建立在集合论之上的传统关系型数据库,还是以CAP定理/Hadoop/BigTable为基石的HBase,都面临以下的基本问题: 如何保存对象到数据存储? 如何从数据存储获取对象? 如何更新数据存储中的现有数据?数据存储的类型系统和开发语言(Java)的类型系统之间如何相互转换? 简而言之,数据存储如何提供增、删、改、查的服务能力,应用如何方便的使用该能力。关系型数据库给出的答案为SQL,JDBC和各种ORM框架(典型例子为Hibernate和MyBatis)。
本文介绍的项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询。原实现基于 Oracle 提供存储查询服务,随着数据量的不断增加,在写入和读取过程中面临性能问题,且历史数据仅供业务查询参考,并不影响实际流程,从系统结构上来说,放在业务链条上游比较重。该项目将其置于下游数据处理 Hadoop 分布式平台来实现此需求。
本文重点介绍 HBase 读取数据的流程分析,并根据此流程介绍如何在客户端以及服务端优化性能。
本文由简入深,一步步搭建一个Hbase数据集群,并详细说明生产环境如何使用Hbase数据容灾方案。
许多客户已经在享受使用 HBase on Amazon S3的众多好处,包括更低的成本、更好的数据持久性和更便捷的可扩展性。
当前aws的很多客户已经从将s3作为HBase的存储中获益
从 Amazon EMR 5.2.0 开始,您可以选择基于 Amazon S3 上的 Apache HBase。
索引的实质是另一种编排形式的数据冗余,高效的检索源自于面向查询特别设计的编排形式,如果再辅以分布式的计算框架,就可以支撑起高性能的大数据查询。
本文介绍百度智能监控场景下的HBase相关实践经验
这篇文章从总体上描述了如何设计和实现,从而把Lucene搜索程序库与HBase后端相集成。它描述了集成架构、实现以及HBase的表设计。
HBase是基于HDFS存储的分布式Nosql数据库,具有易于线性拓展和高并发随机实时读写能力,目前已成为大部分公司基础存储架构中不可缺少的组成部分。
我们认为,Locality是保持这些延迟的关键。
本文从性能调优上向大家介绍如何通过对 HBase 的优化来保障重点业务的查询性能,实现 Kylin 千万级/天的查询量下,3s 内查询占比达到99.7%。
Apache HBase是一种构建在HDFS之上的分布式、面向列的存储系统。
HBase作为Hadoop生态中表现较为突出的分布式在线数据存储产品,在滴滴有着非常广泛的应用,但同样存在比较突出的短板问题——例如可用性较弱、毛刺严重等,一定程度上限制了它的业务边界。本文主要介绍在此背景下,HBase团队近期进行的一些探索工作。
本文出自《有赞技术2018年度合集》系列
本文首先介绍了久耶第一代离线数仓以及第二代实时数仓,接下来介绍基于HBase的开发流程,以及CDH集群调优监控。