Redis Geo: Redis 新增位置查询功能

阅读数:12241 2015 年 7 月 3 日

移动互联网增进了人与人之间的联系,其中基于位置信息的服务(Location Based Service,LBS)起到很重要的促进作用。在移动互联网的大环境下,每个手机都变成了一个位置追踪设备,为人们提供了非常丰富的位置服务。无论是附近的人,还是摇一摇等耳熟能详的应用都需要 LBS 在后台的支撑。但是,目前位置信息的使用过程中存在诸多挑战如相邻计算不准确等。由于经常面对海量数据请求,通常位置服务的计算都需要数据库来完成,Redis Geo 模块因此而生,旨在提供精准而且稳定的位置服务。

在位置服务的挑战中,常见的是计算两个位置是否相邻的问题。位置信息由一个四元组构成,(经度、纬度、海拔、时间),在使用过程中比较常用的是经纬度。想要进行相邻计算,需要一个二维索引。问题是现有的基于简单的一维索引和划范围搜索实现的二维索引,基本只适用于整数查询,并不适用于经纬度这种位置的相似度查询。意识到了这个困难,且伴随位置服务需求日益增长的情况,2008 年 Gustavo Niemeyer 提出了Geohash,简单来说是一个 32 位的编码字符串来将位置能够编码整合成为可范围查找的实体。由于大多数数据库都支持范围查询,因此位置就变得可查找和计算。原始 Geohash 的缺点是查询的准确度有时较低,后续开发者又创造了 52 位 Geohash 等来满足定制化的需求。

NoSQL 中,Mongodb 对位置服务的支持较好,稳定地支持了 foursquare 等应用。而 HBase 也曾推出相关教程支持在应用中引入位置服务。作为优秀 NoSQL 数据库的典范,Redis 在位置计算方面却略显薄弱。为此,意大利程序员 Salvatore Sanfilippo(antirez@GitHub)维护了一个专门为 Redis 增加位置计算的分支。发布之后,获得领域内的一致认可,短短几个月收获多达 1 万 3 千余个星标。在Hacker News上,许多程序员也表示对 Redis 位置查询的功能相见恨晚,大家积极讨论了 Redis Geo 存在的必要性,以及后续应该从性能和查询准确性上提升的若干手段,甚至有人进一步贡献了 Redis Geo 的Docker 镜像

更多关于 Redis Geo 的细节可以参考 antirez 给出的文档页面,其中包括了 Redis Geo 的基本使用,例如添加经纬度、计算经纬度相似度、计算城市之间的包含关系等多种位置计算功能。antirez 还进一步解释了 Redis Geo 的工作原理,以及该模块在 Benchmark 上运行的性能表现,每秒可达近 5 百万次编解码,能满足大部分位置服务应用的需求。


感谢徐川对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。