华为云PB级数据库GaussDB(for Redis)介绍第四期:高斯 Geo的介绍与应用
摘要:高斯Redis的大规模地理位置信息存储的解决方案。
1、背景
LBS(Location Based Service,基于位置的服务)有非常广泛的应用场景,最常见的应用就是POI(Point of Interest)的查询,例如用户查找附近的人,附近的餐厅,附近的外卖商家等等。LBS的实现需要数据库存储地理位置信息,开源Redis是一个功能强、效率高、使用方便的缓存数据库,实现了地理位置存储的功能,可以用于LBS的数据存储。
开源Redis 3.2以上版本的Geo功能支持了地理位置信息存储管理,但是内存限制导致没有大规模应用。GaussDB(for Redis)(下文简称高斯Redis)兼容开源Redis的Geo功能,使用磁盘替代内存,突破了开源Redis的内存限制,可以完美解决Geo的大规模应用问题。
2、开源Redis Geo介绍
Redis的Geo功能支持如下 6 个 Geo 的相关操作:
- geoadd:添加某个地理位置的坐标。
- geopos:获取某个地理位置的坐标。
- geodist:获取两个地理位置的距离。
- geohash:获取某个地理位置的geohash值。
- georadius:根据给定地理位置坐标获取指定范围内的地理位置集合。
- georadiusbymember:根据给定地理位置获取指定范围内的地理位置集合。
Redis Geo功能的空间索引采用 GeoHash 原理,配合zset集合存储,查询效率接近 log(N)。
3、为什么开源Redis Geo没有广泛应用?
存储地理位置信息的应用非常广泛,而开源Redis Geo功能也可以存储地理位置信息,并且查询效率高,为什么没有得到大规模的应用呢?
分析存储地理位置信息的场景,都有如下特点:
- 数据量大
大部分场景存储地理位置信息的数据量都是TB级以上的,开源Redis的数据全部存放在内存中,节点的内存大小固定,要支持大数据量的地理位置信息存储,必须增加节点数,这会造成成本过高、大集群维护困难等问题。
- 数据持续增长
随着用户的增长,地理位置信息的数据也在持续增长,要求底层存储能够无损扩容。但开源Redis扩容需要重新划分hash槽进行数据迁移,必定会影响业务。
- 高并发读写
开源Redis主从模式下只有主节点可写,主节点高并发数据写入、高并发数据读出,写入速度过高容易造成主从堆积,数据丢失。
除此之外,还需要考虑备份恢复,数据一致性,扩容,高可用等数据库系统能力。
- 备份恢复
开源Redis提供RDB和AOF方式备份数据,但当数据规模大时,RDB方式恢复的数据一致性和完整性较差,AOF方式数据恢复的效率低。
- 数据一致性
开源Redis的主从采用异步复制,会出现数据不一致的情况。
- 高可用
开源Redis如果同时挂掉一对主从节点,部分数据将不可用,容错能力弱。
4、高斯Redis为什么合适?
高斯Redis基于华为自研分布式存储系统DFV,支持PB级大规模的数据存储。解决了开源Redis高成本、存储数据量小、数据不一致等问题,具有秒扩容、超可用、强一致、低成本、自动备份、抗写能力强的优势。
5、适用场景
高斯Redis Geo功能适用于数据量大、读写频繁的场景。在外卖平台、点评平台、找房平台中,餐馆的数据、外卖骑手的数据、用户的数据、房源的数据这些数据随着用户增长,数据量过亿,对应的地理位置信息的数据量可到数TB级别,正是高斯Redis适用的场景。下面介绍在不同场景中Geo功能的应用。
5.1外卖场景:
(1)用户下完外卖订单后,使用geoadd命令加入骑手的位置。
(2)使用geopos命令,用户可获得骑手的具体位置。
(3)使用georadius/ georadiusbymember命令骑手查看附近可配送的订单。
(4)使用geodist命令用户可获得骑手的距离。
5.2点评场景:
(1)新的店铺加入点评平台,使用geoadd命令,添加新店铺的位置。
(2)使用geopos命令,用户获得店铺的具体位置。
(3)使用geodist命令,用户可获得与店铺的距离。
(4)使用georadius/ georadiusbymember,用户可查找距离500米范围的店铺。
5.3找房场景:
(1)新的房源加入房源平台中,使用geoadd命令,添加新房源的位置。
(2)使用geopos命令,用户可获得房源的具体位置。
(3)使用geodist命令,用户可获得与房源的距离。
(4)使用georadius/ georadiusbymember命令,用户查找附近1km范围内的房源。
6、总结
开源Redis的Geo功能查询效率高,但存在存储容量小、抗写能力弱、可用性差等明显缺点,导致了其Geo功能一直没有广泛应用。高斯Redis突破了开源Redis的内存限制,以高性能磁盘存储数据,具有秒扩容、超可用、强一致、低成本、自动备份、抗写能力强的特点,因此高斯Redis适用于大量地理位置信息存储的场景。
7、结束
本文作者:华为云高斯Redis团队。
杭州西安深圳简历投递:yuwenlong4@huawei.com
更多技术文章,关注高斯Redis官方博客:https://bbs.huaweicloud.com/community/usersnew/id_1614151726110813
PS:值此开年采购季之际,企业新用户购买GaussDB (for Redis)4U16G任意存储规格,内存可享3个月3折。另外还有多款云数据库包年低至2.7折,0门槛抽千元大奖、新购满额送华为手机P40 Pro 5G等多重福利,链接:https://activity.huaweicloud.com/dbs_Promotion/index.html
本文分享自华为云社区《华为云PB级数据库GaussDB(for Redis)揭秘第四期:高斯 Redis Geo的介绍与应用》,原文作者:高斯Redis官方博客。