type
status
date
slug
summary
tags
category
icon
password
Property
Redis
分区技术(Redis Partition)指的是将Redis
中的数据进行拆分,然后把拆分后的数据分散到多个不同的Redis
实例(即服务器)中,每个实例仅存储数据集的某一部分(一个子集),把这个过程称之为 Redis 分区操作。Redis
实例指的是一台安装了Redis
服务器的计算机。分区(Partition)不仅是
Redis
中的概念,几乎所有数据库管理系统都会涉及到“分区”的应用。分区的优势
Redis
分区技术有两个方面的优势,一是提升服务器的性能,二是提高了服务器的数据存储能力。一方面,单台机器的
Redis
服务器,其网络 IO 能力和计算资源都是非常有限的,但是如果我们将请求分散到多台机器上,那么就能充分利用多台计算机的算力和网络带宽,从而整体上提升Redis
服务器的性能。另一方面,随着存储数据的不断增加,单台机器的存储容量会达到极限,若将数据分散存储到多台Redis
服务器上,其存储能力也将得到大幅度提升。注意,
Redis
分区技术可以利用多台计算机的内存总和,从而创建出大型的Redis
数据库。分区常用方法
分区技术有两种常用方法,分别是“范围分区”和“哈希分区”。
范围分区
范围分区是最简单、最有效的分区方法之一。所谓范围分区指的是将特定范围的
key
映射到指定的Redis
实例上。key
的命名格式如下:比如:
user:1
、user:2 ...
用来表示不同 id 的用户。下面通过一个示例了解范围分区的具体流程:假设现在共有 3000 个用户,可以把 id 从 0 到 1000 的用户映射到实例 R0 上,id 从 1001 到 2000 的用户映射到实例 R1 上,以此类推,将 id 从 2001 到 3000 的用户映射到实例 R2 上。
范围分区不仅简单,而且实用,适合许多的特定场景。但当存储的 key 不能按照范围划分时,那么范围分区就不再适用了,比如 key 是一组 uuid(通用唯一识别码)。如下所示:
此时范围分区就不再适用,就要用到另外一种分区方式——哈希分区。
哈希分区
哈希分区与范围分区相比,它最显著的优势是适合任何形式的 key。哈希分区方法并不复杂比,id 表达式如下所示:
这里的 id 指的是 Redis 实例的编号,而 N 表示共有多少个
Redis
实例。首先调用一个
crc32()
哈希函数,它可以将 key
转换为一个整数:假如转换后的整数是 93024922,此时共有 4 个
Redis
实例,对整数与实例的数量进行取模运算,就会得到一个 0 到 3 之间的整数:上述计算结果为 2 ,就把这个 key 映射到 R2 实例中,如果为 3 就映射到 R3实例中。以此类推,通过这种方式可以将所有的 key 分散到 4 个不同的
Redis
实例中。分区技术的不足
虽然
Redis
分区技术有诸多优势,但是它也存在一些不足之处:- 涉及操作多个
key
时,通常不被支持。这是由于批量操作的key
会被映射到不同的Redis
实例中,此时无法实现在一个实例中操作分散开的key
- 不支持包含多个
key
的Redis
事务
- 当使用分区的时候,数据的处理变的非常复杂,比如需要处理多个
.rdb
或者.aof
存储文件,并且还需要从多个Redis
实例中备份数据
- 添加、删除实例变的复杂,比如
Redis
集群支持在运行时增加或减少实例,分区技术不支持这种功能
分区技术问题解决
应用
Redis
分区技术时存在一些不足之处,比如在增加、删除Redis
实例时会非常麻烦,但这种情况在实际应用中经常遇到。比如今天需要删除10台Redis
实例,明天又要增加20台实例。那么对于这种问题,有没有一种较好的解决办法呢?其实
Redis
是一种很轻量级的服务(每个实例仅占用 1 MB),针对它的这种特性,提出以下解决办法:在一台机器上开启多个
Redis
实例,可以从中选择一定数量的实例作为Redis
工作集群。当集群中某一台机器存储不足时,可以将一部分Redis
实例移动到另外一台机器上,依次类推。这样就保证了Redis
的实例总数不变,又达到了增加机器的目的。