type
status
date
slug
summary
tags
category
icon
password
Property
在 Redis 的主从架构中,由于主从模式是读写分离的,如果主节点(master)挂了,那么将没有主节点来服务客户端的写操作请求,也没有主节点给从节点(slave)进行数据同步了。
这时如果要恢复服务的话,需要人工介入,选择一个「从节点」切换为「主节点」,然后让其他从节点指向新的主节点,同时还需要通知上游那些连接
Redis
主节点的客户端,将其配置中的主节点 IP 地址更新为「新主节点」的 IP 地址。这样也不太“智能”了,要是有一个节点能监控「主节点」的状态,当发现主节点挂了 ,它自动将一个「从节点」切换为「主节点」的话,那么可以节省很多事情。Redis 在 2.8 版本以后提供的哨兵(Sentinel)机制,它的作用是实现主从节点故障转移。
Sentinel
是Redis
的高可用性解决方案:由一个或多个Sentinel
实例组成的Sentinel
系统可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,并在被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器,然后由新的主服务器代替已下线的主服务器继续处理命令请求。
一个Sentinel系统监视服务器的例子
- 用双环图案表示的是当前的主服务器
server1
- 用单环图案表示的是主服务器的三个从服务器
server2
、server3
以及server4
server2
、server3
、server4
三个从服务器正在复制主服务器server1
,而Sentinel
系统则在监视所有四个服务器
假设这时,主服务器
server1
进入下线状态,那么从服务器server2
、server3
、server4
对主服务器的复制操作将被中止,并且Sentinel
系统会察觉到server1
已下线:当
server1
的下线时长超过用户设定的下线时长上限时,Sentinel
系统就会对server1
执行故障转移操作:Sentinel
系统挑选server1
属下的其中一个从服务器,并将这个被选中的从服务器升级为新的主服务器
Sentinel
系统向server1
属下的所有从服务器发送新的复制指令,让它们成为新的主服务器的从服务器,当所有从服务器都开始复制新的主服务器时,故障转移操作执行完毕
- 另外,
Sentinel
还会继续监视已下线的server1
,并在它重新上线时,将它设置为新的主服务器的从服务器
Sentinel
系统将server2
升级为新的主服务器,并让服务器server3
和server4
成为server2
的从服务器:之后,如果
server1
重新上线的话,它将被Sentinel
系统降级为server2
的从服务器启动并初始化Sentinel
启动一个
Sentinel
可以使用命令:或者命令:
当一个
Sentinel
启动时, 它需要执行以下步骤:- 初始化服务器
Sentinel
本质上只是一个运行在特殊模式下的Redis
服务器,启动Sentinel
的第一步, 就是初始化一个普通的Redis
服务器。不过, 因为Sentinel
执行的工作和普通Redis
服务器执行的工作不同, 所以Sentinel
的初始化过程和普通Redis
服务器的初始化过程并不完全相同。比如说, 普通服务器在初始化时会通过载入
RDB
文件或者AOF
文件来还原数据库状态, 但是因为Sentinel
并不使用数据库, 所以初始化Sentinel
时就不会载入RDB
文件或者AOF
文件。- 将普通
Redis
服务器使用的代码替换成Sentinel
专用代码
将一部分普通
Redis
服务器使用的代码替换成Sentinel
专用代码。比如说, 普通Redis
服务器使用redis.h/REDIS_SERVERPORT
常量的值作为服务器端口:而
Sentinel
则使用sentinel.c/REDIS_SENTINEL_PORT
常量的值作为服务器端口:除此之外, 普通 Redis 服务器使用
redis.c/redisCommandTable
作为服务器的命令表:而
Sentinel
则使用sentinel.c/sentinelcmds
作为服务器的命令表, 并且其中的INFO
命令会使用Sentinel
模式下的专用实现sentinel.c/sentinelInfoCommand
函数, 而不是普通Redis
服务器使用的实现redis.c/infoCommand
函数:sentinelcmds
命令表也解释了为什么在Sentinel
模式下, Redis
服务器不能执行诸如SET
、 DBSIZE
、 EVAL
等等这些命令 —— 因为服务器根本没有在命令表中载入这些命令:PING
、SENTINEL
、INFO
、SUBSCRIBE
、UNSUBSCRIBE
、PSUBSCRIBE
和PUNSUBSCRIBE
这七个命令就是客户端可以对Sentinel
执行的全部命令了。- 初始化
Sentinel
状态
在应用了
Sentinel
的专用代码之后, 接下来, 服务器会初始化一个sentinel.c/sentinelState
结构(简称“Sentinel 状态”), 这个结构保存了服务器中所有和Sentinel
功能有关的状态 (服务器的一般状态仍然由redis.h/redisServer
结构保存):- 根据给定的配置文件, 初始化
Sentinel
的监视主服务器列表
Sentinel
状态中的masters
字典记录了所有被Sentinel
监视的主服务器的相关信息, 字典的键是被监视主服务器的名字,而字典的值则是被监视主服务器对应的sentinel.c/sentinelRedisInstance
结构。每个
sentinelRedisInstance
结构(简称“实例结构”)代表一个被Sentinel
监视的Redis
服务器实例, 这个实例可以是主服务器、从服务器、或者另外一个Sentinel
。实例结构包含的属性非常多, 以下代码展示了实例结构在表示主服务器时使用的其中一部分属性:sentinelRedisInstance.addr
属性是一个指向sentinel.c/sentinelAddr
结构的指针, 这个结构保存着实例的 IP 地址和端口号:对
Sentinel
状态的初始化将引发对masters
字典的初始化, 而masters
字典的初始化是根据被载入的Sentinel
配置文件来进行的。如果用户在启动
Sentinel
时, 指定了包含以下内容的配置文件:那么
Sentinel
将为主服务器master1
创建实例结构: 并为主服务器
master2
创建实例结构:而这两个实例结构又会被保存到
Sentinel
状态的masters
字典中:- 创建连向主服务器的网络连接
- 一个是命令连接, 这个连接专门用于向主服务器发送命令,并接收命令回复
- 另一个是订阅连接,这个连接专门用于订阅主服务器的
__sentinel__:hello
频道
初始化
Sentinel
的最后一步是创建连向被监视主服务器的网络连接:Sentinel
将成为主服务器的客户端, 它可以向主服务器发送命令, 并从命令回复中获取相关的信息。对于每个被
Sentinel
监视的主服务器来说, Sentinel
会创建两个连向主服务器的异步网络连接:为什么有两个连接?
在
Redis
目前的发布与订阅功能中, 被发送的信息都不会保存在Redis
服务器里面, 如果在信息发送时, 想要接收信息的客户端不在线或者断线, 那么这个客户端就会丢失这条信息。因此, 为了不丢失
__sentinel__:hello
频道的任何信息, Sentinel
必须专门用一个订阅连接来接收该频道的信息。而另一方面, 除了订阅频道之外,
Sentinel
还又必须向主服务器发送命令, 以此来与主服务器进行通讯, 所以Sentinel
还必须向主服务器创建命令连接。并且因为
Sentinel
需要与多个实例创建多个网络连接, 所以Sentinel
使用的是异步连接。获取主服务器信息
Sentinel
默认会以每十秒一次的频率,通过命令连接向被监视的主服务器发送INFO
命令,并通过分析INFO
命令的回复来获取主服务器的当前信息。假设主服务器
master
有三个从服务器slave0
、slave1
和 slave2
,并且一个Sentinel
正在连接主服务器,那么Sentinel
将持续地向主服务器发送INFO
命令,并获得回复:通过分析主服务器返回的
INFO
命令回复,Sentinel
可以获取以下两方面的信息:- 关于主服务器本身的信息,包括
run_id
域记录的服务器运行ID
,以及role
域记录的服务器角色。
根据
run_id
域和role
域记录的信息,Sentinel
将对主服务器的实例结构进行更新,例如, 主服务器重启之后,它的运行ID
就会和实例结构之前保存的运行ID
不同,Sentinel
检测到这 一情况之后,就会对实例结构的运行ID
进行更新- 关于主服务器属下所有从服务器的信息,每个从服务器都由一个
"slave"
字符 串开头的行记录,每行的ip=域记录了从服务器的IP地址,而port=域则记录了从服务器的端 口号。根据这些IP地址和端口号,Sentinel
无须用户提供从服务器的地址信息,就可以自动发现从服务器
主服务器返回的从服务器信息,则会被用于更新主服务器实例结构的slaves字典, 这个字典记录了主服务器属下从服务器的名单:
- 字典的键是由
Sentinel
自动设置的从服务器名字,格式为ip:port:
如对于IP地址为127.0.0.1
,端口号为11111
的从服务器来说,Sentinel
为它设置的名字就是127.0.0.1:11111
- 字典的值则是从服务器对应的实例结构:比如说,如果键是
127.0.0.1:11111
,那么 这个键的值就是IP地址为127.0.0.1
,端口号为11111
的从服务器的实例结构
Sentinel
在分析INFO
命令中包含的从服务器信息时,会检查从服务器对应的实例结构是否已经存在于slaves
字典:- 如果从服务器对应的实例结构已经存在,那么
Sentinel
对从服务器的实例结构进行更新
- 如果从服务器对应的实例结构不存在,那么说明这个从服务器是新发现的从服务器,
Sentinel
会在slaves
字典中为这个从服务器新创建一个实例结构
图中主服务器实例结构和从服务器实例结构之间的区别:
- 主服务器实例结构的
flags
属性的值为SRI_MASTER
,而从服务器实例结构的flags
属性的值为SRI_SLAVE
- 主服务器实例结构的
name
属性的值是用户使用Sentinel
配置文件设置的,而从服务器实例结构的name
属性的值则是Sentinel
根据从服务器的IP地址和端口号自动设置的
获取从服务器信息
当
Sentinel
发现主服务器有新的从服务器出现时,Sentinel
除了会为这个新的从服务器创建相应的实例结构之外,还会创建连接到从服务器的命令连接和订阅连接。Sentinel
对slave0
、slave1
和slave2
三个从服务器分别创建命令连接和订阅连接:在创建命令连接之后,
Sentinel
在默认情况下,会以每十秒一次的频率通过命令连接向从服务器发送INFO
命令,并获得类似于以下内容的回复:根据
INFO
命令的回复,Sentinel
会提取出以下信息:- 从服务器的运行ID run_id
- 从服务器的角色role
- 主服务器的IP地址master_host,以及主服务器的端口号master_port
- 主从服务器的连接状态master_link_status
- 从服务器的优先级slave_priority
- 从服务器的复制偏移量slave_repl_offset
根据这些信息,
Sentinel
会对从服务器的实例结构进行更新:向主服务器和从服务器发送消息(PUBLISHS命令)
在默认情况下,
Sentinel
会以每两秒一次的频率,通过命令连接向所有被监视的主服务器和从服务器发送以下格式的命令:这条命令向服务器的__sentinel__:hello频道发送了一条信息,信息的内容由多个参数组成:
- 以
s_
开头的参数记录的是Sentinel
本身的信息
m_
开头的参数记录的则是主服务器的信息- 如果
Sentinel
正在监视的是主服务器,那么这些参数记录的就是主服务器的信息 - 如果
Sentinel
正在监视的是从服务器,那么这些参数记录的就是从服务器正在复制的主服务器的信息
一条
Sentinel
通过PUBLISH命令向主服务器发送的信息示例:这个示例包含了以下信息:
Sentinel
的IP地址为127.0.0.1
,端口号为26379
,运行ID为e955b4c85598ef5b5f055bc7ebfd5e828dbed4fa
,当前的配置纪元为0
- 主服务器的名字为
mymaster
,IP地址为127.0.0.1
,端口号为6379
,当前的配置纪元为0
接收主服务器和从服务器的消息(SUBSCRIBE命令)
当
Sentinel
与一个主服务器或者从服务器建立起订阅连接之后,Sentinel
就会通过订阅连接,向服务器发送以下命令:Sentinel
对__sentinel__:hello
频道的订阅会一直持续到Sentinel
与服务器的连接断开为止对于每个与
Sentinel
连接的服务器,Sentinel
既通过命令连接向服务器的 __sentinel__:hello
频道发送信息,又通过订阅连接从服务器的__sentinel__:hello
频道接收信息:对于监视同一个服务器的多个
Sentinel
来说,一个Sentinel
发送的信息会被其他Sentinel
接收到,这些信息会被用于更新其他Sentinel
对发送信息Sentinel
的认知,也会被用于更新其他Sentinel
对被监视服务器的认知。假设现在有
sentinel1
、sentinel2
、sentinel3
三个Sentinel
在监视同一个服务器, 那么当sentinel1
向服务器的__sentinel__:hello
频道发送一条信息时,所有订阅了sentinel
:hello
频道的Sentinel
(包括sentinel1
自己在内)都会收到这条信息:当一个
Sentinel
从__sentinel__:hello
频道收到一条信息时,Sentinel
会对这条信息进行分析,提取出信息中的Sentinel IP
地址、Sentinel
端口号、Sentinel
运行ID等八个参数,并进行以下检查:- 如果信息中记录的
Sentinel
运行ID
和接收信息的Sentinel
的运行ID相同,那么说明这条信息是Sentinel
自己发送的,Sentinel
将丢弃这条信息,不做进一步处理
- 如果信息中记录的
Sentinel
运行ID和接收信息的Sentinel
的运行ID不相同,那么说明这条信息是监视同一个服务器的其他Sentinel
发来的,接收信息的Sentinel
将根据信息中的各个参数,对相应主服务器的实例结构进行更新
更新sentinels字典
Sentinel
为主服务器创建的实例结构中的sentinels
字典保存了除Sentinel
本身之外,所有同样监视这个主服务器的其他Sentinel
的资料:- sentinels字典的键是其中一个
Sentinel
的名字,格式为ip:port
,比如对于IP地址为127.0.0.1
,端口号为26379的Sentinel
来说,这个Sentinel
在sentinels
字典中的键就是"127.0.0.1:26379
"
- sentinels字典的值则是键所对应Sentinel的实例结构,比如对于键"
127.0.0.1:26379
"来说, 这个键在sentinels
字典中的值就是IP为127.0.0.1
,端口号为26379
的Sentinel
的实例结构
当一个
Sentinel
接收到其他Sentinel
发来的信息时(称发送信息的Sentinel
为源 Sentinel
,接收信息的Sentinel
为目标Sentinel
),目标Sentinel
会从信息中分析并提取出以下两方面参数:- 与
Sentinel
有关的参数:源Sentinel
的IP地址、端口号、运行ID和配置纪元
- 与主服务器有关的参数:源
Sentinel
正在监视的主服务器的名字、IP地址、端口号和配 置纪元
根据信息中提取出的主服务器参数,目标
Sentinel
会在自己的Sentinel
状态的masters
字典中查找相应的主服务器实例结构,然后根据提取出的Sentinel
参数,检查主服务器实例结构的sentinels
字典中,源Sentinel
的实例结构是否存在:- 如果源
Sentinel
的实例结构已经存在,那么对源Sentinel
的实例结构进行更新
- 如果源
Sentinel
的实例结构不存在,那么说明源Sentinel
是刚刚开始监视主服务器的新Sentinel
,目标Sentinel
会为源Sentinel
创建一个新的实例结构,并将这个结构添加到sentinels
字典里面
因为一个
Sentinel
可以通过分析接收到的频道信息来获知其他Sentinel
的存在,并通过发送频道信息来让其他Sentinel
知道自己的存在,所以用户在使用Sentinel
的时候并不需要提供各个Sentinel
的地址信息,监视同一个主服务器的多个Sentinel
可以自动发现对方创建连向其他Sentinel
的命令连接
当
Sentinel
通过频道信息发现一个新的Sentinel
时,它不仅会为新Sentinel
在sentinels
字典中创建相应的实例结构,还会创建一个连向新Sentinel
的命令连接,而新Sentinel
也同样会创建连向这个Sentinel
的命令连接,最终监视同一主服务器的多个Sentinel
将形成相互连接的网络:Sentinel A
有连向Sentinel B
的命令连接,而Sentinel B
也有连向Sentinel A
的命令连接
Sentinel
之间不会创建订阅连接:Sentinel
在连接主服务器或者从服务器时,会同时创建命令连接和订阅连接,但是在连接其他Sentinel
时,却只会创建命令连接,而不创建订阅连接。这是因为Sentinel
需要通过接收主服务器或者从服务器发来的频道信息来发现未知的新Sentinel
,所以才需要建立订阅连接,而相互已知的Sentinel
只要使用命令连接来进行通信就足够了
三个监视同一主服务器的
Sentinel
之间互相连接:使用命令连接相连的各个
Sentinel
可以通过向其他Sentinel
发送命令请求来进行信息交换判断主节点真的故障
检测主观下线状态
在默认情况下,
Sentinel
会以每秒一次的频率向所有与它创建了命令连接的实例(包括主服务器、从服务器、其他Sentinel
在内)发送PING
命令,并通过实例返回的PING
命令回复来判断实例是否在线:Sentinel1
将向Sentinel2
、主服务器master
、从服务器slave1
和slave2
发送PING
命令
Sentinel2
将向Sentinel1
、主服务器master
、从服务器slave1
和slave2
发送PING
命令
实例对PING命令的回复可以分为以下两种情况:
- 有效回复:实例返回+PONG、-LOADING、-MASTERDOWN三种回复的其中一种
- 无效回复:实例返回除三种回复之外的其他回复,或者在指定时限内没有返回任何回复
配置中的:
down-after-milliseconds
指定了主观下线 的判断时长注意:不光是
master
的下线时长是 5s,从服务器和sentinel
也都会被设置成5s检测客观下线状态
客观下线只适用于主节点。之所以针对「主节点」设计「主观下线」和「客观下线」两个状态,是因为有可能「主节点」其实并没有故障,可能只是因为主节点的系统压力比较大或者网络发送了拥塞,导致主节点没有在规定时间内响应哨兵的 PING 命令。
所以,为了减少误判的情况,哨兵在部署的时候不会只部署一个节点,而是用多个节点部署成哨兵集群(最少需要三台机器来部署哨兵集群),通过多个哨兵节点一起判断,就可以就可以避免单个哨兵因为自身网络状况不好,而误判主节点下线的情况。同时,多个哨兵的网络同时不稳定的概率较小,由它们一起做决策,误判率也能降低。
当
Sentinel
将一个主服务器判断为主观下线之后,为了确认这个主服务器是否真的下线 了,它会向同样监视这一主服务器的其他Sentinel
进行询问,看它们是否也认为主服务器已经进入了下线状态(可以是主观下线或者客观下线)。当Sentinel
从其他Sentinel
那里接收到足够数量的已下线判断之后,Sentinel
就会将从服务器判定为客观下线,并对主服务器执行故障转移操作。
Sentinel
使用下面的命令询问其他Sentinel
是否同意主服务器已下线:如果被
Sentinel
判断为主观下线的主服务器的IP为127.0.0.1
,端口号为6379
, 并且Sentinel
当前的配置纪元为0,那么Sentinel
将向其他Sentinel
发送以下命令:当一个
Sentinel
(目标Sentinel
)接收到另一个Sentinel
(源Sentinel
)发来的SENTINEL ismaster-down-by
命令时,目标Sentinel
会分析并取出命令请求中包含的各个参数,并根据其中的主服务器IP和端口号,检查主服务器是否已下线,然后向源Sentinel
返回一条包含三个参数的MultiBulk
回复作为SENTINEL is-master-down-by命令的回复:如果一个
Sentinel
返回以下回复作为SENTINEL is-master-down-by-addr
命令的回复,那么说明Sentinel
也同意主服务器已下线:根据其他
Sentinel
发回的SENTINEL is-master-down-by-addr
命令回复,Sentinel
将统计其他Sentinel
同意主服务器已下线的数量,当这一数量达到配置指定的判断客观下线所需的数量时,Sentinel
会将主服务器实例结构flags
属性的SRI_O_DOWN
标识打开,表示主服务器已经进入客观下线状态:选取领头Sentinel进行主从故障转移
当一个主服务器被判断为客观下线时,监视这个下线主服务器的各个
Sentinel
会进行协商,选举出一个领头Sentinel
,并由领头Sentinel
对下线主服务器执行故障转移操作。假设有三个哨兵。当哨兵 B 先判断到主节点「主观下线后」,就会给其他实例发送
is-master-down-by-addr
命令。接着,其他哨兵会根据自己和主节点的网络连接情况,做出赞成投票或者拒绝投票的响应。当哨兵 B 收到赞成票数达到哨兵配置文件中的quorum
配置项设定的值后,就会将主节点标记为「客观下线」,此时的哨兵B就是一个Leader
候选者。候选者会向其他哨兵发送命令,表明希望成为
Leader
来执行主从切换,并让所有其他哨兵对它进行投票。每个哨兵只有一次投票机会,如果用完后就不能参与投票了,可以投给自己或投给别人,但是只有候选者才能把票投给自己。
那么在投票过程中,任何一个「候选者」,要满足两个条件:
- 拿到半数以上的赞成票
- 拿到的票数同时还需要大于等于哨兵配置文件中的
quorum
值
为什么哨兵节点至少要有 3 个?
如果哨兵集群中只有2个哨兵节点,此时如果一个哨兵想要成功成为
Leader
,必须获得2票,而不是1票。如果哨兵集群中有个哨兵挂掉了,那么就只剩一个哨兵了,如果这个哨兵想要成为
Leader
,这时票数就没办法达到2票,就无法成功成为Leader
,这时是无法进行主从节点切换的。因此,通常至少会配置3个哨兵节点。这时,如果哨兵集群中有个哨兵挂掉了,那么还剩下两个个哨兵,如果这个哨兵想要成为
Leader
,这时还是有机会达到2票的,所以还是可以选举成功的,不会导致无法进行主从节点切换。如果 3 个哨兵节点,挂了 2 个怎么办?
这个时候得人为介入了,或者增加多一点哨兵节点
Redis 1 主4从,5个哨兵 ,
quorum
设置为 3,如果2个哨兵故障,当主节点宕机时,哨兵能否判断主节点“客观下线”?主从能否自动切换?- 哨兵集群可以判定主节点“客观下线”
哨兵集群还剩下 3 个哨兵,当一个哨兵判断主节点“主观下线”后,询问另外 2 个哨兵后,有可能能拿到 3 张赞同票,这时就达到了
quorum
的值,因此,哨兵集群可以判定主节点为“客观下线”。- 哨兵集群可以完成主从切换
当有个哨兵标记主节点为「客观下线」后,就会进行选举
Leader
的过程,因为此时哨兵集群还剩下 3 个哨兵,那么还是可以拿到半数以上(5/2+1=3)的票,而且也达到了quorum
值,满足了选举Leader
的两个条件, 所以就能选举成功,因此哨兵集群可以完成主从切换。领头Sentinel选取规则:
- 所有在线的
Sentinel
都有被选为领头Sentinel
的资格,监视同一个主服务器的多个在线Sentinel
中的任意一个都有可能成为领头Sentinel
- 每次进行领头
Sentinel
选举之后,不论选举是否成功,所有Sentinel
的配置纪元 (configuration epoch)的值都会自增一次,配置纪元实际上就是一个计数器
- 在一个配置纪元里面,所有
Sentinel
都有一次将某个Sentinel
设置为局部领头Sentinel
的机会,并且局部领头一旦设置,在这个配置每个发现主服务器进入客观下线的Sentinel
都会要求其他Sentinel
将自己设置为局部领头Sentinel
- 当一个
Sentinel
(源Sentinel)向另一个Sentinel
(目标Sentinel)发送SENTINEL ismaster-down-by-addr
命令,并且命令中的runid
参数不是*
符号而是源Sentinel
的运行ID时,这表示源Sentinel
要求目标Sentinel
将前者设置为后者的局部领头Sentinel
Sentinel
设置局部领头Sentinel
的规则是先到先得:最先向目标Sentinel
发送设置要求的源Sentinel
将成为目标Sentinel
的局部领头Sentinel
,而之后接收到的所有设置要求都会被目标Sentinel
拒绝
- 目标
Sentinel
在接收到SENTINEL is-master-down-by-addr
命令之后,将向源Sentinel返回 一条命令回复,回复中的leader_runid
参数和leader_epoch
参数分别记录了目标Sentinel
的局部领头Sentinel
的运行ID和配置纪元
- 源
Sentinel
在接收到目标Sentinel
返回的命令回复之后,会检查回复中leader_epoch
参数 的值和自己的配置纪元是否相同,如果相同的话,那么源Sentinel
继续取出回复中的leader_runid
参数,如果leader_runid
参数的值和源Sentinel
的运行ID一致,那么表示目标Sentinel
将源Sentinel
设置成了局部领头Sentinel
- 如果有某个
Sentinel
被半数以上的Sentinel
设置成了局部领头Sentinel
,那么这个Sentinel
成为领头Sentinel
- 因为领头
Sentinel
的产生需要半数以上Sentinel
的支持,并且每个Sentinel
在每个配置纪元里面只能设置一次局部领头Sentinel
,所以在一个配置纪元里面,只会出现一个领头Sentinel
- 如果在给定时限内,没有一个
Sentinel
被选举为领头Sentinel
,那么各个Sentinel
将在一段时间之后再次进行选举,直到选出领头Sentinel
为止
主从故障转移
在选举产生出领头
Sentinel
之后,领头Sentinel
将对已下线的主服务器执行故障转移操作,包含3个步骤:- 在已下线主服务器属下的所有从服务器里面,挑选出一个从服务器,并将其转换为主服务器
- 删除列表中所有处于下线或者断线状态的从服务器,这可以保证列表中剩余的从服务器都是正常在线的。
- 删除列表中所有最近五秒内没有回复过领头Sentinel的INFO命令的从服务器,这可以保证列表中剩余的从服务器都是最近成功进行过通信的
- 删除所有与已下线主服务器连接断开超过down-after-milliseconds*10毫秒的从服务器,可以保证列表中剩余的从服务器都没有过早地与主服务器断开连接。换句话说,列表中剩余的从服务器保存的数据都是比较新的。
新的主服务器是怎样挑选出来的?领头
Sentinel
会将已下线主服务器的所有从服务器保存到一个列表里面,然后按照以下规则,一项一项地对列表进行过滤:领头
Sentinel
将根据从服务器的优先级,对列表中剩余的从服务器进行排序,并选出其中优先级最高的从服务器。如果优先级最高的服务器有个多个,将选择偏移量最大的服务器。如果偏移量最大的服务器有多个,则选择id
最小的服务器。一次故障转移操作中,领头
Sentinel
向被选中的从服务器server2
发送SLAVEOF no one命令的情形:在发送
SLAVEOF no one
命令之后,领头Sentinel
会以每秒一次的频率(平时是每十秒一次),向被升级的从服务器发送INFO
命令,并观察命令回复中的角色(role)信息,当被升级服务器的role
从原来的slave
变为master
时,领头Sentinel
就知道被选中的从服务器已经顺利升级为主服务器了
例如,在上图中领头
Sentinel
会一直向server2
发送INFO
命令,当server2
返回的命令回复从:变为:
的时候,领头Sentinel就知道server2已经成功升级为主服务器了
- 让已下线主服务器属下的所有从服务器改为复制新的主服务器,这一动作可以通过向从服务器发送
SLAVEOF
命令来实现
领头
Sentinel
向已下线主服务器server1
的两个从服务器server3
和server4
发送SLAVEOF
命令,让它们复制新的主服务器server2
:- 将已下线主服务器设置为新的主服务器的从服务器,当这个旧的主服务器重新上线时,它就会成为新的主服务器的从服务器
因为旧的主服务器已经下线,所以这种设置是保存在
server1
对应的实例结构里面的,当 server1
重新上线时,Sentinel
就会向它发送SLAVEOF
命令,让它成为server2
的从服务器哨兵集群如何组成
配置哨兵的信息时,只需要填下面这几个参数,设置主节点名字、主节点的 IP 地址和端口号以及 quorum 值。
不需要填其他哨兵节点的信息,它们是如何感知对方的,又是如何组成哨兵集群的?哨兵节点之间是通过 Redis 的发布者/订阅者机制来相互发现的。
在主从集群中,主节点上有一个名为
__sentinel__:hello
的频道,不同哨兵就是通过它来相互发现,实现互相通信的。在下图中,哨兵A把自己的IP地址和端口的信息发布到
__sentinel__:hello
频道上,哨兵B和C订阅了该频道。那么此时,哨兵B和C就可以从这个频道直接获取哨兵A的IP地址和端口号。然后,哨兵B、C可以和哨兵A建立网络连接。通过这个方式,哨兵 B 和 C 也可以建立网络连接,这样一来,哨兵集群就形成了。
哨兵集群会对「从节点」的运行状态进行监控,那哨兵集群如何知道「从节点」的信息?
主节点知道所有「从节点」的信息,所以哨兵会每10秒一次的频率向主节点发送
INFO
命令来获取所有「从节点」的信息。如下图所示,哨兵B给主节点发送
INFO
命令,主节点接受到这个命令后,就会把从节点列表返回给哨兵。接着,哨兵就可以根据从节点列表中的连接信息,和每个从节点建立连接,并在这个连接上持续地对从节点进行监控。哨兵A和C可以通过相同的方法和从节点建立连接。正式通过
Redis
的发布者/订阅者机制,哨兵之间可以相互感知,然后组成集群,同时,哨兵又通过INFO
命令,在主节点里获得了所有从节点连接信息,于是就能和从节点建立连接,并进行监控了。