牛骨文教育服务平台(让学习变的简单)

服务器与客户端

前面的章节介绍了所有 Redis 的重要功能组件:数据结构、数据类型、事务、Lua 环境、事件处理、数据库、持久化,等等,但是我们还没有对 Redis 服务器本身做任何介绍。

不过,服务器本身并没有多少需要介绍的新东西,因为服务器除了维持服务器状态之外,最重要的就是将前面介绍过的各个功能模块组合起来,而这些功能模块在前面的章节里已经介绍过了,所以本章将焦点放在服务器的初始化过程,以及服务器对命令的处理过程上。

本章首先介绍服务器的初始化操作,观察一个 Redis 服务器从启动到可以接受客户端连接,需要经过什么步骤。

然后介绍客户端是如何连接到服务器的,而服务器又是如何维持多个客户端的不同状态的。

文章最后将介绍命令从发送到处理的整个过程,并列举了一个 SET 命令的执行过程作为例子。

初始化服务器

从启动 Redis 服务器,到服务器可以接受外来客户端的网络连接这段时间,Redis 需要执行一系列初始化操作。

整个初始化过程可以分为以下六个步骤:

  1. 初始化服务器全局状态。
  2. 载入配置文件。
  3. 创建 daemon 进程。
  4. 初始化服务器功能模块。
  5. 载入数据。
  6. 开始事件循环。

以下各个小节将介绍 Redis 服务器初始化的各个步骤。

1. 初始化服务器全局状态

redis.h/redisServer 结构记录了和服务器相关的所有数据,这个结构主要包含以下信息:

  • 服务器中的所有数据库。
  • 命令表:在执行命令时,根据字符来查找相应命令的实现函数。
  • 事件状态。
  • 服务器的网络连接信息:套接字地址、端口,以及套接字描述符。
  • 所有已连接客户端的信息。
  • Lua 脚本的运行环境及相关选项。
  • 实现订阅与发布(pub/sub)功能所需的数据结构。
  • 日志(log)和慢查询日志(slowlog)的选项和相关信息。
  • 数据持久化(AOF 和 RDB)的配置和状态。
  • 服务器配置选项:比如要创建多少个数据库,是否将服务器进程作为 daemon 进程来运行,最大连接多少个客户端,压缩结构(zip structure)的实体数量,等等。
  • 统计信息:比如键有多少次命令、不命中,服务器的运行时间,内存占用,等等。

Note

为了简洁起见,上面只列出了单机情况下的 Redis 服务器信息,不包含 SENTINEL 、 MONITOR 、 CLUSTER 等功能的信息。

在这一步,程序创建一个 redisServer 结构的实例变量 server 用作服务器的全局状态,并将 server 的各个属性初始化为默认值。

server 变量的初始化完成之后,程序进入服务器初始化的下一步:读入配置文件。

2. 载入配置文件

在初始化服务器的上一步中,程序为 server 变量(也即是服务器状态)的各个属性设置了默认值,但这些默认值有时候并不是最合适的:

  • 用户可能想使用 AOF 持久化,而不是默认的 RDB 持久化。
  • 用户可能想用其他端口来运行 Redis ,以避免端口冲突。
  • 用户可能不想使用默认的 16 个数据库,而是分配更多或更少数量的数据库。
  • 用户可能想对默认的内存限制措施和回收策略做调整。

等等。

为了让使用者按自己的要求配置服务器,Redis 允许用户在运行服务器时,提供相应的配置文件(config file)或者显式的选项(option),Redis 在初始化完 server 变量之后,会读入配置文件和选项,然后根据这些配置来对 server 变量的属性值做相应的修改:

  1. 如果单纯执行 redis-server 命令,那么服务器以默认的配置来运行 Redis 。

  2. 另一方面, 如果给 Redis 服务器送入一个配置文件, 那么 Redis 将按配置文件的设置来更新服务器的状态。

比如说, 通过命令 redis-server /etc/my-redis.conf , Redis 会根据 my-redis.conf 文件的内容来对服务器状态做相应的修改。

  1. 除此之外, 还可以显式地给服务器传入选项, 直接修改服务器配置。

举个例子, 通过命令 redis-server --port 10086 , 可以让 Redis 服务器端口变更为 10086

  1. 当然, 同时使用配置文件和显式选项也是可以的, 如果文件和选项有冲突的地方, 那么优先使用选项所指定的配置值。

举个例子, 如果运行命令 redis-server /etc/my-redis.conf --port 10086 , 并且 my-redis.conf 也指定了 port 选项, 那么服务器将优先使用 --port 10086 (实际上是选项指定的值覆盖了配置文件中的值)。

3. 创建 daemon 进程

Redis 默认以 daemon 进程的方式运行。

当服务器初始化进行到这一步时,程序将创建 daemon 进程来运行 Redis ,并创建相应的 pid 文件。

4. 初始化服务器功能模块

在这一步,初始化程序完成两件事:

  • server 变量的数据结构子属性分配内存。
  • 初始化这些数据结构。

为数据结构分配内存,并初始化这些数据结构,等同于对相应的功能进行初始化。

比如说,当为订阅与发布所需的链表分配内存之后,订阅与发布功能就处于就绪状态,随时可以为 Redis 所用了。

在这一步,程序完成的主要动作如下:

  • 初始化 Redis 进程的信号功能。
  • 初始化日志功能。
  • 初始化客户端功能。
  • 初始化共享对象。
  • 初始化事件功能。
  • 初始化数据库。
  • 初始化网络连接。
  • 初始化订阅与发布功能。
  • 初始化各个统计变量。
  • 关联服务器常规操作(cron job)到时间事件,关联客户端应答处理器到文件事件。
  • 如果 AOF 功能已打开,那么打开或创建 AOF 文件。
  • 设置内存限制。
  • 初始化 Lua 脚本环境。
  • 初始化慢查询功能。
  • 初始化后台操作线程。

完成这一步之后,服务器打印出 Redis 的 ASCII LOGO 、服务器版本等信息,表示所有功能模块已经就绪,可以等待被使用了:

               _._
          _.-``__ ""-._
     _.-``    `.  `_.  ""-._           Redis 2.9.7 (7a47887b/1) 32 bit
 .-`` .-```.  ```/    _.,_ ""-._
(    "      ,       .-`  | `,    )     Running in stand alone mode
|`-._`-...-` __...-.``-._|"` _.-"|     Port: 6379
|    `-._   `._    /     _.-"    |     PID: 6717
 `-._    `-._  `-./  _.-"    _.-"
|`-._`-._    `-.__.-"    _.-"_.-"|
|    `-._`-._        _.-"_.-"    |           http://redis.io
 `-._    `-._`-.__.-"_.-"    _.-"
|`-._`-._    `-.__.-"    _.-"_.-"|
|    `-._`-._        _.-"_.-"    |
 `-._    `-._`-.__.-"_.-"    _.-"
     `-._    `-.__.-"    _.-"
         `-._        _.-"
             `-.__.-"

虽然所有功能已经就绪,但这时服务器的数据库还是一片空白,程序还需要将服务器上一次执行时记录的数据载入到当前服务器中,服务器的初始化才算真正完成。

5. 载入数据

在这一步,程序需要将持久化在 RDB 或者 AOF 文件里的数据,载入到服务器进程里面。

如果服务器有启用 AOF 功能的话,那么使用 AOF 文件来还原数据;否则,程序使用 RDB 文件来还原数据。

当执行完这一步时,服务器打印出一段载入完成信息:

[6717] 22 Feb 11:59:14.830 * DB loaded from disk: 0.068 seconds

6. 开始事件循环

到了这一步,服务器的初始化已经完成,程序打开事件循环,开始接受客户端连接。

以下是服务器在这一步打印的信息:

[6717] 22 Feb 11:59:14.830 * The server is now ready to accept connections on port 6379

以下是初始化完成之后,服务器状态和各个模块之间的关系图:

../_images/server.png

客户端连接到服务器

当 Redis 服务器完成初始化之后,它就准备好可以接受外来客户端的连接了。

当一个客户端通过套接字函数 connect 到服务器时,服务器执行以下步骤:

  1. 服务器通过文件事件无阻塞地 accept 客户端连接,并返回一个套接字描述符 fd
  2. 服务器为 fd 创建一个对应的 redis.h/redisClient 结构实例,并将该实例加入到服务器的已连接客户端的链表中。
  3. 服务器在事件处理器为该 fd 关联读文件事件。

完成这三步之后,服务器就可以等待客户端发来命令请求了。

Redis 以多路复用的方式来处理多个客户端,为了让多个客户端之间独立分开、不互相干扰,服务器为每个已连接客户端维持一个 redisClient 结构,从而单独保存该客户端的状态信息。

redisClient 结构主要包含以下信息:

  • 套接字描述符。
  • 客户端正在使用的数据库指针和数据库号码。
  • 客户端的查询缓冲(query buffer)和回复缓存(reply buffer)。
  • 一个指向命令函数的指针,以及字符串形式的命令、命令参数和命令个数,这些属性会在命令执行时使用。
  • 客户端状态:记录了客户端是否处于 SLAVE 、 MONITOR 或者事务状态。
  • 实现事务功能(比如 MULTIWATCH )所需的数据结构。
  • 实现阻塞功能(比如 BLPOPBRPOPLPUSH )所需的数据结构。
  • 实现订阅与发布功能(比如 PUBLISHSUBSCRIBE )所需的数据结构。
  • 统计数据和选项:客户端创建的时间,客户端和服务器最后交互的时间,缓存的大小,等等。

Note

为了简洁起见,上面列出的客户端结构信息不包含复制(replication)的相关属性。

命令的请求、处理和结果返回

当客户端连上服务器之后,客户端就可以向服务器发送命令请求了。

从客户端发送命令请求,到命令被服务器处理、并将结果返回客户端,整个过程有以下步骤:

  1. 客户端通过套接字向服务器传送命令协议数据。
  2. 服务器通过读事件来处理传入数据,并将数据保存在客户端对应 redisClient 结构的查询缓存中。
  3. 根据客户端查询缓存中的内容,程序从命令表中查找相应命令的实现函数。
  4. 程序执行命令的实现函数,修改服务器的全局状态 server 变量,并将命令的执行结果保存到客户端 redisClient 结构的回复缓存中,然后为该客户端的 fd 关联写事件。
  5. 当客户端 fd 的写事件就绪时,将回复缓存中的命令结果传回给客户端。至此,命令执行完毕。

命令请求实例: SET 的执行过程

为了更直观地理解命令执行的整个过程,我们用一个实际执行 SET 命令的例子来讲解命令执行的过程。

假设现在客户端 C1 是连接到服务器 S 的一个客户端,当用户执行命令 SET YEAR 2013 时,客户端调用写入函数,将协议内容 *3 $3 SET $4 YEAR $4 2013 " 写入连接到服务器的套接字中。

当 S 的文件事件处理器执行时,它会察觉到 C1 所对应的读事件已经就绪,于是它将协议文本读入,并保存在查询缓存。

通过对查询缓存进行分析(parse),服务器在命令表中查找 SET 字符串所对应的命令实现函数,最终定位到 t_string.c/setCommand 函数,另外,两个命令参数 YEAR2013 也会以字符串的形式保存在客户端结构中。

接着,程序将客户端、要执行的命令、命令参数等送入命令执行器:执行器调用 setCommand 函数,将数据库中 YEAR 键的值修改为 2013 ,然后将命令的执行结果保存在客户端的回复缓存中,并为客户端 fd 关联写事件,用于将结果回写给客户端。

因为 YEAR 键的修改,其他和数据库命名空间相关程序,比如 AOF 、REPLICATION 还有事务安全性检查(是否修改了被 WATCH 监视的键?)也会被触发,当这些后续程序也执行完毕之后,命令执行器退出,服务器其他程序(比如时间事件处理器)继续运行。

当 C1 对应的写事件就绪时,程序就会将保存在客户端结构回复缓存中的数据回写给客户端,当客户端接收到数据之后,它就将结果打印出来,显示给用户看。

以上就是 SET YEAR 2013 命令执行的整个过程。

小结

  • 服务器经过初始化之后,才能开始接受命令。
  • 服务器初始化可以分为六个步骤:
  1. 初始化服务器全局状态。
  2. 载入配置文件。
  3. 创建 daemon 进程。
  4. 初始化服务器功能模块。
  5. 载入数据。
  6. 开始事件循环。
  • 服务器为每个已连接的客户端维持一个客户端结构,这个结构保存了这个客户端的所有状态信息。
  • 客户端向服务器发送命令,服务器接受命令然后将命令传给命令执行器,执行器执行给定命令的实现函数,执行完成之后,将结果保存在缓存,最后回传给客户端。