标签归档：Redis

Redis中的Lua

发表回复

TL;DR

Redis 中使用 Lua 的相关笔记。

继续阅读 →

PHP中Redis/MySQL的长连接

发表回复

TL;DR

PHP 中针对 Redis / MySQL 的长连接是生命周期级别的长连接，对于同一个进程的每一次请求都不会释放当前连接对象。而针对 TCP Socket 级别的连接是否已断开，则交给操作系统维持。

使用 PDO 对 MySQL 开启持久连接，要注意 PHP 执行的进程数量，不能超过 MySQL 设定的最大连接数。

上述结论的前提是使用 phpredis 扩展，PHP 版本为 5.4.41。

继续阅读 →

Redis里那些有用又有趣的设计

发表回复

TL;DR

Redis 单进程单线程的运行模式，保证了操作的原子性。丰富的数据结构（LIST/HASH/ZSET/KV）以及一些功能(如PUB/SUB)的提供，在日常应用开发过程中可以为MQ和Cache存在。排序、主从与持久化等功能使得 Redis 一定程度上可以作为数据库进行运用。

继续阅读 →

使用Nagios监控Redis-按内存使用率监控

发表回复

概述

本文是使用Nagios监控Redis 的补充记录。

根据前期选用的插件，通过直接针对 used_memory_rss 设定监控阈值完成监控，而这一阈值的问题在于是使用字节数的表示的，如果要按照36GB的70%设定阈值监控，就需要将监控的值设定为(结果已四舍五入)：

36 * 1024 * 1024 * 1024 * 0.7 = 27058293965

1	36 * 1024 * 1024 * 1024 * 0.7 = 27058293965

这一数字对于config文件来说，以及监控用户来说并不友好。

解决

插件本身也提供了直接通过使用率进行监控的使用方式，我们所需要做的就是告知插件对应实例的最大内存容量，即：

-M, --total_memory=NUM[B|K|M|G]
   Amount of memory on a system for memory utilization calculations above.
   If it does not end with K,M,G then its assumed to be B (bytes)

-M, --total_memory=NUM[B|K|M|G]

Amount of memory on a system for memory utilization calculations above.

If it does not end with K,M,G then its assumed to be B (bytes)

这一参数可以使用人类友好的单位表示方式表示数值。

同时设定阈值需要使用 -m 参数，即：

-m, --memory_utilization=[WARN,CRIT]
   This calculates percent of total memory on system used by redis, which is
      utilization=redis_memory_rss/total_memory*100.
   Total_memory on server must be specified with -M since Redis does not report
   it and can use maximum memory unless you enabled virtual memory and set a limit
   (I plan to test this case and see if it gets reported then).
   If you specify -m by itself, the plugin will just output this info,
   with '-f' it will also include this in performance data. You can also specify
   parameter values which are interpreted as WARNING and CRITICAL thresholds.

-m, --memory_utilization=[WARN,CRIT]

This calculates percent of total memory on system used by redis, which is

utilization=redis_memory_rss/total_memory*100.

Total_memory on server must be specified with -M since Redis does not report

it and can use maximum memory unless you enabled virtual memory and set a limit

(I plan to test this case and see if it gets reported then).

If you specify -m by itself, the plugin will just output this info,

with '-f' it will also include this in performance data. You can also specify

parameter values which are interpreted as WARNING and CRITICAL thresholds.

即通过逗号分隔 warn 与 critical 两个级别的报警阈值。如同手册所说的，必须与 -M 同时使用。

我们所需要做的就是在 /nip/etc/objects/commands.cfg （nip即nagios安装目录的缩写，根据实际情况决定）中新增或者修改一个命令：

define command {
    command_name    check_redis_with_max_mem
    command_line    $USER1$/check_redis.pl -H $HOSTADDRESS$ -p $ARG1$ -M $ARG2$ -m $ARG3$ -a $ARG4$ -w $ARG5$ -c $ARG6$ -f
}

define command {

command_name check_redis_with_max_mem

command_line $USER1$/check_redis.pl -H $HOSTADDRESS$ -p $ARG1$ -M $ARG2$ -m $ARG3$ -a $ARG4$ -w $ARG5$ -c $ARG6$ -f

}

同时在 /nip/etc/conf/services.cfg 中使用这一命令：

check_command           check_redis_with_max_mem!6379!36G!70,90!'used_memory_human,used_memory_peak_human,used_memory_rss'!~,~,~!~,~,~

1	check_command check_redis_with_max_mem!6379!36G!70,90!'used_memory_human,used_memory_peak_human,used_memory_rss'!~,~,~!~,~,~

当然，也可以修改插件完成。

以上。

使用Nagios监控Redis

发表回复

近期新上项目之后出现了后台服务的一些诡异的问题，追查之后发现居然有个Redis的实例把分配的几十G内存给用满了……

终于意识到之前“土法炼钢”的不科学的地方，惭愧之余迅速的想要给Redis加上基本的监控。

最初的想法是直接自己写脚本轮询各个实例的info信息，然后自行parse，当前运行Redis的实例不多，感觉工作量并不大，然而这时候想起组内之前的监控是在用Nagios，觉得为什么不让更专业的软件来完成这项工作呢？于是决定通过Nagios来完成监控。

以下会使用/nip指代Nagios的安装路径，以实际安装路径为准。

Nagios配置

Nagios分为Server和Client，通过各个插件完成对Client的监控，并且在Server中收集展现。

既然运用了Nagios，自然就要按照它的设计思路来进行使用，其实也就是使用合适的插件，同时也不想再造轮子，Google之后确定使用这一项目中的check_redis.pl插件（然而这一文件自2013年7月之后没有过更新了……），这一插件从功能上基本上满足了我对使用内存、连接数、key个数、特定队列长度的监控需求。

这一插件基本上是帮助完成了从redis-cli -h host -p port info到Nagios的收集展现过程，所以本身只要在Server上安装即可。

安装插件

安装插件本身并不复杂，只需要download & copy即可，即copy到/nip/libexec目录，并chmod +x赋予可执行权限即可。

然而，真正头疼的是这个插件的依赖安装，由于在服务器上初始化cpan的工作始终无法完成，无奈之下只好通过手工安装依赖。

这一插件的依赖分别是：

ExtUtils-MakeMaker
IO-Socket-Timeout
Try-Tiny
Redis

可以在cpan的网站上搜索下载tar.gz文件，解压后基本都通过：

perl Makefile.PL
make
sudo make install

perl Makefile.PL

make

sudo make install

这一过程完成依赖的安装过程。

配置Nagios

想要让监控正常的run起来，配置也是很关键的一个因素，个人认为，配置主要针对监控对象以及监控动作。

监控对象

对于监控对象来说，其实就是标明哪台Server上有着对应的服务，同时还可以对他们进行分组。

监控对象的声明，可以在/nip/etc/conf/hosts.cfg中的对应Server配置中增加一个别名，如：

define host{
    use linux-server
    host_name 192.168.1.101
    address 192.168.1.101
    contact_groups admins,redis_dba
    alias redis-linux
}

define host{

use linux-server

host_name 192.168.1.101

address 192.168.1.101

contact_groups admins,redis_dba

alias redis-linux

}

声明的别名会在报警邮件中得以展现。

同时，需要在/nip/etc/conf/hostgroups.cfg中，为这一批机器分组，以便对一组实例完成监控。

define hostgroup {
    hostgroup_name  Redis_Servers_9101
    alias           Redis Servers 9101
    members         192.168.1.101,192.168.1.102,192.168.1.103
}

define hostgroup {

hostgroup_name Redis_Servers_9101

alias Redis Servers 9101

members 192.168.1.101,192.168.1.102,192.168.1.103

}

监控动作

对Redis监控，首先要保证Redis实例可访问，不过这一点不用特别配置Nagios,我们需要做的只是针对我们关心数值，进行声明以及配置报警阈值即可。

首先需要在/nip/objects/commands.cfg中配置一个检查指令：

define command {
    command_name    check_redis
    command_line    $USER1$/check_redis.pl -H $HOSTADDRESS$ -p $ARG1$ -a $ARG2$ -w $ARG3$ -c $ARG4$ -f
}

define command {

command_name check_redis

command_line $USER1$/check_redis.pl -H $HOSTADDRESS$ -p $ARG1$ -a $ARG2$ -w $ARG3$ -c $ARG4$ -f

}

以上参数的含义可以通过/nip/libexec/check_redis.pl --help查看详情：

...
-H, --hostname=ADDRESS
   Hostname or IP Address to check
 -p, --port=INTEGER
   port number (default: 6379)
...
-a, --variables=STRING[,STRING[,STRING...]]
   List of variables from info data to do threshold checks on.
   ...
 -w, --warn=STR[,STR[,STR[..]]]
   ...
 -c, --crit=STR[,STR[,STR[..]]]
   ...

Performance Data Processing Options:
 -f, --perfparse
   This should only be used with '-a' and causes variable data not only as part of
   main status line but also as perfparse compatible output (for graphing, etc).

...

-H, --hostname=ADDRESS

Hostname or IP Address to check

-p, --port=INTEGER

port number (default: 6379)

...

-a, --variables=STRING[,STRING[,STRING...]]

List of variables from info data to do threshold checks on.

...

-w, --warn=STR[,STR[,STR[..]]]

...

-c, --crit=STR[,STR[,STR[..]]]

...

Performance Data Processing Options:

-f, --perfparse

This should only be used with '-a' and causes variable data not only as part of

main status line but also as perfparse compatible output (for graphing, etc).

上述command的含义为针对主机 $HOSTADDRESS$ 的指定端口 $ARG1$ ，检查参数为 $ARG2$ （可以对照redis-cli info），在 $ARG3$ 设定WARNING级别告警的数值，在 $ARG4$ 设定CRITICAL级别告警的数值，同时生成数据（-f）。

在配置完监控指令之后，还需要针对之前的已经声明的主机组配置使用监控指令进行监控，在/nip/etc/conf/services.cfg增加一项配置：

define service {
    use                     generic-service
    hostgroup_name          Redis_Servers_9101
    service_description     Redis Pool
    # WARN: 40G*0.7 CRIT: 40G*0.9
    check_command           check_redis!5104!'used_memory_human,used_memory_peak_human,used_memory_rss,total_keys'!~,~,30064771072,300000!~,~,38654705664,400000
}

define service {

use generic-service

hostgroup_name Redis_Servers_9101

service_description Redis Pool

# WARN: 40G*0.7 CRIT: 40G*0.9

check_command check_redis!5104!'used_memory_human,used_memory_peak_human,used_memory_rss,total_keys'!~,~,30064771072,300000!~,~,38654705664,400000

}

此处根据个人的实际业务情况，当使用的内存超过28G（30064771072 = 40 * 0.7 * 1024 * 1024 * 1024，以下类比）或者key个数超过30w个时会发出WARNING信息，而在当使用36G内存或者key个数超过40w个时，发出CRITICAL警报。

Nagios的check_command在参数前使用!，之后的数值针对每一个监控属性，~表示不关注，而对应位置的数值则标称各自的报警阈值。

最后

修改了配置之后，Nagios需要重启才能开始执行监控，那么为了防止因为修改配置而出错，需要通过Nagios先行检测配置文件的正确性：

sudo /nip/bin/nagios -v /nip/etc/nagios.cfg

1	sudo /nip/bin/nagios -v /nip/etc/nagios.cfg

Nagios的报错信息非常详细，基本可以直接定位到出错的行数。

检查正确之后自然就是重启，等待数据的到来。