通过本文快速掌握:
1、什么是Redis的大key
2、Redis大key如何查找
3、Redis的大key如何解决
4、Redis的大Key有什么危害
5、怎样处理Redis的大key
什么是大key
所谓的大key问题是某些key的value比较大,所以本质上是大value问题。
官网推荐的key和string类型value限制均为512MB。
https://redis.io/docs/manual/keyspace/#keys
https://redis.io/docs/data-types/strings/
那么什么才叫大 key?普遍认同的规范是:
- string类型的value > 10kb,即认定为大 key
- 像list,set,hash 等容器类型的 redis key,元素数量 > 5000,即认定为大 key
在开发当中注意大key的问题就好了,尽可能的不要将value的值设置的太大
大key会造成什么影响
- 阻塞工作线程:如果我们使用del命令删除大key,会阻塞工作线程这样就没有办法处理其他客户端发过来的命令了。
- 内存分布不均: 集群模型在slot分片均匀情况下会出现数据和查询倾斜的情况,部分有大key的Redis结点占用内存较多。
- 性能下降。大Key会占用大量内存空间,导致内存碎片增加,进而影响Redis的性能。对于大Key的操作,如读取、写入、删除等,都会消耗更多的CPU时间和内存资源,进一步降低系统性能。
- 引发网络阻塞: 每次获取大key产生的网络流量比较大,这对于网卡比较小的服务器是灾难性的。
如何找出大key
- 使用命令 --bigkeys
–bigkeys 是以 scan 延迟计算的方式扫描所有 key,因此执行过程中不会阻塞 redis,但实例存在大量的 keys 时,命令执行的时间会很长,这种情况建议在 slave 上扫描。
# 每隔 100 条 scan 指令就会休眠 0.1s,ops 就不会剧烈抬升,但是扫描的时间会变长
redis-cli -h 127.0.0.1 -p 6379 -a "password" --bigkeys -i 0.1
- 使用rdb_bigkeys工具
- redis-rdb-tools工具
使用redis-rdb-tools离线分析工具来扫描RDB持久化文件,虽然实时性略差,但是完全离线对性能无影响。redis-rdb-tools是由Python写的用来分析Redis的rdb快照文件用的工具,它可以把rdb快照文件生成json文件或者生成报表用来分析Redis的使用详情。
如何删除大Key
String类型
一般用于del,如果过于庞大使用unlink(非阻塞式删除)
UNLINK mybigstring
非字符串类型
使用hscan、sscan、zscan方式渐进式删除
$ redis-cli --scan --pattern "testkey-*" | xargs -L 1000 redis-cli del
xargs -L 指令表示xargs一次读取的行数,也就是每次删除key的数量,不要一次行读取太多数量key。
如何优化大Key呢?
- 分割大 key:将大 key 拆分成多个小 key 来存储数据。例如,如果一个大型哈希表存储了大量的数据,可以将它拆分成多个小的哈希表,每个哈希表存储一部分数据。这样可以降低每个 key 的大小,并使 Redis 更加稳定和高效。
- 使用适当的数据结构:选择适当的 Redis 数据结构,以减少单个 key 的大小。例如,如果要存储大量元素,应该使用 Redis 集合或有序集合,而不是使用列表。
- 定期清理数据:定期清理 Redis 中的过期数据和不必要的数据,以避免大 key 的大小增长。可以使用 Redis 内置的过期机制或手动清理不必要的数据。
- 压缩数据:使用 Redis 的数据压缩功能,将大 key 中的数据进行压缩,可以减少每个 key 的大小,从而提高 Redis 的性能和可用性。
- 按需加载数据:不要在一次性将整个大 key 加载到内存中,而是按需加载数据,可以降低 Redis 的内存使用率,从而提高性能。