Redis ziplist内部结构分析

本文来自@凡趣科技 pesiwang同学的投稿分享,对Redis内部ziplist结构的内部实现进行了详细深入的分析。

ziplist是用一个字符串来实现的双向链表结构,顾名思义,使用ziplist可以减少双向链表的存储空间,主要是节省了链表指针的存储,如果存储指向上一个链表结点和指向下一个链表结点的指针需要8个字节,而转化成存储上一个结点长度和当前结点长度在大多数情况下可以节省很多空间(最好的情况下只需2个字节)。但是每次向链表增加元素都需要重新分配内存。

ziplist中的结构体

typedef struct zlentry {
unsigned int prevrawlensize, prevrawlen;
unsigned int lensize, len;
unsigned int headersize;
    unsigned char encoding;
    unsigned char *p;
} zlentry;
  • Prevrawlen:上个链表结点占用的长度
  • Prevrawlensize:上个链表结点长度的存储占用的字节数
  • Len:当前链表结点占用的长度
  • Lensize:当前链表结点长度的存储占用的字节数
  • Headersize:当前链表结点的头部大小, headersize = prevrawlensize + lensize
  • Encoding:当前链表结点长度(即字段len)使用的编码类型
  • P:指向当前结点起始位置的指针

Ziplist的存储结构

链表存储结构

<zlbytes><zltail><zllen><entry><entry><zlend>

  • Zlbytes:一个4字节的无符号整型,存储的是整个ziplist占用的字节数,用于重分配内存时使用。
  • Zltail:一个4字节的无符号整型,存储的是链表最后一个结点的偏移值,即链表开头地址+zltail即为最后一个结点的起始地址
  • Zllen:一个2字节的无符号整型,存储的是链表中存储的结点数,当这个值存储的是2字节无符号整型的最大值时,需要遍历链表获取链表的结点数
  • Entry:链表结点,链表结点的存储格式见结点存储结构
  • Zlend:占用1字节的链表的结尾符,值为255

相关的宏定义

Ziplist.c: 89

/* Utility macros */
#define ZIPLIST_BYTES(zl)       (*((uint32_t*)(zl)))
#define ZIPLIST_TAIL_OFFSET(zl) (*((uint32_t*)((zl)+sizeof(uint32_t))))
#define ZIPLIST_LENGTH(zl)      (*((uint16_t*)((zl)+sizeof(uint32_t)*2)))
#define ZIPLIST_HEADER_SIZE     (sizeof(uint32_t)*2+sizeof(uint16_t))
#define ZIPLIST_ENTRY_HEAD(zl)  ((zl)+ZIPLIST_HEADER_SIZE)
#define ZIPLIST_ENTRY_TAIL(zl)  ((zl)+ZIPLIST_TAIL_OFFSET(zl))
#define ZIPLIST_ENTRY_END(zl)   ((zl)+ZIPLIST_BYTES(zl)-1)

结点存储结构

<上一个链表结点占用的长度><当前链表结点占用的长度><当前结点数据>

上一个链表结点占用的长度

上一个链表结点占用的长度占用的字节数根据编码类型而定

  • 当长度数据小于254使用一个字节存储,该字节存储的数值就是该长度,
  • 当长度数据大于等于254时,使用5个字节存储,第一个字节的数值为254,表示接下来的4个字节才真正表示长度

当前链表结点用的长度存储和数据存储

第一个字节的前两位用于区分长度存储编码类型和数据编码类型,具体如下

字符串类型编码

|00pppppp|

长度小于等于63(2^6-1)字节的字符串,后6位用于存储字符串长度,长度与类型总共占用了1个字节

|01pppppp|qqqqqqqq|

长度小于等于16383(2^14-1)字节的字符串,后14位用于存储字符串长度,长度与类型总共占用了2个字节

|10______|qqqqqqqq|rrrrrrrr|ssssssss|tttttttt|

长度大于等于16384字节的字符串,后4个字节用于存储字符串长度,长度与类型总共占用了5个字节

整型编码

|1100____|

整型类型,后2个字节存储的值就是该整数

|1101____|

整型类型,后4个字节存储的值就是该整数

|1110____|

整型类型,后8个字节存储的值就是该整数

相关的宏定义

Ziplist.c:77

/* Different encoding/length possibilities */
#define ZIP_STR_06B (0 << 6)
#define ZIP_STR_14B (1 << 6)
#define ZIP_STR_32B (2 << 6)
#define ZIP_INT_16B (0xc0 | 0<<4)
#define ZIP_INT_32B (0xc0 | 1<<4)
#define ZIP_INT_64B (0xc0 | 2<<4)

/* Macro's to determine type */
#define ZIP_IS_STR(enc) (((enc) & 0xc0) < 0xc0)
#define ZIP_IS_INT(enc) (!ZIP_IS_STR(enc) && ((enc) & 0x30) < 0x30)

Ziplist提供的接口

unsigned char *ziplistNew(void);

创建一个ziplist

  • 返回创建的ziplist的指针
unsigned char *ziplistPush(unsigned char *zl, unsigned char *s, unsigned int slen, int where);

在ziplist的尾端或头部添加一个结点

  • zl是ziplist的指针
  • s是待添加结点的值
  • slen是待添加结点的值长度
  • 返回最新的ziplist的指针
unsigned char *ziplistIndex(unsigned char *zl, int index);

根据索引获取ziplist的结点,封装类似数组接口

  • zl是ziplist的指针
  • index是索引,从0开始,0即取链表的第一个结点,index可以是负数,负数表从后往前算,-1就是取链表的最后一个元素
  • 如果index处有结点,则返回指向改结点的指针,否则返回NULL
unsigned char *ziplistNext(unsigned char *zl, unsigned char *p);

获取ziplist的下一个结点

  • zl是无用参数
  • p是当前结点指针
  • 如果还有下一个结点,则返回下一个结点的指针,否则返回NULL
unsigned char *ziplistPrev(unsigned char *zl, unsigned char *p);

获取ziplist的上一个结点

  • zl是ziplist的指针
  • p是当前结点指针
  • 如果还有上一个结点,则返回上一个结点的指针,否则返回NULL

unsigned int ziplistGet(unsigned char *p, unsigned char **sval, unsigned int *slen, long long *lval);

获取p指向的当前结点的值

  • p是指向当前结点的指针
  • sval保存获取到的当前结点的值的指针
  • slen是获取到的当前结点的值的长度
  • lval是当值是整型时保存返回的数值
  • 如果p指向的结点是合法结点返回1,否则返回0
unsigned char *ziplistInsert(unsigned char *zl, unsigned char *p, unsigned char *s, unsigned int slen);

在指针p指向的位置插入一个结点

  • zl是ziplist的指针
  • p是待插入结点的位置
  • s是待插入结点的值
  • slen是待插入结点的值的长度
  • 返回最新的ziplist的指针
unsigned char *ziplistDelete(unsigned char *zl, unsigned char **p);

删掉*p指向的结点

  • zl是ziplist的指针
  • p是一个value-result参数,传入需删除的结点,返回被删除结点下一个结点的指针
  • 返回最新的ziplist的指针
unsigned char *ziplistDeleteRange(unsigned char *zl, unsigned int index, unsigned int num);

删除连续的一批结点

  • zl是ziplist的指针
  • index是开始删除的索引
  • num是删除的个数
  • 返回最新的ziplist的指针
unsigned int ziplistCompare(unsigned char *p, unsigned char *s, unsigned int slen);

p指向的结点的值和s对应的值做比较

  • p是ziplist结点的指针
  • s是呆比较的值
  • slen是s的长度
  • 相等返回1,否则返回0
unsigned int ziplistLen(unsigned char *zl);

取ziplist链表中元素的个数

  • zl是ziplist的指针
  • 返回ziplist链表中元素的个数
size_t ziplistBlobLen(unsigned char *zl);

取ziplist链表占用的字节数

  • zl是ziplist的指针
  • 返回ziplist链表占用的字节数

anyShare据说看到好文章不转的人,服务器容易宕机!
          

无觅相关文章插件,快速提升流量

分类 Redis · tag , ,