扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
这篇文章给大家介绍同一份数据Redis需要存两次法人原因是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
建网站原本是网站策划师、网络程序员、网页设计师等,应用各种网络程序开发技术和网页设计技术配合操作的协同工作。创新互联专业提供成都网站设计、成都网站建设,网页设计,网站制作(企业站、响应式网站开发、电商门户网站)等服务,从网站深度策划、搜索引擎友好度优化到用户体验的提升,我们力求做到极致!Redis
中的集合对象是一个包含字符串类型元素的无序集合,集合中元素不可重复。
集合对象的底层数据结构有两种:intset
和hashtable
。内部通过编码来进行区分:
编码属性 | 描述 | object encoding命令返回值 |
---|---|---|
OBJ_ENCODING_INTSET | 使用整数集合实现的集合对象 | intset |
OBJ_ENCODING_HT | 使用字典实现的集合对象 | hashtable |
intset 编码
intset
(整数集合)可以保存类型为int16_t
,int32_t
,int64_t
的整数值,并且保证集合中没有重复元素。intset
数据结构定义如下(源码inset.h
内):
typedef struct intset { uint32_t encoding;//编码方式 uint32_t length;//当前集合中的元素数量 int8_t contents[];//集合中具体的元素 } intset;
下图就是一个intset
的集合对象存储简图:
encoding
在intset
内部的encoding
记录了当前整数集合的数据存储类型,主要有三种:
INTSET_ENC_INT16
此时contents[]
内的每个元素都是一个int16_t
类型的整数值,范围是:-32768 ~ 32767(-2 的 15 次方 ~ 2 的 15 次方 - 1)。
INTSET_ENC_INT32
此时contents[]
内的每个元素都是一个int32_t
类型的整数值,范围是:-2147483648 ~ 2147483647(-2 的 31 次方 ~ 2 的 31 次方 - 1)。
INTSET_ENC_INT64
此时contents[]
内的每个元素都是一个int64_t
类型的整数值,范围是:-9223372036854775808 ~ 9223372036854775807(-2 的 63 次方 ~ 2 的 63 次方 - 1)。
contents[]
contents[]
虽然结构的定义上写的是int8_t
类型,但是实际存储类型是由上面的encoding
来决定的。
整数集合的升级
假如一开始整数集合中的元素都是16
位的,采用int16_t
类型来存储,此时需要再存储一个32
位的整数,那么就需要对原先的整数集合进行升级,升级之后才能将32
位的整数存储到整数集合内。这就涉及到了整数集合的类型升级,升级过程主要有4
个步骤:
根据新添加元素的类型来扩展底层数组空间的大小,按照升级后现有元素的位数来分配新的空间。
将现有的元素进行类型转换,并将转换类型后的元素从后到前逐个重新放回到数组内。
将新元素放到数组的头部或者尾部(因为触发升级的条件就是当前数组的整数类型无法存储新元素,所以新元素要么比现有元素都大,要么就比现有元素都小)。
将encoding
属性修改为新的编码,并且同步修改length
属性。
PS:和字符串对象的编码一样,整数集合的类型一旦发生升级,将会保持编码,无法降级。
升级示例
假如我们有一个集合存储的encoding
是int16_t
,内部存储了3
个元素:
这时候需要插入一个整数50000
,发现存储不下去,而50000
是一个int32_t
类型整数,所以需要申请新空间,申请空间大小为4 * 32 - 48=80
。
现在新的数组内要放置4
个元素,原来的数组排在第3
,所以需要将升级后的3
移动到64-95
位。
继续将升级后的2
移动到32-63
位。
继续将升级后的1
移动到0-31
位。
然后会将50000
放到96-127
位。
最后会修改encoding
和length
属性,修改之后就完成了本次的升级。
hashtable 编码
hashtable
结构在前面讲述哈希对象的时候进行过详细分析,想详细了解的可以点击这里。
intset 和 hashtable 编码转换
当一个集合满足以下两个条件时,Redis
会选择使用intset
编码:
集合对象保存的所有元素都是整数值。集合对象保存的元素数量小于等于512
个(这个阈值可以通过配置文件set-max-intset-entries
来控制)。
一旦集合中的元素不满足上面两个条件,则会选择使用hashtable
编码。
集合对象常用命令
sadd key member1 member2:将一个或多个元素member
加入到集合key
当中,并返回添加成功的数目,如果元素已存在则被忽略。
sismember key member:判断元素member
是否存在集合key
中。
srem key member1 member2:移除集合key
中的元素,不存在的元素会被忽略。
smove source dest member:将元素member
从集合source
中移动到dest
中,如果member
不存在,则不执行任何操作。
smembers key:返回集合key
中所有元素。
了解了操作集合对象的常用命令,我们就可以来验证下前面提到的哈希对象的类型和编码了,在测试之前为了防止其他key
值的干扰,我们先执行flushall
命令清空Redis
数据库。
依次执行如下命令:
sadd num 1 2 3 //设置 3 个整数的集合,会使用 intset 编码 type num //查看类型 object encoding num //查看编码 sadd name 1 2 3 test //设置 3 个整数和 1 个字符串的集合,会使用 hashtable 编码 type name //查看类型 object encoding name //查看编码
得到如下效果:
可以看到,当设置的元素里面只有整数时,集合使用的就是intset
编码,当设置的元素中含有非整数时,使用的就是hashtable
编码。
五种基本类型之有序集合对象
Redis
中的有序集合和集合的区别是有序集合中的每个元素都会关联一个double
类型的分数,然后按照分数从小到大的顺序进行排列。换句话说,有序集合的顺序是由我们自己设值的时候通过分数来确定的。
有序集合对象的底层数据结构有两种:skiplist
和ziplist
。内部同样是通过编码来进行区分:
编码属性 | 描述 | object encoding命令返回值 |
---|---|---|
OBJ_ENCODING_SKIPLIST | 使用跳跃表实现的有序集合对象 | skiplist |
OBJ_ENCODING_ZIPLIST | 使用压缩列表实现的有序集合对象 | ziplist |
skiplist 编码
skiplist
即跳跃表,有时候也简称为跳表。使用skiplist
编码的有序集合对象使用了zset
结构来作为底层实现,而zset
中同时包含了一个字典和一个跳跃表。
跳跃表
跳跃表是一种有序的数据结构,其主要特点是通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。
大部分情况下,跳跃表的效率可以等同于平衡树,但是跳跃表的实现却远远比平衡树的实现简单,所以Redis
选择了使用跳跃表来实现有序集合。
下图是一个普通的有序链表,我们如果想要找到35
这个元素,只能从头开始遍历到尾(链表中元素不支持随机访问,所以不能用二分查找,而数组中可以通过下标随机访问,所以二分查找一般适用于有序数组),时间复杂度是O(n)
。
那么假如我们可以直接跳到链表的中间,那就可以节省很多资源了,这就是跳表的原理,如下图所示就是一个跳表的数据结构示例:
上图中level1
,level2
,level3
就是跳表的层级,每一个level
层级都有一个指向下一个相同level
层级元素的指针,比如上图我们遍历寻找元素35
的时候就有三种方案:
第1
种就是执行level1
层级的指针,需要遍历7
次(1->8->9->12->15->20->35)才能找到元素35
。
第2
种就是执行level2
层级的指针,只需要遍历5
次(1->9->12->15->35)就能找到元素35
。
第3
种就是执行level3
层级的元素,这时候只需要遍历3
次(1->12->35)就能找到元素35
了,大大提升了效率。
skiplist 的存储结构
跳跃表中的每个节点是一个zskiplistNode
节点(源码server.h
内):
typedef struct zskiplistNode { sds ele;//元素 double score;//分值 struct zskiplistNode *backward;//后退指针 struct zskiplistLevel {//层 struct zskiplistNode *forward;//前进指针 unsigned long span;//当前节点到下一个节点的跨度(跨越的节点数) } level[]; } zskiplistNode;
level(层)
level
即跳跃表中的层,其是一个数组,也就是说一个节点的元素可以拥有多个层,即多个指向其他节点的指针,程序可以通过不同层级的指针来选择最快捷的路径提升访问速度。
level
是在每次创建新节点的时候根据幂次定律(power law)随机生成的一个介于1~32
之间的数字。
forward
(前进指针)
每个层都会有一个指向链表尾部方向元素的指针,遍历元素的时候需要使用到前进指针。
span
(跨度)
跨度记录了两个节点之间的距离,需要注意的是,如果指向了NULL
的话,则跨度为0
。
backward
(后退指针)
和前进指针不一样的是后退指针只有一个,所以每次只能后退至前一个节点(上图中没有画出后退指针)。
ele
(元素)
跳跃表中元素是一个sds
对象(早期版本使用的是redisObject
对象),元素必须不能重复。
score
(分值)
节点的分值是一个double
类型的浮点数,跳跃表中会将节点按照分值按照从小到大的顺序排列,不同节点的分值可以重复。
上面介绍的只是跳跃表中的一个节点,多个zskiplistNode
节点组成了一个zskiplist
对象:
typedef struct zskiplist { struct zskiplistNode *header, *tail;//跳跃表的头节点和尾结点指针 unsigned long length;//跳跃表的节点数 int level;//所有节点中较大的层数 } zskiplist;
到这里你可能以为有序集合就是用这个zskiplist
来实现的,然而实际上Redis
并没有直接使用zskiplist
来实现,而是用zset
对象再次进行了一层包装。
typedef struct zset { dict *dict;//字典对象 zskiplist *zsl;//跳跃表对象 } zset;
所以最终,一个有序集合如果使用了skiplist
编码,其数据结构如下图所示:
上图中上面一部分中的字典中的key
就是对应了有序集合中的元素(member
),value
就对应了分值(score
)。上图中下面一部分中跳跃表整数1,8,9,12
也是对应了元素(member
),最后一排的double
型数字就是分值(score
)。
为什么同时选择使用字典和跳跃表
有序集合直接使用跳跃表或者单独使用字典完全可以独自实现,但是我们想一下,如果单独使用跳跃表来实现,那么虽然可以使用跨度大的指针去遍历元素来找到我们需要的数据,但是其复杂度仍然达到了O(logN)
,而字典中获取一个元素的复杂度是O(1)
,而如果单独使用字典虽然获取元素很快,但是字典是无序的,所以如果要范围查找就需要对其进行排序,这又是一个耗时的操作,所以Redis
综合了两种数据结构来较大程度的提升性能,这也是Redis
设计的精妙之处。
ziplist 编码
压缩列表在列表对象和哈希对象都有使用到,想详细了解的可以点击这里。
ziplist 和 skiplist 编码转换
当有序集合对象同时满足以下两个条件时,会使用ziplist
编码进行存储:
有序集合对象中保存的元素个数小于128
个(可以通过配置zset-max-ziplist-entries
修改)。
有序集合对象中保存的所有元素的总长度小于64
字节(可以通过配置zset-max-ziplist-value
修改)。
有序集合对象常用命令
zadd key score1 member1 score2 member2:将一个或多个元素(member
)及其score
添加到有序集合key
中。
zscore key member:返回有序集合key
中member
成员的score
。
zincrby key num member:将有序集合key
中的member
加上num
,num
可以为负数。
zcount key min max:返回有序集合key
中score
值在[min,max]
区间的member
数量。
zrange key start stop:返回有序集合key
中score
从小到大排列后在[start,stop]
区间的所有member
。
zrevrange key start stop:返回有序集合key
中score
从大到小排列后在[start,stop]
区间的所有member
。zrangebyscore key min max:返回有序集合中按score
从小到大排列后在[min,max]
区间的所有元素。
注意这里默认是闭区间,但是可以在max
和min
的数值前面加上(
或者[
来控制开闭区间。zrevrangebyscore key max min:返回有序集合中按score
从大到小排列后在[min,max]
区间的所有元素。
注意这里默认是闭区间,但是可以在max
和min
的数值前面加上(
或者[
来控制开闭区间。
zrank key member:返回有序集合中member
中元素排名(从小到大),返回的结果从0
开始计算。
zrevrank key member:返回有序集合中member
中元素排名(从大到小),返回的结果从0
开始计算。
zlexcount key min max:返回有序集合中min
和max
之间的member
数量。
注意这个命令中的min
和max
前面必须加(
或者[
来控制开闭区间,特殊值-
和+
分别表示负无穷和正无穷。
了解了操作有序集合对象的常用命令,我们就可以来验证下前面提到的哈希对象的类型和编码了,在测试之前为了防止其他key
值的干扰,我们先执行flushall
命令清空Redis
数据库。
在执行命令之前,我们先把配置文件中的参数zset-max-ziplist-entries
修改为2
,然后重启Redis
服务。
重启完成之后依次执行如下命令:
zadd name 1 zs 2 lisi //设置 2 个元素会使用 ziplist type name //查看类型 object encoding name //查看编码 zadd address 1 beijing 2 shanghai 3 guangzhou 4 shenzhen //设置4个元素则会使用 skiplist编码 type address //查看类型 object encoding address //查看编码
得到如下效果:
关于同一份数据Redis需要存两次法人原因是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流