一文搞懂redis

Redis概述

介绍

redis是一个开源的key-value存储系统
和Memcached类似，它支持的value类型相对更多，包括String(字符串)、List(链表)、Hash(哈希)、Set(无需不重复集合)、ZSet(sorted set有一定顺序的集合)
与memecached一样，redis数据都缓存在内存中
区别是redis会周期性的把更新的数据写入到磁盘或者把修改操作追加到记录文件
并且再次基础上实现了master-slaver（主从同步）

应用场景

配合关系型数据库做告诉缓存，减少数据库IO
分布式架构，做session共享
多样的数据结构存储持久化数据

相关技术

redis是单线程 + 多路IO复用的技术
与memcache三点不同：支持多种数据类型，支持持久化，单线程+ 多路IO复用
多路IO复用是一种同步IO模型，实现一个线程可以处理多个IO请求。也就是在redis单线程的基础上，实现了单线程redis同时处理多个IO请求。多路指的值多个网络连接，复用是指的是复用一个redis线程。其实这里也不是同时处理，只是处理请求的耗时特别短，所以时间拉长看的话，就是一个线程处理了多个IO请求。比如说redis实现了1s可以对11万次。

redis的数据类型

String(字符串)

概述
- String是最基本的数据类型，可以理解为和memcached一样，一个key对应一个value。
- String类型是二进制安全的。意味着redis的String类型可以包含任何数据。比如jpg图片和序列化对象。
- String是redis最基本的数据类型，一个字符串的value最大可以是512M。
数据结构
- String的数据结构是动态字符串，是可以修改的字符串，内部结构类似Java的ArrayList，采用预分配冗余空间的方式减少内存的频繁分配。

List(列表)

概述
- 单键多值，redis的list列表是最简单的字符串列表，按照插入顺序排序。可以添加一个元素在列表的头部或者尾部。
- 它的底层其实是一个双向链表，对两端的操作性能很高，通过索引下标操作中间节点的性能较差。
数据结构
- List的数据结构为快速链表，也就是quickList。
- 首先在链表元素较少的情况下使用一段连续的内存存储，这个结构是ziplist,也就是压缩列表。它将所有的元素紧挨着一起存储，分配的是一整块连续的内存。
- 当数据量较多的时候才会改为quicklist，也就是快速链表。因为普通的链表需要的附加指针空间太大，会比较浪费空间。
- redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能，又不会浪费太大的空间。

Set（无须不重复集合）

概述
- redis的set集合对外提供的功能和list类似，是一个列表的功能，特殊之处是set可以自动排重，当你需要存储一个列表数据，又不希望有重复数据的时候，set集合是一个很好的选择。并且set集合提供了判断某个成员是否在set集合内的重要接口，这也是list所不能提供的。
- redis的set是String类型的无序集合。它底层是一个value为null的哈希表，所以添加、查找、删除的时间复杂度都是o(1)。
- 一个算法，随着数据的增加，如果时间复杂度是o(1),查找数据的时间不变。
数据结构
- set的数据结构是dict字典，字典是用哈希表实现的。
- Java中的HashSet内部也是会用HashMap实现的，只不过所有的value都指向同一个对象。redis的set也是一样的，它的内部也是hash结构，所有的数据都指向同一个内部值。（意思是HashSet所有的key都有一个默认的value，你是HashSet是不允许key重复的，所以只允许有一个为null的key）

Hash(哈希)

概述
- redis的hash是一个键值对集合（类似Java中的Map）。
- redis的hash是一个String类型的key和value的映射表，hash特别适合存储对象。
数据结构
- Hash对应的数据结构是两种，一种是ziplist(压缩列表),hashtable(哈希表)。当key-value长度较短且个数较少的时候，使用ziplist，否则使用hashtable。

Zset(Sorted set)

概述
- redis的zset集合和set集合非常的相似，是一个没有重复元素的字符串集合。
- 不同之处是zset每个成员都关联了一个score（评分），这个score(评分)是被用来按照从最低到最高排序的标准，集合中的成员是唯一的，但是score是可以重复的。
- 因为元素是有序的，所以也可以很快根据score或者position来获取一个范围的元素。
- 访问一个有序集合也是非常快的，因此你能用有序集合作为一个没有重复成员的智能列表。
数据结构
- zset(sorted set)是redis提供的一个非常特别的数据结构，一方面他等价于Java的Map，可以给每一个成员赋值一个权重score，另一方面它有类似treeSet,内部元素会按照score权重进行排序，可得到每个成员的名次，还可以通过score的范围获取元素列表。
- zset使用了两个数据结构：
  - hash，hash的作用就是关联value和权重score，保障元素value的唯一性，可以通过value找到对应的score值。
  - 跳跃表，跳跃表的目的在于给元素value排序，根据score的范围获取元素列表。

Bitmaps

概述
- Redis提供了Bitmaps这个“数据类型”可以实现对位的操作：
  - Bitmaps本身不是一种数据类型，实际上它就是字符串（key-value），但是它可以对字符串的位进行操作。
  - Bitmaps单独提供了一套命令，所以在Redis中使用Bitmaps和使用字符串的方法不太相同。可以把Bitmaps想象成一个以位为单位的数组，数组的每个单元只能存储0和1，数组的下标在Bitmaps中叫做偏移量。

Bitmaps与set对比

假设网站有1亿用户，每天独立访问的用户有5千万，如果每天用集合类型和Bitmaps分别存储活跃用户可以得到表：

set和Bitmaps存储一天活跃用户对比
数据类型	每个用户id占用空间	需要存储的用户量	全部内存量
集合	64位	50000000	64位*50000000 = 400MB
Bitmaps	1位	100000000	1位*100000000 = 12.5MB

很明显，这种情况下使用Bitmaps能节省很多的内存空间，尤其是随着时间推移节省的内存还是非常可观的。

set和Bitmaps存储独立用户空间对比
数据类型	一天	一个月	一年
集合	400MB	12GB	144GB
Bitmaps	12.5MB	375MB	4.5GB

但Bitmaps并不是万金油，假如该网站每天的独立访问用户很少，例如只有10万（大量的僵尸用户），那么两者的对比如下表所示，很显然，这时候使用Bitmaps就不太合适了，因为基本上大部分位都是0。

set和Bitmaps存储一天活跃用户对比（用户比较少）
数据类型	每个userid占用空间	需要存储的用户量	全部内存量
集合	64位	100000	64位*100000 = 800KB
Bitmaps	1位	100000000	1位*100000000 = 12.5MB

HyperLogLog

在工作当中，我们经常会遇到与统计相关的功能需求，比如统计网站PV（PageView页面访问量），可以使用Redis的incr、incrby轻松实现。但像UV（UniqueVisitor独立访客）、独立IP数、搜索记录数等需要去重和计数的问题如何解决？这种求集合中不重复元素个数的问题称为基数问题。

解决基数问题有很多种方案：

1.数据存储在MySQL表中，使用distinct count计算不重复个数。

2.使用Redis提供的hash、set、bitmaps等数据结构来处理。

以上的方案结果精确，但随着数据不断增加，导致占用空间越来越大，对于非常大的数据集是不切实际的。能否能够降低一定的精度来平衡存储空间？Redis推出了HyperLogLog。

Redis HyperLogLog 是用来做基数统计的算法，HyperLogLog 的优点是：在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。
在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。
但是，因为 HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

Geospatial

Redis 3.2 中增加了对GEO类型的支持。GEO，Geographic，地理信息的缩写。该类型，就是元素的2维坐标，在地图上就是经纬度。redis基于该类型，提供了经纬度设置，查询，范围查询，距离查询，经纬度Hash等常见操作。

Redis的发布和订阅

什么是发布和订阅

Redis 发布订阅 (pub/sub) 是一种消息通信模式：发送者 (pub) 发送消息，订阅者 (sub) 接收消息。
Redis 客户端可以订阅任意数量的频道。

Redis事务、锁机制秒杀

Redis事务定义

Redis事务是一个单独的隔离操作：事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中，不会被其他客户端发送来的命令请求所打断。
Redis事务的主要作用就是串联多个命令防止别的命令插队。

Multi、Exec、discard

Redis事务中有Multi、Exec和discard三个指令，在Redis中，从输入Multi命令开始，输入的命令都会依次进入命令队列中，但不会执行，直到输入Exec后，Redis会将之前的命令队列中的命令依次执行。而组队的过程中可以通过discard来放弃组队。

为什么要做成事务

想想一个场景：有很多人有你的账户，同时去参加双十一抢购。

事务冲突的问题

例子
- 一个请求想给金额减8000；
- 一个请求想给金额减5000；
- 一个请求想给金额减1000。
  
  最终我们可以发现，总共金额是10000，如果请求全部执行，那最后的金额变为-4000，很明显不合理。

悲观锁

悲观锁(Pessimistic Lock)，顾名思义，就是很悲观，每次去拿数据的时候都认为别人会修改，所以每次在拿数据的时候都会上锁，这样别人想拿这个数据就会block直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制，比如行锁，表锁等，读锁，写锁等，都是在做操作之前先上锁。

乐观锁

乐观锁(Optimistic Lock)，顾名思义，就是很乐观，每次去拿数据的时候都认为别人不会修改，所以不会上锁，但是在更新的时候会判断一下在此期间别人有没有去更新这个数据，可以使用版本号等机制。乐观锁适用于多读的应用类型，这样可以提高吞吐量。Redis就是利用这种check-and-set机制实现事务的。

WATCH key [key …]
- 在执行multi之前，先执行watch key1 [key2]，可以监视一个(或多个) key ，如果在事务执行之前这个(或这些) key被其他命令所改动，那么事务将被打断。
unwatch
- 取消 WATCH 命令对所有 key 的监视。如果在执行 WATCH 命令之后，EXEC 命令或DISCARD 命令先被执行了的话，那么就不需要再执行UNWATCH 了。

Redis事务三特性

单独的隔离操作：事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中，不会被其他客户端发送来的命令请求所打断。
没有隔离级别的概念：队列中的命令没有提交之前都不会实际被执行，因为事务提交前任何指令都不会被实际执行。
不保证原子性：事务中如果有一条命令执行失败，其后的命令仍然会被执行，没有回滚。

redis事务案例

/**
  * redis事务
  */
@Test
public void test6() {
    //返回值o是由SessionCallback内部方法execute方法返回
    Object o = redisTemplate.execute(new SessionCallback

一文搞懂redis

Redis概述

redis的数据类型

Redis的发布和订阅

Redis事务、锁机制秒杀

Redis持久化之RDB

Redis持久化之AOF

Redis主从复制

哨兵模式(sentinel)

Redis集群（cluster模式）

Redis应用问题解决

你可能感兴趣的:(一文搞懂redis)