LSM-Tree(一)：初识

写在前面：本篇博客为综述《LSM-based Storage Techniques: A Survey》的学习笔记（一），该综述介绍了 LSM-Tree 的前世今生、思想本质、性能权衡、面临问题、优化方案等等，也是我正式接触 LSTM-Tree 的入门导师。综述对 leveling、tiering、partition 等核心观念进行了较为详细的介绍，对 LSM-Tree 的本质理解还是很有帮助的。不过，毕竟只是一篇综述，想要看清 LSM-Tree 光靠这一篇肯定是不够的，所以还参考了其他的博客。

好了，我们开始。

文章目录

- LSM-Tree 诞生之前
- 早期 LSM-Tree
- LSM-Tree 基本结构
- - leveling & tiering
  - partition
  - - partitioned leveling
    - partitioned tiering
    - - vertical grouping
      - horizontal grouping
    - 为什么要分区
- 优化问题

都知道，现在的存储体系大多分为 SQL 和 NoSQL，后者即 K-V 存储，LSM-Tree 就是为它服务的一种底层数据结构。现行的大部分 K-V 存储，比如 Rocksdb、Badger 等底层用的都是 LSM-Tree，虽然进行了一定的优化与变式，但本质还是 LSM。所以，LSM-Tree 是什么？为什么要用到 LSM-Tree，要搞清楚这个问题，就需要先明白在 LSM-Tree 出现之前，K-V 存储是什么样的。

LSM-Tree 诞生之前

一般来讲，K-V 存储在更新时有两种方案供选择，一种叫就地更新（in-place），一种叫地外更新（out-of-place）。所谓就地更新，就是直接将原来的记录改了，换成新的记录，比如把改成，这样一来就没有这个记录了，查询 k1 的值会直接返回 v1，具有很高的读效率。同时，由于更新直接利用原来的空间，不会开辟新的空间，所有具有很高的空间利用率。但是，代价就是写放大，说人话就是写变慢了。在该策略中，每一次写都会造成随机的 I/O，即要先找到那个 key，然后再做更新，就会导致写速率变慢。

于此相反，地外更新不会直接更改原来的，而是将另外存储在一个新的地方，然后打上 version 表示这个记录才是 k1 最新的值。这样一来，写 k1 时，就无需采用随机 I/O 事先找到 k1，而是直接利用顺序 I/O 将新记录附加上去就行了，相比于就地更新，这种策略具有更好的读效率。同时，由于没有覆盖旧记录，所以是利于回滚的。但代价就是，具有读放大与空间放大，这两点很显然，因为同一个 key 对应的记录更多了。

地外更新随后成为主流，它为记录的存储提供了一种新的思路：顺序日志。比如早期的 Postgres 项目，会把所有的写操作附件到一个顺序日志中去，只有当原记录过时后才由垃圾回收机制清理，而不是当场覆盖原记录。

但是很明显，如果日志的结构仅仅是顺序的，那必然不是最优的，因为记录之间潜在的联系没有被利用，大家都像栈元素一样一个一个 push 进日志，肯定是不行的。所以就引出了新的问题，如何进行合理的日志结构化？这就是 LSM 中的 LS 所指的含义，Log-Structured。

那 Merge 指什么呢？实际上，对于某一个 key，除了最新的那条记录外，其他的记录都是冗余无用的，但是仍然占用了存储空间，所以需要不定期的去进行 Merge 来清除掉冗余的记录，而这就是 LSM-Tree 的核心内容。

早期 LSM-Tree

为了解决上面说的问题，LSM-Tree 诞生。就像其名字一样，LSM-Tree 设计的初衷，就是对日志进行一定的合并（merge），来进行冗余记录的清除，并利用合适的日志结构与合并策略来提高写性能。

最开始的 LSM-Tree，由一系列的组件构成，我们把它们记作 C0、C1 … Ck。每一个组件内部都是一个 B+ 树，（当然，到后期就不是了，不过这里先不管）。C0 驻留在内存中，为传入的写操作提供服务，而其余的所有 C 均驻留在磁盘中，进行真正的数据存储。所有的组件之间都是递进的，当且仅当 Ci 存满的时候，会触发合并进程，将 Ci 中的一系列叶页面（leaf page）合并到 Ci+1 中，然后 Ci 继续等待来自 Ci-1 的合并，以此类推。这种策略叫作滚动合并。

值得注意的是，只有当所有组件之间的大小比 Ti = |Ci + 1|/|Ci| 相同时，写入性能才得到优化。我不知道为什么，在 LSM-Tree 的原始论文中有推导，不过我没看，私以为记个结论就行。这一个结论，直接影响到后续有关 LSM-Tree 的实现与优化。

LSM-Tree 基本结构

如今的 LSM-Tree 实现仍然应用地外更新来减少随机 I/O。所有写操作都附加到内存组件中。插入或更新操作只是添加一个新条目，而删除操作则添加一个反事项条目，表明某个键已被删除。当组件满时，多个组件会合并为一个新的组件，而无需修改现有组件，这是前面提到的滚动合并是不一样的。

那么磁盘组件是如何组织并且合并的呢？LSM-Tree 提供了两种合并策略：leveling 和 tiering 。这两种策略都将磁盘组件组织为逻辑级别，级别之间的关系由一个 size ratio 控制，该参数名为 T。

leveling & tiering

leveling 策略中，每一层只有一个磁盘组件，每一个 SSTable 的空间容量满足比率 T，且保持不变。当位于级别 L 的组件被填满时，它就会和位于级别 L+1 的组件合并，注意，是覆盖性合并，即直接更改原 L+1 级的组件。用图来表示，如下：

与此相反，tiering 策略中每一层都有 T 个组件，意味着每层的组件数目都相同。同时，一层中的各个组件大小相同。当级别 L 被填满时（该级别出现了 T 个组件），该层的 T 个组件会合并为一个新的组件，进入级别 L+1。这也就解释了为什么每一层都只能有 T 个组件，因为只有这样才能保证层与层之间的空间容量比为 T。该策略用图来表示，如下：

通常，leveling 策略会优化读性能，因为每一层只有一个组件，搜索的组件数就会少。而 tiering 策略的则优化写性能，因为它降低了合并频率。

下面给出两种策略的各种操作复杂度，有些项的具体推导我暂时还没懂，个人觉得综述里写的推导有点泛，某些我还没看明白。都看懂了我再回来更新。

其中，T 如上文所述，L 表示层级的数量，B 表示页面大小（一页中存有多少个条目），P 表示一个磁盘组件中有多少个页面（虽然最后的结论中没有P）。Long/Short Range Query 指范围查询的长短，由范围中的唯一键数目决定。记查询范围中唯一键的数目为 s，如果 S/B > 2L，那么就称为 Long，反之为 short。此外，在单点查询中为什么 Zero-Result 和 Non-Zero-Result 差别会这么大，这是应为运用了布隆过滤器，这是用来快速判断某个 key 是否存在的工具，但是具有假阳性的概率。在另一篇博客中我会介绍它：布隆过滤器。

定性总结一下：

leveling：读优化、空间优化、写放大；
tiering：写优化、读放大、空间放大；

但实际上，我们现在用的并不是这两种策略，而是采用了分区（partition）的优化。

partition

在阐述 LSM-Tree 的分区策略之前，现简要提一嘴现在各个组件的常用数据结构，直接以 Rocksdb 为例。LSM-Tree有三个重要组成部分：MemTable、Immutable MemTable、SSTable。

MemTable：

MemTable 是在内存中的数据结构，直接服务传入的写操作，并暂存最近更新的数据，即上述提及的组件C0。它会按照 key 有序地组织这些数据，但具体如何组织，不同的存储引擎用的方式不一样。在 Rocksdb 中，采用 跳表（skip-list） 来保证内存中的 key 有序。

因为数据暂存在内存中，没有持久化，因此通常使用 WAL(Write-ahead logging) 的方式来保证数据的可靠性。

ps.）跳表，是个超级牛逼的查找数据结构，可以理解为一个能够实现二分查找的链表。我本来打算写一篇博客记录的，但搜到了一篇非常详细的跳表解析博客，增删查都写的很清晰，尤其是增加操作中的随机索引建立过程，写的很明白，所以这里就直接引用了：skip-list 详细分析
Immutable MemTable：

当 MemTable 达到一定大小后，会转变成 Immutable MemTable。这个东西是将 MemTable 转变为 SSTable 的一种中间状态。在转存过程中，新来的写操作由新的 MemTable 处理，并不会阻塞数据更新。
SSTable：

在 Rocksdb 中，每一个磁盘组件被分为若干个 SSTable。简要说一下，SSTable 包含数据块列表和索引块，数据块存储按 key 排序的键值对，索引块存储所有数据块的 key 范围。对 SSTable 的学习与分析，我也写在了另一篇博客中：SSTable 数据结构分析。

再来看一下，LSM-Tree 的基本结构如下图所示：

注意到，在红框中，已经不是磁盘组件了，而是被分为了多个 SSTable。分区也分为两种，分别针对 leveling 与 tiering，但是在开始介绍两种分区策略之前，请先记住分区的核心思想：

只合并带有重叠键的 SSTable

partitioned leveling

在 partitioned leveling 策略中，每一层依然只有一个磁盘组件，层与层之间的大小比率依然是 T，但是每个磁盘组件都被分为若干个互不重叠且大小相近的 SSTable，这就意味着每个 key 在一层中只会出现一次，不存在冗余。该策略的合并步骤为：

L1 的总大小超过自身空间限制。
从 L1 中至少选择一个 SSTable，然后把它跟 L2 中有重叠的部分进行合并。
合并后生成的新 SSTable 先不着急直接至于 L2 中。因为要保证每一个 SSTable 的大小相近，所以合并后需要先分化成多个小点的 SSTable，然后再置于 L2 中。
如果 L2 合并后的大小超过了自身限制，那么重复上述过程，向 L3 合并。

用一张图来表示，如下：

需要注意的是，L0 的磁盘组件没有分区，因为它们是直接从内存中刷新的。这种设计还可以帮助系统吸收写突发，因为它可以容忍 L0 上的多个未分区组件。

partitioned tiering

不同于 p-leveling，p-tiering 策略允许层级中包含多个键范围重叠的 SSTable，但是这些 SSTable 必须要通过一定的方式组织起来。在该策略中，有两种组织方式可供选择，分别为垂直分组（vertical grouping）与水平分组（horizontal grouping）。

vertical grouping

在垂直分组中，每一层级中具有重叠范围的 SSTable 会被分为一组，使得组与组之间不会产生重叠，这样看来，垂直分组像是 p-leveling 的一种变式。其合并流程为：

L1 的总大小超过自身空间限制。
从 L1 中至少选择一组，然后将该组内的所有 SSTable 合并。
合并后，根据 L2 的分组情况，将合并后的内容分为了多个不重叠的 SSTable。
每一个 SSTable 分别插入 L2 中对应范围的组。
如果 L2 合并后的大小超过了自身限制，那么重复上述过程，向 L3 合并。

用一张图来表示，如下：

horizontal grouping

在水平分组中，每一个磁盘组件都自成一组，组与组之间允许有重叠，但是组内的 SSTable 不会有重叠。其合并流程为：

L1 的总大小超过自身空间限制。
在 L1 的所有组中选择具有重叠键的 SSTable，将它们合并。
将合并后的内容分为了多个不重叠的 SSTable，然后放入 L2 中的某一个组中。
如果 L2 合并后的大小超过了自身限制，那么重复上述过程，向 L3 合并。

用一张图来表示，如下：

为什么要分区

无论是哪种分区策略，都有如下两大优点：

分区将一个大型组件拆分成多个较小的 SSTable，就意味着将原来的大型合并操作拆分为多个较小的合并操作，从而限制了每个合并操作的处理时间以及创建新组件所需的临时磁盘空间。
分区可以通过只合并具有重叠键的 SSTable 来优化顺序创建 key 的工作负载。对于按顺序创建的 key，基本上不执行合并，因为没有具有重叠键的 SSTable。

优化问题

可以看到，LSM-Tree 是一种可调性比较高的结构，但却没有一种合并策略能够同时满足读优化与写优化。上面提到的 leveling 和 tiering，前者牺牲了写换取了读，后者牺牲了读换取了写。实际上，现在所做的很多优化工作，都是在 leveling 和 tiering 中进行变式与结合，也面临着读/写/空间的权衡问题。

综述里一共提到了 7 种优化思路，分别为：

减少写放大
优化合并操作
更大的内存空间
更好的硬件支持
针对特殊的工作负载进行优化
自调和
二级索引

在下一篇博客（学习笔记（二））中，我会按照归类将综述中提到的各种优化办法都整理一遍。

Redis常见问题爱码的嘉 Redis redis 数据库缓存
1、什么是redis？Redis是C语言开发的一个开源的高性能键值对（key-value）的内存数据库，可以用作数据库、缓存、消息中间件等。它是一种NoSQL的数据库。性能优秀，数据在内存中，读写速度非常快，支持并发10WQPS。单进程单线程，是线程安全的，采用IO多路复用机制。丰富的数据类型，支持字符串、散列、列表、集合、有序集合等。支持数据持久化。可以将内存中数据保存在磁盘中，重启时加载。主从
软件测试学习笔记丨数据库基础知识软件测试大空翼学习笔记数据库自动化测试测试开发软件测试
本文转自测试人社区，原文链接：https://ceshiren.com/t/topic/30175数据库数据库基础知识数据库简介数据库(DataBase)就是一个以某种有组织的方式存储的数据集合是存储和管理数据的仓库其本质是一个文件系统数据库管理系统（DBMS）是一款管理软件数据库分类关系型数据库（RDB:RelationshipDataBase）非关系型数据库（NoSQL）使用场景关系型数据库需
深入理解Redis:工程师的使用指南腹有诗书气自华777 redis 数据库缓存
Redis（RemoteDictionaryServer）是一个高性能的键值存储系统，它以内存为主要存储介质，并提供多种数据结构的支持，包括字符串、列表、集合、哈希表等。作为一款开源的、轻量级的NoSQL数据库，Redis在缓存、消息队列、会话存储等场景中得到了广泛应用。本篇博客将以高级工程师的视角，深入介绍Redis的特性、优势以及如何在实际项目中进行使用。什么是Redis？Redis是一个基于
Redis 大key和热key问题及处理 lvyuanj redis java
一、说说什么是Redis、及特点？Redis是一个基于内存存储数据运行并支持持久化、使用key/value形式存储的高性能的nosql数据库，适合用于存储频繁访问，数据量较小的场景下。特点：支持数据持久化：可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。支持多种数据结构：不仅支持简单的key-value类型数据，同时还提供string、list、set、zset、hash等数据结构
MongoDB索引与性能优化禅与计算机程序设计艺术 mongodb 性能优化数据库
1.背景介绍MongoDB是一种高性能、灵活的NoSQL数据库，它支持文档存储和查询。索引是MongoDB中性能优化的关键因素之一，它可以加速数据查询和排序操作。在本文中，我们将深入探讨MongoDB索引的核心概念、算法原理、具体操作步骤和数学模型公式，并通过实例代码来详细解释。1.1MongoDB索引的重要性MongoDB中的数据存储为BSON文档，文档结构灵活，可以存储不同类型的数据。随着数据
MongoDB nosql数据库
MongoDB概念：MongoDB是一个文档型的NoSql数据库，和关系型数据库相比，没有结构化的存储要求，扩展更灵活。存储结构：DataBase:类似于关系数据库中的DataBase。Collection:类似于关系数据库中的表。Document:MongoDB中的最小存储单元，类似于关系数据库中的行。每一个Document都是一个BSON键值对。BSON：是一种网络数据交换格式，是JSON的二
构建生物医学知识图谱from zero to hero （4）：通过Neo4j构建知识图谱 ASKCOS AIDD CADD 化学生物知识图谱 neo4j 人工智能
图数据库是一种专门用于存储图形数据的NoSQL数据库。与传统的关系型数据库和其他NoSQL数据库不同，图数据库利用图形数据模型来存储和管理数据。图形数据模型由节点和边组成，节点代表实体，边代表实体之间的关系。例如，在社交网络中，用户可以表示为节点，朋友关系可以表示为边。图数据库具有以下特点：灵活的数据模型：图数据库采用图形数据模型，可以灵活地存储和表示各种类型的数据，例如社交网络、地图、知识图谱等
Redis第一关之常规用法大&迈 redis 数据库缓存
简介Redis不用多说，已经火了很多年了，也用了很多年了。现在做一些归纳总结。这篇文章主要介绍Redis的常规知识及用法，包括数据结构、使用场景、特性、过期机制、持久化机制。Redis与MysqlMysql是一款基于磁盘的关系型SQL数据库。Redis是一款基于内存的、非关系型、Nosql数据库，Mysql的基本构成结构是二维表，由行和列组成。Redis的数据存储形式是Key-Value结构，由键
Redis-面试题 HBryce24 Redis java redis
一、基础1、什么是RedisC语言编写，基于key-value存储的nosql开源内存数据库内存存储、数据结构优化，高性能一般用于应用和数据库之间的分布式缓存中间件提供主从复制+哨兵、集群的方式实现高可用，在redis集群中通过hash槽的方式实现数据分片，进一步提升性能和可扩展性2、Redis的优缺点优点读写性能优异支持数据持久化RDB、AOF支持事务数据结构丰富支持主从复制，主机自动将数据同步
Redis & RabbitMQ tianshuiyimo 通用理念 redis rabbitmq 数据库
Redis：轻量级，NoSQL数据库redis是一个key-value存储系统。和Memcached类似，它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash（哈希类型）。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作，而且这些操作都是原子性的。在此基础上，r
视野 | OpenSearch，云厂商的新选择？ RadonDB 数据库搜索引擎 elasticsearch
王奇顾问软件工程师目前从事PaaS中间件服务（Redis/MongoDB/ELK等）开发工作，对NoSQL数据库有深入的研究以及丰富的二次开发经验，热衷对NoSQL数据库领域内的最新技术动态的学习，能够把握行业技术发展趋势。|最流行的全文搜索引擎Elasticsearch是一款广泛使用的开源分布式全文搜索引擎，源于ApacheLucene[1]，许可证为Apache2.0。由于出色的搜索引擎、高扩
Redis学习笔记 hhf的博客学习笔记 redis
1基础1.1NoSQL特点：非结构化、无关联、非SQL、没有事务或事务不满足ACID特性、内存存储、支持水平扩展1.2Redis概括redis官网：https://redis.io/一个基于内存的键值型NoSQL数据库key-value型单线程，每个命令具备原子性低延迟，速度快（基于内存、IO多路复用、c语言编写）支持数据持久化支持主从/分片集群支持多语言客户端1.3linux系统安装下载redi
2019-07-15 HUGOPAN
Redis:一、Redis是一个开源的，使用ANSIC编写，高性能的Key-Value的NoSQL数据库。二、特点：（1）基于内存（2）可持久化数据（3）具有丰富的数据结构类型，适应非关系型数据的存储需求（4）支持绝大多数主流开发语言，如C、C++、Java、Python、R、JavaScript等。（5）支持集群模式，高效、稳定。三、数据模型（1）键值对形式。（2）Redis的数据结构类型，指的
为什么要学redis，我来告诉你 ❤️ 卢卢在路上 redis 数据库 memcached 高并发
曾经并肩往前的伙伴，在举杯祝福后都走散！一、引言为啥需要redis?没有reids有啥问题?↓1.1数据库压力过大由于用户量增大，请求数量也随之增大，数据压力过大1.2数据不同步多台服务器之间，数据不同步1.3传统锁失效多台服务器之间的锁，已经不存在互斥性了redis如何解决这些问题?↓二、Redis介绍2.1NoSQL介绍Redis就是一款NoSQL。NoSQL->非关系型数据库->NotOnl
redis(二) NoSql入门和概述(中) 21号新秀_邓肯
2.3V+3高2.1)大数据时代的3V海量Volume多样Variety实时Velocity2.2)互联网需求的3高高并发高可扩高性能3.当下的NoSql经典应用3.1)当下的应用是sql和nosql一起使用3.2)阿里巴巴中文站商品信息如何存放3.2.1看看阿里巴巴中文网站首页以女装/女包包为例3.2.1.1架构发展历程1.演变过程image.png2.第五代image.png3.第五代架构使命
Redis系列学习文章分享---第一篇（Redis快速入门之初始Redis--NoSql+安装redis+客户端+常用命令）码农阿豪 Redis系列 redis nosql 数据库
目录今天开始进入Redis系列学习分享1.初识Redis1.1.认识NoSQL1.1.1.结构化与非结构化1.1.2.关联和非关联1.1.3.查询方式1.1.4.事务1.1.5.总结1.2.认识Redis1.3.安装Redis1.3.1.依赖库1.3.2.上传安装包并解压1.3.3.启动1.3.4.默认启动1.3.5.指定配置启动1.3.6.开机自启1.4.Redis桌面客户端1.4.1.Redi
NoSQL 数据库有哪些类型？ .L.JIN.Jie NoSQL 数据库 nosql
NoSQL数据库主要可以分为下面四种类型：键值：键值数据库是一种较简单的数据库，其中每个项目都包含键和值。这是极为灵活的NoSQL数据库类型，因为应用可以完全控制value字段中存储的内容，没有任何限制。Redis和DynanoDB是两款非常流行的键值数据库。文档：文档数据库中的数据被存储在类似于JSON（JavaScript对象表示法）对象的文档中，非常清晰直观。每个文档包含成对的字段和值。这些
【Java面试】MongoDB 网络冒险家面试 java 面试 mongodb
目录1、mongodb是什么？2、mongodb特点什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？NoSQL数据库有哪些类型?启用备份故障恢复需要多久什么是master或primary什么是secondary或slave系列文章版本记录1、mongodb是什么？MongoDB是由C++语言编写的，是一个基于分布式文件存储的开源数据库系统。再高负
【9】知识存储铁盒薄荷糖知识图谱实战6+3天知识图谱
一、图数据库neo4jNeo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。单节点的服务器可承载上亿级的节点和关系，单节点性能不够时也可进行分布式集群部署。Neo4j有自己的后端存储，不必如同JanusGraph等一样还要依赖另外的数据库存储。Neo4j在每个节点中存储了每个边的指针，因而遍历时效
redis 现实里的童话xklss
redisNoSQL：一类新出现的数据库(notonlysql)，它的特点：不支持SQL语法存储的数据都是KV形式每种nosql数据库都有自己的api和语法Redis简介Redis是一个开源的使用ANSIC语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库缓存、队列Redis特性Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。Re
redis为什么使用跳跃表而不是树单边李001 redis 数据库缓存
Redis中支持五种数据类型中有序集合SortedSet的底层数据结构使用的跳跃表，为何不使用其他的如平衡二叉树、b+树等数据结构呢？1，redis的设计目标、性能需求：redis是高性能的非关系型（NoSQL）内存键值数据库，它以其快速的操作速度而闻名。读取速度：Redis能实现极高的读取速度，据官方测试报告，可以达到每秒约110,000次读取操作。写入速度：与读取相比，写入速度略低，但仍然相当
Redis 传奇丶少年 Redis redis
Redis1.Redis简介介绍：redis是一个开源的使用ANSIC语言编写，遵循BSD协议、支持网络，可基于内存亦可持久化的日志型，Key-Value数据库，redis是一个非关系型数据库（Nosql数据库）。2.Redis支持的数据类型1.String字符串类型最基本的数据类型作用：做一个复杂的计数功能的缓存2.Hash（哈希类型）value存放结构化对象作用：单点登陆，存储用户信息，设置缓
neo4j下载安装最新教程 2024.02 Cachel wood 软件安装教程 neo4j
文章目录neo4j简介neo4j与jdk版本对应neo4j历史版本下载地址配置环境变量命令行启动验证安装结果neo4j简介Neo4j是一个高性能的NoSQL图形数据库，它将结构化数据存储在网络（从数学角度叫做图）上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。neo4j与jdk版本对应neo4j的版本需要与jdk版本相适配，否则容易出现安装失败。最新的ne
redis学习笔记果然君 redis 学习数据库 nosql java
Redis学习笔记文章目录Redis学习笔记一、NoSQL数据库简介1、解决问题2、NoSQL数据库二、Redis6概述和安装1、安装2、注意事项3、Redis使用4、其他介绍三、常用五大数据类型1、Redis的key操作2、Redis字符串String3、Redis列表List4、Redis集合Set5、Redis哈希Hash6、Redis有序集合Zset四、Redis6配置文件详解1、bind
在python中JSON数据格式的使用码银前端 linux 运维
什么是JSON？JSON是一种数据格式，由美国程序设计师DouglasCrockford创建的，JSON全名是JavaScriptObjectNotation,由JSON英文全文字义我们可以推敲JSON的缘由，最初是为JavaScript开发的。这种数据格式由于简单好用被大量应用在Web开发与大数据数据库(NoSQL)，现在已成为一种著名数据格式，Python与许多程序语言同时采用与支持。也由此在
Redis由浅到深层次讲解和springboot实战（服务器层面的搭建部署）三横同学服务器 redis redis spring boot 服务器
Redis由深层次讲解到springboot实战一、Nosql概述为什么使用Nosql1、单机Mysql时代90年代,一个网站的访问量一般不会太大，单个数据库完全够用。随着用户增多，网站出现以下问题数据量增加到一定程度，单机数据库就放不下了数据的索引（B+Tree）,一个机器内存也存放不下访问量变大后（读写混合），一台服务器承受不住。2、Memcached(缓存)+Mysql+垂直拆分（读写分离）
了解什么是文档型数据库？ DocDB小仙女数据库 nosql mongodb database
在当前的数据管理生态中，非关系型数据库（NoSQL）逐渐成为未来数据管理的重要一环，其中，文档型数据库尤为突出，一方面，其无模式的特点能够适应各种数据变化，满足数据环境复杂化的趋势；另一方面，其高度的扩展性满足了日益增长的数据量管理需求。再加上其数据模型的灵活性，文档型数据库为许了解什么是文档型数据库？多现代应用提供了高效和可靠的数据解决方案。今天，本文将通过国内外文档型数据库的典型代表Mongo
互联网架构模板：“存储层”技术 woshishui1243
——————————————————摘抄自《极客时间李运华从0开始学架构》SQL单表、单库——>数据库拆分——>数据库中间件（将分库分表做到自动化和平台化）——>存储平台(以对业务透明的形式提供资源分配、数据备份、迁移、容灾、读写分离、分库分表等一系列服务)NoSQL小文件存储大文件存储
NoSQL-lesson13-Redis缓存技术-运维篇学无止境_9b65
NoSQL-lesson13-Redis缓存技术-运维篇0.NoSQL产品(key-value)RDBMS：MySQL，Oracle，MSSQL，PGNoSQL:Redis,MongoDB，列存储存储相关NewSQL----->分布式数据库架构（学习了MongoDB）缓存产品介绍：memcached（大公司会做二次开发）redisTair1.Redis功能介绍数据类型丰富（笔试、面试）*****支
站内消息设计与实现 jljf_hh
0x01.About最近在处理系统消息模块，查阅了很多实践案例，各有针对性。首先站内消息主要包括：个人消息（评论，点赞），系统消息，订阅消息，私信。其中，订阅区分用户群，即系统消息是一个特殊的所有人订阅的订阅消息，特点是一对多。前三个实时性比较低，最后一个实时性高，离线状态下是私信，如果双方在线要转为聊天室，特点是一对一。那么，接下来，该选个方案了，SQLorNoSQL?0x02.Mysql实现首
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

LSM-Tree(一)：初识

文章目录

LSM-Tree 诞生之前

早期 LSM-Tree

LSM-Tree 基本结构

leveling & tiering

partition

partitioned leveling

partitioned tiering

vertical grouping

horizontal grouping

为什么要分区

优化问题

你可能感兴趣的:(nosql)