全世界最快的内存数据库Dragonfly

全世界最快的内存数据库Dragonfly_第1张图片

一、全世界最快的内存数据库

Dragonfly是一种针对现代应用程序负荷需求而构建的内存数据库,完全兼容Redis和Memcached的 API,迁移时无需修改任何代码。相比于这些传统的内存数据库,Dragonfly提供了其25倍的吞吐量,高缓存命中率和低尾延迟,同时Dragonfly还能轻松进行垂直扩展。

二、基准测试

全世界最快的内存数据库Dragonfly_第2张图片

Dragonfly在c6gn.16xlarge上达到了每秒380万个查询(QPS),相比于Redis,吞吐量提高了25倍。

在Dragonfly的峰值吞吐量下,P99延迟如下:

全世界最快的内存数据库Dragonfly_第3张图片

所有基准测试均使用memtier_benchmark(见下文),根据服务器类型和实例类型调整线程数。memtier运行在独立的c6gn.16xlarge机器上。对于setex基准测试,我们使用了500的到期范围,以便其能够存活直到测试结束。

memtier_benchmark --ratio ... -t  -c 30 -n 200000 --distinct-client-seed -d 256 \     --expiry-range=...

当以管道模式运行,并设置参数--pipeline=30时,Dragonfly可以实现10M qps的SET操作和 15M qps的GET操作。

Memcached / Dragonfly

在 AWS 的 c6gn.16xlarge 实例上比较了 memcached 和 Dragonfly。如下图所示,与 memcached 相比,Dragonfly 的吞吐量在读写两方面上都占据了优势,并且在延迟方面也还不错。对于写入工作,Dragonfly 的延迟更低,这是由于在 memcached 的写入路径上存在竞争(请参见此处)。

设定基准

全世界最快的内存数据库Dragonfly_第4张图片

获取基准测试

全世界最快的内存数据库Dragonfly_第5张图片

对于读取基准测试,Memcached 表现出了更低的延迟,但在吞吐量方面比不上Dragonfly。

内存效率

在接下来的测试中,我们使用 debug populate 5000000 key 1024 命令向 Dragonfly 和 Redis 分别写入了约 5GB 的数据。然后使用 memtier 发送更新流量并使用 "bgsave" 命令启动快照。下图清楚地展示了这两个服务器在内存效率方面的表现。

全世界最快的内存数据库Dragonfly_第6张图片

在空闲状态下,Dragonfly 比 Redis 节省约 30% 的内存。在快照阶段,Dragonfly 也没有显示出任何明显的内存增加。但同时,Redis 在峰值时的内存几乎达到了 Dragonfly 的 3 倍。Dragonfly 完成快照也很快,仅在启动后几秒钟内就完成了。

三、配置方法

Dragonfly 支持 Redis 的常见参数。例如,可以运行:dragonfly --requirepass=foo --bind localhost。

目前,Dragonfly 支持以下 Redis 特定参数:

  • port:Redis 连接端口,默认为 6379。

  • bind:使用本地主机名仅允许本地连接,使用公共 IP 地址允许外部连接到该 IP 地址。

  • requirepass:AUTH 认证密码,默认为空""。

  • maxmemory:限制数据库使用的最大内存(以字节为单位)。0 表示程序将自动确定其最大内存使用量。默认为 0。

  • dir:默认情况下,dragonfly docker 使用 /data 文件夹进行快照。CLI 使用的是 ""。可以使用 -v docker 选项将其映射到主机文件夹。

  • dbfilename:保存/加载数据库的文件名。默认为 "dump";

此外,还有 Dragonfly 特定的参数选项:

  • memcached_port:在此端口上启用 memcached 兼容的 API。默认禁用。

  • keys_output_limit:在keys 命令中返回的最大键数。默认为 8192。

  • keys 命令是危险命令。会截断结果以避免在获取太多key时内存溢出。

  • dbnum:select 支持的最大数据库数。

  • cache_mode:请参见下面的 缓存 部分。

  • hz:键到期评估频率。默认为 100。空闲时,使用较低的频率可以占用较少的 CPU资源,但这会导致清理过期键的速度下降。

  • save_schedule:以UTC 时间规范保存快照,格式:HH:MM(24 小时制时间)。默认为空""。

  • primary_port_http_enabled:如果为 true,则允许在主 TCP 端口上访问 http 控制台。默认为 true。

  • admin_port:如果设置,将在指定的端口上启用对控制台的管理访问。支持 HTTP 和 RESP 协议。默认禁用。

  • admin_bind:如果设置,将管理控制台 TCP 连接绑定到给定地址。支持 HTTP 和 RESP 协议。默认为any。

  • admin_nopass: 将管理控制台 TCP 连接绑定到给定地址。同时支持 HTTP 和 RESP 协议。

  • cluster_mode:支持集群模式。目前仅支持 emulated。默认为空""。

  • cluster_announce_ip:集群模式下向客户端公开的 IP。

启动脚本示例,包含常用选项:

./dragonfly-x86_64 --logtostderr --requirepass=youshallnotpass --cache_mode=true -dbnum 1 --bind localhost --port 6379  --save_schedule "*:30" --maxmemory=12gb --keys_output_limit=12288 --dbfilename dump.rdb要获取更多选项,如日志管理或TLS支持,请运行dragonfly --help。

要获取更多选项,如日志管理或TLS支持,请运行dragonfly --help。

四、开发路线和开发现状

目前,Dragonfly支持约185个Redis命令以及除cas之外的所有memcache命令。几乎达到了Redis 5 API的水平。下一个里程碑更新将会稳定基本功能并实现复刻API。如果发现需要的命令尚未实现,请提出一个Issue。

对于dragonfly-native复制技术,正在设计一种分布式日志格式,该格式将支持更高的速度。

在实现复制功能之后,将继续实现API 3-6中其他缺失的Redis命令。

五、设计决策

全新的缓存设计

Dragonfly采用单一的自适应缓存算法,该算法非常简单且具备高内存效率。可以通过使用--cache_mode=true参数来启用缓存模式。一旦启用了此模式,Dragonfly将会删除最低概率可能被使用的内容,但这只会在接近最大内存限制时发生。

相对准确的过期期限

过期范围限制最高为约4年。此外,对于大于134217727ms(大约37小时)的到期期限,毫秒精度级别(PEXPIRE/PSETEX等)会被简化到秒级。这种舍入的误差小于0.001%,希望这在长时间范围情况下是可以接受的。

原生HTTP控制台和兼容Prometheus的标准

默认情况下,Dragonfly允许通过其主TCP端口(6379)进行HTTP访问。没错,可以通过Redis协议或HTTP协议连接到Dragonfly - 服务器会在连接初始化期间自动识别协议。不妨在自己的浏览器中尝试一下。现在HTTP访问没有太多信息可供参考,但在将来,计划添加有用的调试和管理信息。

重要!HTTP控制台仅应在安全网络内访问。如果将Dragonfly的TCP端口暴露在外部,则建议使用--http_admin_console=false或--nohttp_admin_console禁用控制台。

全世界最快的内存数据库Dragonfly_第7张图片

你可能感兴趣的:(数据库,数据库)