sharding-jbdc入门

1.简介

1.1 分库分表是什么

电商平台，在开发中涉及店铺、商品的相关业务，设计如下数据库

通过以下SQL能够获取到商品相关的店铺信息、地理区域信息：

SELECT p.*,r.[地理区域名称],s.[店铺名称],s.[信誉]
FROM [商品信息] p
LEFT JOIN [店铺信息] r ON p.[产地] = r.[地理区域编码]
LEFT JOIN [店铺信息] s ON p.id  = s.[所属店铺]
WHERE p.id = ?

形成类似一下展示：

随着系统商品的发展，数据库中的数据量猛增，访问性能也变慢了，优化迫在眉睫。分析一下问题出现在哪？关系型数据库本身就比较容易成为系统瓶颈，单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后，由于查询维度较多，即使添加从库、优化索引、做很多操作时性能仍然下降严重。

方案1：

通过提升服务器硬件能力来体高处理能力，比增加存储容量、CPU等，这种方案成本很高，并且如果瓶颈在mysql本身那么提高硬件也是有限的。

方案2：

把数据分散到不同的数据库中，使得单一数据库的数据量变小来缓解数据库的性能问题，从而达到提升数据库性能的目的。如下图:将电商数据库拆分为若干独立的数据库，并且对于大表也拆分为若干小表，通过这种数据库拆分的方法来解决数据库的性能问题。

分库分表就是为了解决由于数据量过大而导致数据库性能降低的问题，将原来独立的数据库拆分成若干数据库组成，将数据大表拆分成若干数据组成，使得单一数据库、单一数据表的数据量变小，从而达到提升数据库性能的目的。

1.2 分库分表的方式

分库分表包括分库和分表两种，在生产中通常包括：垂直分库、水平分库、垂直分表、水平分表四种方式。

1.2.1.垂直分表

下边通过一个商品查询案例讲解垂直分表：

通常在商品列表中是不显示山商品详情信息的，如下图：

用户在浏览器列表时，只有对某商品感兴趣时才会查看该商品的详细描述。因此，商品信息中的商品名称、商品图片、商品价格等其他字段数据访问频次较高。

由于这两种数据的特性不一样，因此他考虑将商品信息拆分如下：

将访问频次低的商品描述信息单独存放在一张表中，访问频次较高的商品基本信息单独放在一张表中。

商品列表可采用以下sql:

SELECT P.*,r.[地理区域名称],s.[店铺名称],s.[信誉]
FROM [商品信息] p
LEFT JOIN [地理区域] ON p.[产地] = r.[地理区域编码]
LEFT JOIN [店铺信息] ON p.id = s.[所属店铺]
WHERE ... ORDER BY ... LIMIT

需要获取商品描述时，再通过以下sql获取：

SELECT *
FROM [商品描述]
WHERE [商品ID] = ?

这就叫做垂直分表

垂直分表定义：将一个表按照字段分成多表，每个表存储其中一部分字段。

它带来的提升是：

1.为了避免IO争抢并减少锁表的几率，查看详情的用户与商品信息浏览互不影响

2.充分发挥热门数据的操作效率，商品信息的操作的高效率不会被商品描述的低效率所拖累。

一般来说，某业务实体中的各个数据项的访问频次是不一样的，部分数据项可能占用存储空间比较大的BLOB或是TEXT。例如上列中的商品描述。所以，当表数据量很大时，可以将表按字段切开，将热门字段，冷门字段分开放置再不同库中，这些库可以放在不同的存储设备上，避免IO争抢。垂直切分带来的性能提升主要集中在热门数据的操作效率上，而磁盘争用情况减少。

通常我们按照以下原则进行垂直拆分：

1.把不常用的字段单独放入一张表；

2.把text,blog等大字段拆分出来放在附表中；

1.2.2.垂直分库

通过垂直分表性能得到了一定程度的提升，但是还没有达到要求，并且磁盘空间也快不够了，因为数据还是始终限制在一台服务器，库内垂直分表只解决了单一表数据量过大的问题，但没有将表分布到不同的服务器上，因此每个表还是竞争同一个物理机的CPU,内存、网络IO、磁盘。

经过思考，他把原有SELLER_DB(卖家库)，分为了PRODUCT_DB(商品库)和STORE_DB(店铺库)，并把这两个库分散到不同的服务器，如下图:

由于商品信息与商品描述业务耦合度较高，因此一起被存放在PRODUCT_DB(商品库);而店铺信息相对独立，因此单独被存放在STORE_DB(店铺库)。

这一步优化就叫做垂直分库。

垂直分库是指按照业务将表进行分类，分布到不同的数据库上面，每个库可以放在不同的服务器上，它的核心理念是专库专用。

它带来的提升是：

解决业务层面的耦合，业务清晰
能对不同业务的数据进行分级管理、维护、监控、拓展等
高并发场景下，垂直分库一定程度的提升IO、数据库连接数、降低单机硬件资源的瓶颈
垂直分库通过将表按业务分类，但是依然没有解决单数据量过大的问题。

1.2.3.水平分库

经过垂直分库后，数据库性能问题得到了一定层度的解决，但是随着业务量的增长，PRODUCT_DB(商品库)单库存储已经超出预估。粗略估计，目前有假设有8w店铺，每个店铺平均150个不同规格的商品，在算上增长，那商品数量的往1500w+上预估，并且PRODUCT_DB(商品库)属于访问非常频繁的资源，单台服务器已经无法支撑。此时此刻如何优化？

再次分库？但是从业务角度分析，目前情况已经无法再次垂直分库。

尝试水平分库，将店铺ID单数的和店铺ID为双数的商品信息分别在放在两个库中。

也就是说，要操作某条数据，先分析这条数据所属的店铺ID。如果店铺ID为双数，将此操作映射到PRODUCT_DB1(商品库1)；如果店铺ID为单数，将操作映射到PRODUCT_DB2(商品库2)。此操作要访问数据库名称的表达式PRODUCT_DB[商品库ID%2 +1]。

这进一步优化叫做水平分库。

水平分库是把同一个表是数据按一定规则拆到不同的数据库中，每个库可以放在不同的服务器上。

它带来的提升是：

解决了单库大数据，高并发的性能的瓶颈
提高了系统的稳定性及可用性。

1.2.4.水平分表

按照水平分表的思路对他把PRODUCT_DB_X(商品库)内的表也可以进行水平拆分，其目的也是为解决单表数据量大的问题，如下图:

与水平分库的思路类似，不过这次操作的目标是表，商品信息及商品描述被拆分了两层。如果商品ID为双数，将此操作映射至商品信息1表；如果商品ID为单数，将此操作映射至商品信息2表。此操作要访问名称的表达式为商品信息[商品ID%2+1]。

这进一步优化叫做水平分表。

水平分表是在同一个数据库内，把同一个表的数据按一定规则拆到多个表中。

它带来的提升是：

优化单一表数据量过大而产生的性能问题
避免IO争抢并减少锁表的几率

库内的水平分表，解决了单一表数据量过大的问题，分出来的小表中只包含一部分数据，从而进行使得单个表的数据量变小，提高检索性能。

1.2.5.小结

本章介绍了分库分表的各种方式，他们分别是垂直分表、垂直分库、水平分库和水平分表：

垂直分表：可以把一个宽表的字段访问频次、是否是大字段的原则拆分为多个表，这样既能使业务清晰，还能提升部分性能。拆分后，尽量从业务角度避免联查，否则性能方面将的得不偿失。

垂直分库：可以把多个表按业务耦合松紧归类，分别存放在不同的库，这些库可以分布在不同服务器，从而是访问压力被多服务器负载，大大提升性能，同时能提高整体叫否的业务清晰度，不同的业务库可根据自身情况定制优化方案。但是它需要解决跨库带来的所有复杂问题。

水平分库：可以把一个表的数据(按数据行)分到多个不同的库，每个库只有这个表的部分数据，这些库可以分布在不同服务器，从而使访问压力被多服务器负载，大大提升性能。它不仅需要解决跨库带来的所有复杂问题，还要解决数据路由的问题。

水平分表：可以把一个表的数据(按数据行)分到多个同一个数据库中的多个表中，每个表只有这个表的部分数据，这样做能小幅度提升性能，它仅仅作为水平库的一个补充优化。

一般来说，在系统设计阶段就应该根据业务耦合松紧原确定垂直分库，垂直分表，方案，在数据量及访问压力不是特别大的情况，首先考虑缓存，读写分离、索引技术等方案，若数据量极大，且持续增长，在考虑水平分库，水平分表。

1.3 分库分表带来的问题

分库分表能有效的缓解了单机和单库带来的性能瓶颈和压力，突破网络IO、硬件资源、连接数的瓶颈，同时也带来了一些问题。

1.3.1.事务一致性问题

由于分库分表把数据分布在不同库甚至不同服务器，不可避免带来分布式事务问题。

1.3.2.跨节点关联查询

在没有分库前，我们索引商品时可以通过以下SQL对比店铺信息进行关联查询；

SELECT p.*,r.[地理区域名称],s.[店铺名称],s.[信誉]
FROM [商品信息] p
LEFT JOIN [地理区域] r ON p.[产地] = r.[地理区域编码]
LEFT JOIN [店铺信息] s ON p.id = s.[所属店铺]
WHERE ... ORDER BY ... LIMIT ...

但垂直分库后**[商品信息]和[店铺信息]**不在一个数据库中，甚至不在一台服务器，无法进行关联查询。可将原关联查询分为两次查询，第一次查询的结果集中找出关联数据id,然后根据id发起第二次请求得到关联数据，最后将获得到的数据进行拼接。

1.3.3.跨节点分页、排序函数

跨节点多库进行查询时，limit分页、order by 排序等问题，就变得比较复杂了。需要现在不同的分片节点中将数据进行排序并返回，然后将返回的结果集进行汇总和再次排序。

如，进行水平分库后的商品库，按ID倒序排序分页，取第一页：

以上流程是取第一页的数据，性能影响不大，但是由于商品信息的分布在各数据库的数据可能是随机的，如果是取第N页数据都取出来合并，再进行整体的排序，操作效率可想而知。所以请求页数越大，系统的性能也会越差。

在使用Max、Min、Sum、Count之类的函数进行计算的时候，与排序分页同理，也需要先在每个分片上执行相应的函数，然后将各个分片的结果集进行汇总和再次计算，最终将结果返回。

1.3.4.主键避重

在分库分表环境中，由于表中数据同时存在不同的数据库中，主键值平时使用的自增长将无用武之地，某个分区数据库生成的ID无法保证全局唯一。因此需要单独设计全局主键，以避免跨库主键重复问题。

1.3.5.公共表

实际的应用场景中，参数表，数据字典等都是数据量较小，变动少，而且属于高频联合查询的依赖表。列子中地理区域表也属于此类型。

可以将分库分表后之后，数据被分散在不同的数据库，服务器。因此，对数据的操作也就无法通过常规方式完成，并且它还带来了一系列问题。好在，这些问题不是所有都需要我们在应用层面上解决，市面上有很多中间件可供我们选择，其中Sharding-JDBC使用流行度较高，我们来了解一下它。

1.4 Sharding-JDBC介绍

1.4.1.Sharding-JDBC介绍

Sharding-JDBC是当当网研发的开源分布式数据库中间件，从3.0开始Sharding-JDBC被包含Sharding-Sphere中，之后该项目进入了Apache孵化器，4.0版本之后的版本为Apache版本。

ShardingSphere是一套开源的分布式数据库中间件解决方案组成的生态圈，它由Sharding-JDBC、Sharding-Proxy、Sharding-Sidecar这三款相互独立的产品组成。他们均提供标准化的数据分片、分布式事务和数据库治理功能，可适用于如java同构、异构言语、容器、云原生等各种多样化的应用场景。

官方地址：https://shardingsphere.apache.org

Sharding-JDBC，它定位轻量级Java框架，在Java的JDBC层提供额外服务。它使用客户端直接连接数据库，以jar包形式提供服务，无需额外部署和依赖，可理解为增强版的JDBC驱动，完全兼容JDBC和各种ORM框架。

Sharding-JDBC的核心功能数据分片和读写分离，通过Sharding-JDBC，应用可以透明的使用jdbc访问已经分库分表、读写分离的多个数据源，而不用关心数据源的数量以及数据如何分布。

适用于任何基于java的ORM框架，如：Hibernate，Mybatis,SpringJDBC Template或者直接使用JDBC。

基于任何第三方的数据库连接池，如：DBCP，C3P0,BoneCP,Druid,HikariCP等。

支持任意实现JDBC规范的数据库。目前支持MYSQL，Oracle，SQLServer和PostgreSQL。

上图展示了Sharding-jdbc的工作方式，使用Sharding-jdbc前需要人工对数据库进行分库分表，在应用程序中加入Sharding-jdbc的jar包，应用程序通过Sharding-jdbc操作分库分表后的数据库和数据表，由于Sharding-jdbc是对jdbc驱动的增强，使用Sharding-jdbc就像使用jdbc驱动一样，在应用程序中事无需指定具体要操作的分库和分表的。

1.4.2.与jdbc性能对比

1.性能损耗测试：服务器资源充足、并发数相同，比较JDBC和Sharding-jdbc性能损耗，Sharding-jdbc相对JDBC损耗不超过7%。

基准测试性能比

业务场景	JDBC	Sharding-JDBC1.5.2	Sharding-JDBC1.5.2/JDBC损耗
单库单表查询	493	470	4.7%
单库单表更新	6682	6303	5.7%
单库单表插入	6855	6375	7%

业务场景	业务平响应时间(ms)	业务TPS
JDBC单库单表查询	7	493
Sharding-JDBC单库单表查询	8	470

2.性能对比测试:服务器资源使用到极限，相同的场景JDBC与Sharding-JDBC的吞吐量相当。

3.性能测对比:服务器资源使用到极限，Sharding-JDBC采用分库分表后，Sharding-JDBC吞吐量较JDBC不分库分表有接近2倍的提升。

JDBC单库两库表与Sharding-JDBC两库各两表对比

业务场景	JDBC单库两表	Sharding-JDBC两库各两表	性能提升至
查询	1736	3331	192%
更新	9170	17997	196%
插入	11574	23043	199%

JDBC单库单表与Sharding-JDBC两库各一表对比

业务场景	JDBC单库单表	Sharding-JDBC两库各一表	性能提升至
查询	1586	2944	185%
更新	9548	18561	194%
插入	11182	21414	192%

2.Sharding-JDBC快速入门

2.1 需求说明

本章节使用Sharding-JDBC完成对订单表的水平分表，通过快速入门程序开发，快速体验Sharding-JDBC的使用方法。

人工创建两张表，t_order_1和t_order_2，这两张表事订单表拆分后的表，通过Sharding-JDBC向订单表插入数据，按照一定的分片规则，主键为偶数的进入t_order_1，另一部分数据进入t_order_2，通过Sharding-JDBC查询数据，根据SQL语句的内容从t_order_1或t_order_2查询数据。

2.2 环境配置

2.2.1.环境说明

操作系统: win10
数据库：MySQL-8.0.27
JDK：64位 jdk1.8
应用框架：spring-boot-2.3.5.RELEASE mybatis-plus-3.5.1
Sharding-JDBC: Sharding-jdbc-spring-boot-start-4.1.1

2.2.2.创建数库

创建订单order_db

CREATE DATABASE order_db CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci

在order_db中创建t_order_1和t_order_2表

DROP TABLE IF EXISTS 't_order_1'
CREATE TABLE `t_order_1` (
  `order_id` bigint NOT NULL COMMENT '订单id',
  `price` decimal(10,2) NOT NULL COMMENT '订单价格',
  `user_id` bigint NOT NULL COMMENT '下单用用户id',
  `status` varchar(50) COLLATE utf8mb4_general_ci NOT NULL COMMENT '订单状态',
  PRIMARY KEY (`order_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

DROP TABLE IF EXISTS 't_order_2'
CREATE TABLE `t_order_2` (
  `order_id` bigint NOT NULL COMMENT '订单id',
  `price` decimal(10,2) NOT NULL COMMENT '订单价格',
  `user_id` bigint NOT NULL COMMENT '下单用用户id',
  `status` varchar(50) COLLATE utf8mb4_general_ci NOT NULL COMMENT '订单状态',
  PRIMARY KEY (`order_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

2.2.3.引入依赖

引入Sharding-jdbc和SpringBoot整合的jar包：

<dependency>
    <groupId>org.apache.shardingspheregroupId>
    <artifactId>sharding-jdbc-spring-boot-starterartifactId>
    <version>4.1.1version>
dependency>

2.3 编写程序

2.3.1.分片规则配置

具体springboot相关依赖及配置参考资料中dbsharding/sharding-jdbc-simple工程，本指引只说明与sharding-jdbc相关的内容。

#配置数据源
spring:
 shardingsphere:
   datasource:
     names: m1  #数据库
     m1:  
       type: com.alibaba.druid.pool.DruidDataSource
       driver-class-name: com.mysql.cj.jdbc.Driver
       username: root
       data-password: 123456
       url: jdbc:mysql://127.0.0.1:3306/order_db?useUnicode=true&characterEncoding=utf-8&useSSL=false&allowPublicKeyRetrieval=true
       
#指定t_order表的数据分布情况，配置数据节点
sharding:
     tables:
       t.order:   #逻辑表名
         key-generator:
           column: order_id  #主键
           type: SNOWFLAKE  #主键策略 雪花算法
         actual-data-nodes: m1.t_order_$->(1..2)  #表分布情况
         table-strategy: # 分表策略
           inline:
             sharding-column: order_id   # 分片路由标准
             algorithm-expression: t_order_$->{order_id % 2 +1} # 分片算法表达式



props:
     sql:
       show: true  #打印sql

首先定义数据源m1，并对m1进行实际的参数配置。
指定t_order表的数据分布情况，他分布在m1.t_order_1和m1.t_order_2
指定指定t_order表的主键生成策略为SNOWFLAKE，SNOWFLAKE是一种分布式自增算法，保证id全局唯一。
定义t_order分表策略，order_id为偶数的数据落在t_order_1,为基数落在t_order_2,分表策略的表达式为t_order_$->{order_id % 2 +1}

2.3.2.数据操作

    @Resource
    private IOrderMapper orderMapper;
    @Override
    public int addOrder(Order order) {
       return orderMapper.insert(order);
    }

2.4 流程分析

通过日志分析，Sharding-JDBC在拿到用户要执行的sql之后干了哪些事儿;

(1)解析sql，获取片键值，在本例中是order_id

(2)Sharding-JDBC通过规则配置t_order_$->{order_id % 2 +1} ，知道了当order_id为偶数时，应该往t_order_1插入数据，为奇数时，往t_order_2插入数据。

(3)于是Sharding-JDBC根据order_id的值改写成sql语句，改写后的sql语句是真实所要执行的sql语句。

(4)执行改写后的真实sql语句

(5)将所有真正执行sql的结果进行汇总并返回。

3.Sharding-JDBC执行原理

3.1 基本概念

在了解Sharding-JDBC的执行原理前，需要了解以下概念:

逻辑表

水平拆分的数据表的总数。例:订单数据表主键尾数拆分为10张表，分别是t_order_0、t_order_1到t_order_9，他们的逻辑表名为t_order。

真实表

在分片的数据表中真实存在的物理表。即上个实例中的t_order_0到t_order_9。

数据节点

数据分片的最小物理单元。由数据源名称和数据表组成，例:ds_0_order_0。

绑定表

指分片规则一致的主表和子表。例:t_order表和t_order_item表,均按照order_id分片，绑定表之间的分区键完全相同，则此两张表互为绑定关系。绑定表之间的多表关联查询不会出现笛卡尔积关联，关联表效率将大大提升。举例说明，如果SQL为：

SELECT i.* FROM t_order o JOIN t_order_item i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11);

在不配置绑定表关系时，假设分片键order_id将数值10路由至第0片，将数值11路由值第1片，那么路由后的SQL应该为4条，他们呈现为笛卡尔积:

SELECT i.* FROM t_order_0 o JOIN t_order_item_0 i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11);

SELECT i.* FROM t_order_0 o JOIN t_order_item_1 i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11);

SELECT i.* FROM t_order_1 o JOIN t_order_item_0 i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11); 

SELECT i.* FROM t_order_1 o JOIN t_order_item_1 i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11);

在配置绑定表关系后，路由的SQL应该为2条

SELECT i.* FROM t_order_0 o JOIN t_order_item_0 i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11);

SELECT i.* FROM t_order_1 o JOIN t_order_item_1 i  ON o.order_id = i.order_id  WHERE o.order_id IN(10,11);

广播表

指所有的分片数据源中都存在的表，表结构和表中的数据在每个数据库中均完全一致。适用于数据量不大且需要与海量数据的表进行关联查询的场景，例如:字典表。

分片键

用于分片的数据库字段，是将数据库(表)水平拆分的关键字段。例:将订单表中的订单主键的尾数取模分片，则订单主键为分片字段。SQL如果无分片字段，将执行全路由，性能较差。除了对订单分片字段的支持，Sharding-JDBC也支持根据多个字段进行分片。

分片算法

通过分片算法数据分片，支持通过=、BETEEN和IN分片。分片算法需要应用方开发者自行实现，可实现的灵活度非常高。包括精确分片算法、范围分片算法、复合分片算法，例如:where order_id =?将采用精确分片算法，where order_id in(?,?,?)将采用精确分片算法，where order_id BETEEN ? and ? 将采用范围分片算法，复合算法用于分片键多复杂情况。

分片策略

包含分片键和分片算法，由于分片算法的独立性，将其独立抽离。真正可用于分片操作的是分键+分片算法，也就是分片策略。内置的分片策略大致可分为尾数取模。哈希、范围、标签、时间等。由用户方配置的分片策略规则更加灵活，常用的使用行表达式配置分片策略，它采用Groovy表达式表示，如: t_user_$->(u-id % 8)表示 t_user表根据u_id模8，而分成8张表，表名称为t_user_0到t_user_7.

自增主键生成策略

通过在客户端生成自增主键替换以数据库原生自增主键的方式，做到分布式主键无重复。

3.2 SQL解析

当Sharing-JDBC接受到一条SQL语句时，会陆续执行SQL解析=>查询优化=>SQL路由=>SQL改写=>SQL执行=>结果归并，最终返回执行结果。

SQL解析过程分为语法解析和语法分析。词法解析器用于将SQL拆解为不可再分的原子符号，称为Token。并根据不同数据库方言所提供数据字典，将其归类为关键字，表达式，字面量和操作符。再使用语法解析器将SQL转为抽象语法树。

例如,以下SQL:

SELECT id,name FROM t_user WHERE status = 'ACTIVE' AND age > 18

解析之后的为抽象语法树见下图:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-p0KtlhMA-1655709179926)(https://i0.hdslb.com/bfs/album/d362c6abd6de4c548f46709d2756fdc1956b7092.png)]

3.3 SQL路由

SQL路由就是针对逻辑表的数据操作到对数据节点操作的过程。

根据解析上下文匹配数据库和表的分片策略，并生成路由路径。对于携带分片键的SQL，根据分片键操作符不同可以划分为单片路由(分片键的操作符是等号)、多片路由(分片的操作符是IN)和范围路由(分片键的操作符是BETWEEN)，不携带分片键的SQL则采用广播路由。根据分片键进行路由场景可分为直接路由、标准路由、笛卡尔路由等。

标准路由

标准路由是Sharding-JDBC最为推荐使用的分片方式，它的适用范围是不包含关联查询或仅

当分片运算符是等于号时，路由结果将落入单库(表)，当分片运算符是BETWEEN或IN时，则路由结果不一定落在唯一的库(表)，因此一条逻辑SQL最终可能拆分为多条用于执行的真实SQL。举例说明，如果按照order_id的奇数和偶数进行数据分片，一个单表查询的SQL如下:

SELECT * FROM t_order WHERE order_id IN(1,2);

那么路由的结果为:

SELECT * FROM t_order_0 WHERE order_id IN(1,2);
SELECT * FROM t_order_1 WHERE order_id IN(1,2);

绑定表的关联查询与单表查询复杂度和性能相当。举例说明，如果一个包含绑定表的关联查询的SQL如下:

SELECT * FROM t_order o JOIN t_order_item i  ON o.order_id = i.order_id  WHERE order_id IN(1,2);

可以看到，SQL拆分的数目与单表是一致的。

笛卡尔路由

笛卡尔路由是最复杂的情况，它无法根据绑定表的关系定位分片规则，因此非绑定表之间的关联查询所需要拆解为笛卡尔积组合执行。如果上个实例中的SQL并为配置绑定表关系，那么路由的结果应为:

SELECT * FROM t_order_0 o JOIN t_order_item_0 i  ON o.order_id = i.order_id  WHERE order_id IN(1,2); 

SELECT * FROM t_order_0 o JOIN t_order_item_1 i  ON o.order_id = i.order_id  WHERE order_id IN(1,2); 

SELECT * FROM t_order_1 o JOIN t_order_item_0 i  ON o.order_id = i.order_id  WHERE order_id IN(1,2); 

SELECT * FROM t_order_1 o JOIN t_order_item_1 i  ON o.order_id = i.order_id  WHERE order_id IN(1,2);

笛卡尔路由查询性能较低，需谨慎使用。

全库表路由

对于不携带分片键的SQL，则采取广播路由的方式。根据SQL类型又可以划分为全库表路由。全库表路由、全库路由、全实例路由、单播路由和阻断路由这5种类型。其中全库表路由用于处理对数据库中与逻辑表相关的所有真实表的操作，主要包括不带分片的DQL(数据查询)和DML(数据操纵)，以及DDL(数据定义)等。例如:

SELECT * FROM t_order WHERE good_prority IN(1,10);

则会遍历所有数据库中的所有表，逐一匹配逻辑表和真实表名，能够匹配得上则执行。路由后成为

SELECT * FROM t_order_0 WHERE good_prority IN(1,10);
SELECT * FROM t_order_1 WHERE good_prority IN(1,10);
SELECT * FROM t_order_2 WHERE good_prority IN(1,10);
SELECT * FROM t_order_3 WHERE good_prority IN(1,10);

3.4 SQL改写

Sharding-JDBC采用一套自动化的执行引擎，负责将路由和改写完成之后的真实SQL安全且高效发送到底层数据源执行。它不是简单地将SQL通过JDBC直接发送到数据源执行；也并非直接将执行请求放入线程池去并发执行。它更关注平衡数据源连接创建以及内存占用所产生的消耗，以及最大限度地合理利并发等问题。执行引擎的目标是自动化的平衡资源控制与执行效率，他能在以下两种模式自适应切换：

内存限制模式

使用此模式的前提是，Sharding-JDBC对一次操作所消耗的数据库连接数量不做限制。如果实际执行的SQL需要对某数据库实例中的200张表做操作，则对每张表创建一个新的数据库连接，并通过多线程的方式并发处理，以达成执行效率最大化。

连接限制模式

使用此模式的前提是，Sharding-jdbc严格控制一次操作所耗费的数据库连接数量。如果实际执行的SQL需要对某数据库实例中的200张表做操作，那么只会创建唯一的数据库连接，并对其200张表串行处理。如果一次操作中的分片散落在不同的数据库，仍然采用多线程处理不同库的操作，但每个库的每次操作仍然只创建一个唯一的数据库连接。

内存限制模式适用于OLAP操作，可以通过放宽对数据连接的限制提升系统吞吐量；连接限制模式适用于OLTP操作，OLTP通常带有分片键，会路由到单一的分片，因此严格控制数据库连接，以保证在线系统数据库资源能够被更多的应用所使用，是明智的选择。

3.6 结果归并

将从各个数据节点获取多个数据结果集，组合成为一个结果集并正确的返回至请求客户端，称为结果归并。

Sharding-JDBC支持的结果归并从功能上可以遍。历、排序、分组、分页和聚合5种类型，她们是组合而非互斥的关系。

归并引擎的整体结构划分如下图。

结果归并从结构划分可分为流式归并和装饰归并。流式归并和内存归并是互斥的，装饰者归并并可以在流式归并和内存归并之上做进一步的处理。

内存归并很容易理解，他是将所有的分片结果集的数据都遍历并存储在内存中，再通过统一的分组，排序以及聚合等计算之后，再将其封装成为逐条访问的数据结果集返回。

流式归并是指每一次从数据库结果集中获取到的数据，都能够通过游标逐条的方式返回的正确的单条数据，它与数据库原生的返回结果集的方式最为契合。

下边举例说明排序归并的过程，如下图是一个通过分数进行排序的示例图，它采用流式归并方式。图中展示了3张表返回的数据结果集，每个数据集已经根据分数排序完毕，但3个数据结果集之间是无序的。将3个数据集的当前游标指向的数据值进行排序，并放入优先级队列,t_score_0的第一个数据值最大，t_score_1的方式排列队列。

下图则展现了进行next调用的时候，排序归并是如何进行的。通过图中我们可以看到，当进行第一次next调用时，排在队列首位的t_score_0将会被弹出队列，并且将当前的游标指向的数据值(也就是1000) 返回值查询用户端，并且将游标下移一位之后，重新放入优先级队列。而优先级队列也会根据t_score_0的当前数据结果集指向游标数值(这里是90)进行排序，根据当前的数值，t_score_0排列的最后一位。之前队列中排名第二的t_score_1的数据结果集则自动排在了队列首位。

在进行第二次next时，只需要将目前排列在队列首位的t_score_1弹出队列，并且将其数据结果集游标指向的值返回客户端，并下移游标，继续加入队列排队，以此类推。当一个结果集中已经没有数据了，则无需再次加入队列。

可以看到，对于每个数据结果集中的数据有序，而多数据结果集整体无序的情况下，Sharing-JDBC无需将所有的数据都加载至内存即可排序。它使用的是流式归并的方式，每次next仅获取唯一正确的一条数据，极大的节省了内存的消耗。

装饰者归并是对所有的结果集归并进行统一的功能增强，比如归并时间需要聚合SUM前，在进行聚合计算前，都会通过内存归并或流式归并查询结果集。因此，聚合归并是在之前介绍的归并类型之上追加的归并能力，即装饰者模式。

3.7 总结

通过以上内容介绍，我们已经了解到Sharding-JDBC基础概念、核心功能以及执行原理。

基础概念:逻辑表、真实表、数据节点、绑定表、广播表、分片键、分片算法、分片策略、主键生成策略

核心功能: 数据分片、读写分离

执行流程:SQL解析 => 查询优化 => SQL路由 => SQL改写 => SQL执行 => 结果归并

4.水平分表

前面已经介绍过，水平分表是在同一个数据库内，把同一个数据按照一定规则拆到多个表中，在快速上手里，我们已经对水平分表进行实现，这里不再重复介绍。

5.水平分库

前面已经介绍过，水平分库是把同一个表的数据按照一定的规则拆到不同的数据库中，每个库可以放在不同的服务器上。接下来看一下如何使用Sharding-JDBC实现水平分库，咱们继续对快速入门中的例子进行完善。

(1)将原有的order_db库拆分为order_db_1和order_db_2

(2)分片规则修改

由于数据库拆分两个，这里需要配置两个数据源。

分库需要配置分库的策略，和分表策略类似，通过分库策略实现数据操作针对分库的数据库进行操作。

#定义多数据源
spring:
  shardingsphere:
    datasource:
      names: m1,m2 #数据库
      m1:  
        type: com.alibaba.druid.pool.DruidDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        username: root
        data-password: 123456
        url: jdbc:mysql://127.0.0.1:3306/order_db_1?useUnicode=true&characterEncoding=utf-8&useSSL=false&allowPublicKeyRetrieval=true
      m2:  
        type: com.alibaba.druid.pool.DruidDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        username: root
        data-password: 123456
        url: jdbc:mysql://127.0.0.1:3306/order_db_2?useUnicode=true&characterEncoding=utf-8&useSSL=false&allowPublicKeyRetrieval=true    
        
#分库策略,以user_id为分片键，分片策略为user_id % 2 +1,user_id为偶数操作m1数据源,否则操作m2。
 sharding:
      tables:
        t.order:   #逻辑表名
          table-strategy: # 分表策略
            inline:
              sharding-column: user_id   # 分片路由标准
              algorithm-expression: m$->{user_id % 2 +1} # 分片算法表达式
            key-generator: # 主键⽣成策略
              type: SNOWFLAKE
              column: order_id

分库策略定义方式如下:

 #分片策略，如何将一个逻辑表映射到多个数据源
 sharding:
      tables:
        <逻辑表名>:   
          database-strategy: 
            <分片策略>:
              <分片策略属性名>: 分片策略属性值

6.垂直分库

前面介绍过，垂直分库是指按照业务将表进行分类，分布到不同的数据库上面，每个库可以放在不同的服务器上，它的核心理念是专库专用。下来看一下如何使用sharding-JDBC实现垂直分库。

(1)创建数据库

创建数据库user_db

CREATE DATABASE user_db CHARACTER SET utf8 COLLATE utf8_general_ci;

在user_db中创建t_user表

DROP TABLE IF EXITSTS t_user;
CREATE TABLE t_user (
    user_id bigint(20) NOT NULL COMMENT '用户id',
    fullname varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '用户姓名',
    user_type char(1) DEFAULT NULL COMMENT '用户类型',
    PRIMARY KEY ('user_id') USING BTREE
)ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

(2) 在sharding-JDBC规则中修改

shardingsphere:
  datasource:
    names: m1,m2                                      # 数据源，这里为了方便直接使用库名的名称
    m1:
      username: root
      password: 123456
      url: jdbc:mysql://localhost:3306/user_db_1?setUnicode=true&characterEncoding=utf8
      driver-class-name: com.mysql.cj.jdbc.Driver
      type: com.alibaba.druid.pool.DruidDataSource   # Druid连接池
    m2:
      username: root
      password: 123456
      url: jdbc:mysql://localhost:3307/user_db_2?setUnicode=true&characterEncoding=utf8
      driver-class-name: com.mysql.cj.jdbc.Driver
      type: com.alibaba.druid.pool.DruidDataSource   # Druid连接池

  sharding:
      tables:
        t_user:   
          actual-data-nodes: m$->{1..2}.t_user_$->{1..2}        # 表的名字
          database-strategy:                                # 分库策略
            inline:
              sharding-column: user_id
              algorithm-expression: m$->{user_id % 2 +1}
           table-strategy:                                # 分库策略
            inline:
              sharding-column: user_id
              algorithm-expression: t_user_$->{user_id % 2 +1} #分表策略

7.公共表

公共表属于系统中数据量较小,变动少，而且属于频繁联合查询的依赖表。参数表、数据字典表等属于此类型。可以将这类型表每个数据库都保存一份，所有更新操作都同时发送到所有分库执行。接下来一下如何使用Sharding-JDBC实现公共类。

(1) 创建数据库

分别在user_db、order_db_1、order_db2中创建t_dict表:

DROP TABLE IF EXITSTS t_dict;
CREATE TABLE t_user (
    dict_id bigint(20) NOT NULL COMMENT '字典id',
    type varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '字典类型',
    code varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '字典编码',
    value varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '字典值',
    PRIMARY KEY ('dict_id') USING BTREE
)ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

(2) 在sharding-JDBC规则中修改

# 指定t_dict为公共表
    sharding:
      broadcast-tables: t_dict #公共表 广播表

8.读写分离

8.1 理解读写分离

面对日益的系统访问量，数据库的吞吐量面临巨大瓶颈。对于同一时刻有大量并发读操作和较少写操作类型的应用系统来说，将数据库拆分为主库和从库，主库负责处理事务性质的增删改操作，从库负责处理查询操作，能够有效的避免由数据库更新导致的行锁，使得整个系统的查询性能得到极大的改善。

通过一主多从的配置方式，可以将查询请求均匀的分散到都多个数据副本，能够进一步的提升系统的处理能力。使用多主多从的方式，不但能够提升系统的吞吐量，还能够提升系统的可用性，可以达到在任何一个数据库宕机，甚至磁盘物理损坏的情况下仍然不影响系统的正常运行。

读写分离的数据节点的数据内容是一致的，而水平分片的每个数据节点的数据内容却并不相同。将水平分片和读写分离联合使用，能够更加有效的提升系统的性能。

ShardingJDBC读写分离则是根据SQL语义的分析，将读操作和写操作分别路由至主库与从库。它提供透明化读写分离，让使用方法尽量像使用一个数据库一样使用主从数据库集群。

Sharding-JDBC提供一主多从的读写分离配置，可独立使用，也可配合分库分表使用，同一线程且同一数据库连接内，如有写入操作，以后的读操作均从主库读取，用于保证数据一致性。Sharding-JDBC不提供主从数据库的数据同步功能，需要采用其他机制支持。

接下来需要，对上面例子中user_db进行读写分离实现。为了实现Sharding-JDBC的读写分离，首先，要进行mysql的主从同步配置。

8.2 mysql主从同步(windows)

主库：

[mysqld]
#开启日志
log-bin= mydql-bin
#设置服务id,主从不能一致
server-id= 1
#设置需要同步的数据库
binlog-do-db= user_db
#屏蔽系统同步
binlog-ignore-db= mysql
binlog-ignore-db= information_schema
binlog-ignore-db= performance_schema

从库：

[mysqld]
#开启日志
log-bin= mydql-bin
#设置服务id,主从不能一致
server-id= 2
#设置需要同步的数据库
binlog-do-db= user_db.%
#屏蔽系统同步
binlog-ignore-db= mysql.%
binlog-ignore-db= information_schema.%
binlog-ignore-db= performance_schema.%

重启主库和从库

net start [主服务器名]
net start [从服务器名mysqls1]

请注意，主从Mysql下的数据(data)目录下有个auto.cnf,文件中定义了uuid，要保证主从数据库实例的uuid不一样，建议直接删掉，重启服务后将重新生成。

三、授权主从复制专用账号

#登录主库
mysql -h localhost -uroot -p123456
#授权主备复制专用账号
GARNT REPLICATION ON *.* TO 'db_sync'@'%' IDENTIFIED BY 'db_sync';
#刷新权限
FLUSH PRIVILEGES;
#确认位点，记录下文件名以及位点
show master status;

四、设置从库向主库同步数据、并检查链路

#登录从库
mysql -h localhost -uroot -p123456
#先停止同步
STOP SLAVE;
#修改从库指向主库，使用上一步记录的文件名以及位点
CHANGE MASTER TO
 master_host = 'localhsot',
 master_user = 'db_sync',
 master_password = 'db_sync',
 master_log_file = 'mysql-bin.000002',
  master_log_pos = '154';
#启动同步
START SLAVE;
#查看从库状态Slave_IO_Runing和Slave_SQL_Runing都为Yes说明同步成功，如果不为Yes,请检查error_log,然后排查相关异常。
show slave status\G

#注意 如果之前此备库已有主库指向 需要先执行以下命令清空
STOP SLAVE TO_THREAD FOR CHANNEL '';
reset slave all;

8.3 实现sharding-JDBC读写分离

(1) 在Sharding-JDBC规则中修改

#配置主从数据库
shardingsphere:
    datasource:
      names: m1,s1        # 主库:m1,从库:s1
      m1:
        username: root
        password: 123456
        url: jdbc:mysql://localhost:3306/user_db?setUnicode=true&characterEncoding=utf8
        driver-class-name: com.mysql.cj.jdbc.Driver
        type: com.alibaba.druid.pool.DruidDataSource   # Druid连接池
      s1:
        username: root
        password: 123456
        url: jdbc:mysql://localhost:3306/user_db?setUnicode=true&characterEncoding=utf8
        driver-class-name: com.mysql.cj.jdbc.Driver
        type: com.alibaba.druid.pool.DruidDataSource   # Druid连接池
        
    sharding:
      master-slave-rules:
        ds0:  # 主从逻辑数据源 定义 ds0 为uesr_db
          master-data-source-name: m1
          slave-data-source-name: s1
          			
      tables:  #分表策略，固定分配到ds0的真实表
        t_user:   
          actual-data-nodes: ds0.t_user        # 表的名字

你可能感兴趣的:(数据库,java,服务器)

为什么wal会提升数据库性能浩澜大大数据库
由于对于一个数据库内会存在很多张表，那么当数据库更新表数据时（1）直接写入磁盘实际写入的位置，会根据表的不同对应到不同的磁盘位置，在写入数据的时候，就会不停的寻找磁盘地址，找到地址后再去写入，对于机械硬盘来说，无规律的寻址是非常耗时的，对应SSD来说虽然性能提升很多，但是也会消耗时间；（2）先写入日志，在写入磁盘（WAL）WAL的过程，由于总是按照在文件末尾追加，只要找到文件写入位置，写入修改后，
2022年河南省高等职业教育技能大赛云计算赛项竞赛赛卷（样卷）忘川_ydy 云计算云计算 openstack kubernetes docker python k8s ansible
#需要资源（软件包及镜像）或有问题的，可私博主！！！#需要资源（软件包及镜像）或有问题的，可私博主！！！#需要资源（软件包及镜像）或有问题的，可私博主！！！第一部分：私有云任务1私有云服务搭建(10分)使用提供的用户名密码，登录竞赛用的云计算平台，按要求自行使用镜像创建两台云主机，创建完云主机后确保网络正常通信，然后按要求配置服务器。根据提供安装脚本框架，补充脚本完成OpenStack平台的安装搭
浪潮 M5系列服务器IPMI无法监控存储RAID卡问题. Songxwn 硬件服务器服务器运维
简介浪潮的M5代服务器，可能有WebBMC无法查看存储RAID/SAS卡状态的情况，可以通过以下方式修改。修改完成后重启BMC即可生效。ESXiIPMITools使用：https://songxwn.com/ESXi8_IPMI/（Linux也可以直接使用）Linux/ESXiIPMITool下载：https://songxwn.com/file/ipmitoolWindows下载：https:/
通俗易懂：MySQL中如何设置只读实例并确保数据一致性？大龄下岗程序员 mysql java mysql spring
在MySQL中设置只读实例主要应用于构建高可用性和扩展性的数据库环境，通常是为了分担读取负载或者用于备份和灾难恢复。以下是创建MySQL只读实例并确保数据一致性的基本步骤：1.创建并配置只读实例-主从复制设置-首先，你需要有一个主数据库实例（Master）负责接收所有的写操作。-创建一个或多个从数据库实例（Slave），并将它们配置为主数据库的复制品。这通常通过设置主从复制（Replication
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
学习JavaEE的日子 Day32 线程池 A 北枝学习JavaEE 学习 java-ee java 线程池
Day32线程池1.引入一个线程完成一项任务所需时间为：创建线程时间-Time1线程中执行任务的时间-Time2销毁线程时间-Time32.为什么需要线程池(重要)线程池技术正是关注如何缩短或调整Time1和Time3的时间，从而提高程序的性能。项目中可以把Time1，T3分别安排在项目的启动和结束的时间段或者一些空闲的时间段线程池不仅调整Time1，Time3产生的时间段，而且它还显著减少了创建
C#中的PLINQ和LINQ的效率对比搬砖的诗人Z C#c#linq 开发语言
PLINQ（ParallelLINQ）和LINQ（LanguageIntegratedQuery）都是.NET框架中的功能，用于对集合进行查询和操作。它们之间的主要区别在于并行处理能力。LINQ:LINQ是一种用于在.NET应用程序中进行数据查询和操作的语言集成功能。它提供了一种统一的方式来查询各种数据源，如集合、数组、XML、数据库等。LINQ是在单线程环境中执行查询操作的，因此对于大型数据集或
请简单介绍一下Shiro框架是什么？Shiro在Java安全领域的主要作用是什么？Shiro主要提供了哪些安全功能？ AaronWang94 shiro java java 安全开发语言
请简单介绍一下Shiro框架是什么？Shiro框架是一个强大且灵活的开源安全框架，为Java应用程序提供了全面的安全解决方案。它主要用于身份验证、授权、加密和会话管理等功能，可以轻松地集成到任何JavaWeb应用程序中，并提供了易于理解和使用的API，使开发人员能够快速实现安全特性。Shiro的核心组件包括Subject、SecurityManager和Realms。Subject代表了当前与应用
通俗易懂：什么是Java虚拟机（JVM）？它的主要作用是什么？大龄下岗程序员 mysql java mysql spring
Java虚拟机（JavaVirtualMachine,JVM）是一种软件实现的抽象计算机，它负责执行Java字节码（Bytecode）。Java程序并不是直接在物理计算机上运行，而是先由Java编译器将源代码编译成与平台无关的字节码，然后由JVM负责读取字节码并在实际硬件架构上运行。JVM的主要作用包括以下几个方面：1.跨平台性-JVM是Java语言“一次编写，到处运行”（WriteOnce,Ru
3、JavaWeb-Ajax/Axios-前端工程化-Element 所谓远行Misnearch #JavaWeb 前端 ajax elementui java 前端框架
P34Ajax介绍Ajax:AsynchroousJavaScriptAndXML，异步的JS和XMLJS网页动作，XML一种标记语言，存储数据，作用：数据交换：通过Ajax给服务器发送请求，并获取服务器响应的数据异步交互：在不重新加载整个页面的情况下，与服务器交换数据并实现更新部分网页的技术，例如：搜索联想、用户名是否可用的校验等等。同步与异步：同步：服务器在处理中客户端要处于等待状态，输入域名
docker怎么端口映射 Lance_mu docker 容器运维
1、默认固定的端口#Web服务器：WebApache或Nginx通常使用80端口HTTP：80HTTPS：443#数据库服务器MySQL：3306PostgreSQL：5432MongoDB：27017Redis：6379#邮件服务器SMTP：25POP3：110IMAP：143#其他服务SSH：22FTP：21DNS（域名解析）：53代理服务器Squid：3128版本控制系统Git：9418(S
新注册的阿里云账号有哪些优惠？阿里云新用户必看优惠大合集阿里云最新优惠和活动汇总
很多用户看到阿里云各种活动中的云服务器、云数据库、企业邮箱等云产品都仅限新用户购买之后，都纷纷直接注册了阿里云新账号之后购买，其实，阿里云新用户不仅可以优惠购买活动中的各种云产品，还有很多优惠，下面是“阿里云最新优惠和活动汇总”整理汇总的阿里云新用户必看优惠大合集。新注册的阿里云账号在购买活动中的云产品之前，还有免费领云产品通用代金券、抽取无门槛代金券、免费试用云服务器和正式购买云服务器等阿里云产
MyBatis高级面试题-2024 my_styles mybatis java 开发语言面试题
MyBatis的核心组件有哪些？首先第一个是，SqlSessionFactory，它就像是一个会话工厂。它的任务是创建SqlSession对象，这个对象是我们与数据库交互的主要途径。SqlSessionFactory的作用很重要，因为它可以帮我们配置数据库连接信息和事务管理等。一旦这个工厂被建立起来，它就会加载一些必要的配置和映射文件，为后续的数据库操作提供一个可靠的基础。第二个是SqlSessi
SQLite版本3中的文件锁定和并发(七）代码工匠云数据库 SQLite C与c++sqlite c++数据库
返回：SQLite—系列文章目录上一篇：自己编译SQLite或将SQLite移植到新的操作系统（六）下一篇：SQLite—系列文章目录正文：1.0SQLite版本3中的文件锁定和并发SQLite版本3.0.0引入了新的锁定和日志功能旨在提高SQLite版本2的并发性的机制并减少作家的饥饿问题。新机制还允许交易的原子提交涉及多个数据库文件。本文档介绍新的锁定机制。目标受众是想要理解和/或修改的程序员
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
枚举使用笔记万变不离其宗_8 项目笔记笔记
1.java枚举怎么放在方法上面的注释里面/***保存*@paramuserId用户id*@paramtype见枚举{@linkcom.common.enums.TypeEnum}*@return*/voidsave(LonguserId,Stringtype);
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
数据管理知识体系指南（第二版）-第五章——数据建模和设计-学习笔记键盘上的五花肉数据治理数据库数据仓库数据治理
目录5.1引言5.1.1业务驱动因素5.1.2目标和原则5.1.3基本概念5.2活动5.2.1规划数据建模5.2.2建立数据模型5.2.3审核数据模型5.2.4维护数据模型5.3工具5.3.1数据建模工具5.3.2数据血缘工具5.3.3数据分析工具5.3.4元数据资料库5.3.5数据模型模式5.3.6行业数据模型5.4方法5.4.1命名约定的最佳实践5.4.2数据库设计中的最佳实践5.5数据建模和
webpack.prod.js（webpack生产环境配置文件）门板_ webpack javascript 前端
生产环境：只打包不运行本地服务器对于在config目录下的webpack.prod.js1.在根目录下运行npxwebpack--config./config/webpack.prod.js2.在package.json文件中配置"build":"npxwebpack--config./config/webpack.prod.js"constpath=require('path')constESL
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
项目管理工具最佳实践水岩
各个公司的最佳实践去哪儿jira自定义使用1.jira编号对应git分支命名，后台增加监控程序，新增一个分支，自动解析分支中的jira编号，自动落地到数据库，完成映射2.各个发布系统间信息同步，消息中心（IC）+数据中心（DC）,广播消息加一站式查询，持续集成，推进代码检查质量，分钟级反馈质量检查反思：1.项目管好：针对一线研发人员，简单易用，而不是满足管理层的“统计度量”（...）简化分类字段，
java实体中返回前端的double类型四舍五入（格式化）婲落ヽ紅顏誶 java
根据业务，需要通过后端给前端返回部分double类型的数值，一般需要保留两位小数，使用jackson转换对象packagecom.ruoyi.common.core.config;importcom.fasterxml.jackson.core.JsonGenerator;importcom.fasterxml.jackson.databind.JsonSerializer;importcom.f
Java中HashMap底层数据结构及主要参数? 山间漫步人生路 java 数据结构开发语言
在Java中，HashMap的底层数据结构主要基于数组和链表，同时在Java8及以后的版本中，当链表长度超过一定阈值时，链表会转换为红黑树来优化性能。这种结构结合了数组和链表的优点，既提供了快速的随机访问，又允许动态地扩展存储桶的大小。HashMap的主要参数包括：初始容量（InitialCapacity）：这是HashMap在创建时设定的桶数组的大小。默认值为16。这个值可以根据预计存储的键值对
Java学习笔记01 .wsy. 日常 java 学习笔记
1.1Java简介Java的前身是Oak，詹姆斯·高斯林是java之父。1.2Java体系Java是一种与平台无关的语言，其源代码可以被编译成一种结构中立的中间文件（.class，字节码文件）于Java虚拟机上运行。1.2.3专有名词JDK提供编译、运行Java程序所需要的种种工具及资源。JRE是运行Java所依赖的环境的集合。JVM是一个虚构出来的计算机，通过在实际的计算机上仿真模拟各种计算机功
Java回溯知识点（含面试大厂题和源码）一成码农 java 面试开发语言
回溯算法是一种通过遍历所有可能的候选解来寻找所有解的算法，如果候选解被确认不是一个解（或至少不是最后一个解），回溯算法会通过在上一步进行一些变化来丢弃这个解，即“回溯”并尝试另一个候选解。回溯法通常用递归方法来实现，在解决排列、组合、选择问题时非常有效。回溯算法的核心要点：路径：也就是已经做出的选择。选择列表：也就是你当前可以做的选择。结束条件：也就是到达决策树底层，无法再做出选择的条件。回溯算法
Azkaban各种类型的Job编写 __元昊__
一、概述原生的Azkaban支持的plugin类型有以下这些：command：Linuxshell命令行任务gobblin：通用数据采集工具hadoopJava：运行hadoopMR任务java：原生java任务hive：支持执行hiveSQLpig：pig脚本任务spark：spark任务hdfsToTeradata：把数据从hdfs导入TeradatateradataToHdfs：把数据从Te
java基础相关面试题详细总结。。。。。96 java 开发语言
1.Java中的数据类型有哪些？答：Java中的数据类型包括基本数据类型（如整数、浮点数、字符等）和引用数据类型（如类、接口、数组等）。2.什么是面向对象编程（OOP）？答：面向对象编程是一种编程范式，它将数据和对数据的操作封装在一起，形成对象。通过对象之间的交互来实现程序的功能。3.解释类和对象的关系。答：类是对象的抽象描述，而对象是类的具体实例。一个类可以创建多个对象，每个对象都具有类中定义的
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
.NET Core 将实体类转换为 SQL(ORM 映射) 你小子在看什么…… .NET .netcore sqlsugar postgresql
一、环境说明PostgreSQL数据库Npgsql数据库连接库SqlSugarORM框架二、映射流程1、创建数据库：检查指定数据库是否存在，如果不存在则创建数据库。2、初始化SqlSugar实例：使用SqlSugarClient初始化数据库连接配置。3、筛选实体类：根据指定的命名空间和排除条件筛选需要创建表的实体类。4、创建表：使用CodeFirst.InitTables方法创建数据库表。////
Qlib-Server部署宋志辉 flask python qlib 量化
Qlib-Server部署介绍构建Qlib服务器，用户可以选择：一键部署Qlib服务器逐步部署Qlib服务器一键部署Qlib服务器支持一键部署，用户可以选择以下两种方法之一进行一键部署：使用docker-compose部署在Azure中部署使用docker-compose进行一键部署按照以下步骤使用docker-compose部署Qlib服务器：安装docker，请参考Docker安装。安装doc
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情