Darryl大数据

SQL高手修炼手册：解锁高级技巧，提升查询效率

引言：开启 SQL 高级技巧之旅

在大数据领域，SQL（Structured Query Language，结构化查询语言）无疑是一项核心技能，它就像是一把万能钥匙，能够帮助我们在海量的数据宝库中精准地获取所需信息。从电商平台分析用户购买行为，到金融机构进行风险评估，再到社交媒体挖掘用户兴趣偏好，SQL 的身影无处不在，承担着数据查询、分析、管理等关键任务。

随着数据量呈指数级增长以及业务需求日益复杂，仅仅掌握基础的 SQL 语法已经难以满足高效数据处理的要求。想象一下，在处理千万级甚至亿级数据时，一条效率低下的查询语句可能会让程序运行数小时甚至更久，这对于争分夺秒的业务决策来说是无法接受的。而高级 SQL 技巧就如同编程世界里的 “秘密武器”，能够显著提升查询效率，优化数据处理流程，让原本耗时费力的任务变得轻松高效。

在接下来的内容中，我将为大家揭开高级 SQL 技巧的神秘面纱，通过丰富的案例和详细的代码，深入浅出地讲解这些技巧如何在实际工作中发挥巨大作用，帮助大家在大数据的海洋中乘风破浪，成为数据处理的高手。

一、窗口函数：数据处理的瑞士军刀

窗口函数，也被称为分析函数，是 SQL 中功能强大且灵活的工具，它为数据处理带来了全新的视角和更高的效率。与传统的聚合函数不同，窗口函数不会将多行数据合并为一行，而是在每一行数据上进行计算，同时可以访问窗口内的其他行数据，这使得它在处理复杂数据分析任务时表现出色。

1.1 排名函数：RANK、DENSE_RANK、ROW_NUMBER

在数据分析中，经常需要对数据进行排名，例如在员工薪资管理中，我们可能想知道每个部门内员工薪资的排名情况。SQL 提供了三个常用的排名函数：RANK、DENSE_RANK 和 ROW_NUMBER ，它们各有特点。

RANK函数：语法为 RANK() OVER (PARTITION BY column1 ORDER BY column2)，其中 PARTITION BY 用于指定分区条件，ORDER BY 用于指定排序条件。RANK 函数会根据排序条件对每个分区内的数据进行排名，如果有相同的值，会占用相同的排名，并且下一个排名会跳过相应的数量。例如，假设有三个员工的薪资分别为 10000、8000、8000，那么排名结果将是 1、2、2，下一个薪资为 7000 的员工排名将是 4。

DENSE_RANK函数：语法与 RANK 函数相同，DENSE_RANK 函数也会根据排序条件对每个分区内的数据进行排名。与 RANK 函数不同的是，当有相同的值时，它会占用相同的排名，但下一个排名不会跳过，而是连续的。例如，同样是上述三个员工薪资情况，排名结果将是 1、2、2，下一个薪资为 7000 的员工排名将是 3。

ROW_NUMBER函数：语法同样为 ROW_NUMBER() OVER (PARTITION BY column1 ORDER BY column2) ，ROW_NUMBER 函数会为每个分区内的每一行数据分配一个唯一的连续编号，从 1 开始，不会考虑数据值是否相同。例如，对于上述三个员工薪资，排名结果将是 1、2、3。

下面通过一个具体的案例来展示这三个函数的使用。假设我们有一个 employees 表，包含员工编号 employee_id、部门编号 department_id 和薪资 salary 字段，我们要获取每个部门内员工薪资的排名。

\-- 使用RANK函数

SELECT employee\_id, department\_id, salary,

       RANK() OVER (PARTITION BY department\_id ORDER BY salary DESC) AS rank

FROM employees;

\-- 使用DENSE\_RANK函数

SELECT employee\_id, department\_id, salary,

       DENSE\_RANK() OVER (PARTITION BY department\_id ORDER BY salary DESC) AS dense\_rank

FROM employees;

\-- 使用ROW\_NUMBER函数

SELECT employee\_id, department\_id, salary,

       ROW\_NUMBER() OVER (PARTITION BY department\_id ORDER BY salary DESC) AS row\_num

FROM employees;

通过这三个查询语句，我们可以清晰地看到每个部门内员工薪资的不同排名情况，根据具体业务需求选择合适的排名函数。

1.2 偏移函数：LEAD 和 LAG

LEAD 和 LAG 函数是窗口函数中用于访问窗口内前后行数据的强大工具，它们在分析时间序列数据或比较相邻数据时非常有用。

LEAD函数：语法为 LEAD(column_name, offset, default_value) OVER (PARTITION BY column1 ORDER BY column2)，其中 column_name 是要访问的列，offset 表示偏移的行数，默认为 1，即下一行数据；default_value 是当偏移超出窗口范围时返回的默认值，若不指定，默认返回 NULL。LEAD 函数可以获取当前行之后指定偏移行的数据。

LAG函数：语法与 LEAD 函数类似，LAG(column_name, offset, default_value) OVER (PARTITION BY column1 ORDER BY column2)，LAG 函数则是获取当前行之前指定偏移行的数据。

以销售数据为例，假设我们有一个 sales 表，包含销售日期 sale_date、产品 ID product_id 和销售额 revenue 字段，我们想计算每天销售额与前一天销售额的差值。

SELECT sale\_date, product\_id, revenue,

       revenue - LAG(revenue, 1, 0) OVER (ORDER BY sale\_date) AS revenue\_diff

FROM sales;

在这个查询中，使用 LAG(revenue, 1, 0) 获取前一天的销售额，若前一天没有数据（即第一天），则返回默认值 0，然后用当前销售额减去前一天销售额，得到销售额的差值。

1.3 聚合窗口函数：SUM、AVG 等

聚合窗口函数是窗口函数的另一大重要类型，它允许我们在窗口内对数据进行聚合计算，如计算累计和、平均值等，而不是像传统聚合函数那样将整个数据集合并为一行。

语法：以 SUM 函数为例，语法为 SUM(column_name) OVER (PARTITION BY column1 ORDER BY column2 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)，PARTITION BY 和 ORDER BY 与前面介绍的函数用法相同，ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 定义了窗口的范围，这里表示从分区的第一行（UNBOUNDED PRECEDING）到当前行（CURRENT ROW）。

假设我们有一个财务数据 finance 表，包含月份 month 和收入 income 字段，我们要计算每月的累计收入。

SELECT month, income,

       SUM(income) OVER (ORDER BY month ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS cumulative\_income

FROM finance;

在这个查询中，SUM(income) OVER (ORDER BY month ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) 会计算从第一个月到当前月的累计收入，随着月份的递增，累计收入不断更新，从而得到每个月的累计收入情况。同样，我们也可以使用 AVG 函数计算累计平均值等其他聚合计算。

窗口函数的这些高级用法，极大地拓展了 SQL 在复杂数据处理和分析中的能力，通过灵活运用这些函数，我们能够高效地解决各种数据分析难题，为业务决策提供有力支持。

二、递归查询：深入树形结构数据

在处理具有层级关系的数据时，递归查询是一种不可或缺的强大技术，它能够深入挖掘树形结构数据，揭示数据之间复杂的层级关联。递归 CTE（Common Table Expressions，通用表表达式）是实现递归查询的关键工具，让我们深入了解它的奥秘。

2.1 递归 CTE 的基本语法与原理

递归 CTE 的语法结构主要由三部分组成：初始查询、递归成员和终止条件。

初始查询：作为递归的起点，它返回树形结构的根节点数据，定义了递归的初始数据集。

递归成员：通过引用自身和初始查询结果，不断地递归生成新的数据行，逐步扩展查询结果，以涵盖树形结构的各个层级。

终止条件：用于限制递归的深度，防止无限递归，确保查询能够在合理的时间内完成。

以一个组织架构表为例，假设我们有一个 employees 表，包含员工 ID employee_id、员工姓名 employee_name 和上级 ID manager_id 字段，其中 manager_id 为 NULL 表示该员工是公司的最高领导（根节点）。递归 CTE 的工作原理如下：

初始查询选择根节点（最高领导）的数据。

递归成员通过将当前层级的员工作为上级，查找其下属员工，将这些下属员工添加到结果集中，并将这些下属员工作为下一层递归的起点。

递归过程不断重复，直到满足终止条件（例如，所有员工都已被包含在结果集中）。

2.2 实战案例：构建组织架构图

假设我们有以下 employees 表数据：

employee_id	employee_name	manager_id
1	张三	NULL
2	李四	1
3	王五	1
4	赵六	2
5	孙七	2
6	周八	3

我们可以使用递归 CTE 来构建完整的组织架构图，展示每个员工及其上级的层级关系。

WITH RECURSIVE organization\_chart AS (

    \-- 初始查询，选择根节点（最高领导）

    SELECT employee\_id, employee\_name, manager\_id, 1 AS level

    FROM employees

    WHERE manager\_id IS NULL

    UNION ALL

    \-- 递归成员，查找下属员工

    SELECT e.employee\_id, e.employee\_name, e.manager\_id, oc.level + 1

    FROM employees e

    INNER JOIN organization\_chart oc ON e.manager\_id = oc.employee\_id

)

\-- 最终查询，按照层级顺序展示组织架构

SELECT employee\_id, employee\_name, manager\_id, level

FROM organization\_chart

ORDER BY level, employee\_id;

在这个查询中：

WITH RECURSIVE organization_chart AS (...) 定义了一个递归 CTE，名为 organization_chart。

初始查询 SELECT employee_id, employee_name, manager_id, 1 AS level FROM employees WHERE manager_id IS NULL 选择了公司的最高领导（根节点），并将其层级设置为 1。

UNION ALL 将初始查询结果与递归成员结果合并。

递归成员 SELECT e.employee_id, e.employee_name, e.manager_id, oc.level + 1 FROM employees e INNER JOIN organization_chart oc ON e.manager_id = oc.employee_id 通过将当前层级的员工作为上级，查找其下属员工，并将下属员工的层级设置为上级层级加 1。

最终查询 SELECT employee_id, employee_name, manager_id, level FROM organization_chart ORDER BY level, employee_id 按照层级顺序展示了整个组织架构，包括每个员工的 ID、姓名、上级 ID 和层级。

通过递归查询，我们可以清晰地看到组织架构中每个员工的层级位置和上下级关系，这对于人力资源管理、权限分配等业务场景具有重要意义，极大地提高了数据处理和分析的效率，帮助我们更好地理解和管理树形结构数据。

三、公共表表达式（CTE）：简化复杂查询

3.1 CTE 的定义与优势

公共表表达式（Common Table Expressions，简称 CTE）是一种在 SQL 查询中定义临时结果集的强大工具，它可以在一个查询语句中多次引用，就像是在查询中创建了一个临时的虚拟表。CTE 的语法结构通常以 WITH 关键字开头，后面跟着 CTE 的名称和定义它的查询语句，例如：

WITH cte\_name AS (

    SELECT column1, column2

    FROM table\_name

    WHERE condition

)

SELECT \*

FROM cte\_name;

在这个例子中，cte_name 是 CTE 的名称，SELECT column1, column2 FROM table_name WHERE condition 是定义 CTE 的查询，它会生成一个临时结果集，在后续的主查询 SELECT * FROM cte_name 中可以像使用普通表一样使用这个 CTE。

CTE 具有诸多显著优势：

提高查询可读性：当查询逻辑复杂时，使用 CTE 可以将复杂的查询分解为多个简单的部分，每个 CTE 专注于一个特定的计算或数据筛选，使整个查询结构更加清晰，易于理解和维护。例如，在一个涉及多表连接和复杂条件筛选的查询中，将每个表的连接和条件筛选分别放在不同的 CTE 中，能够让开发者快速定位和理解每个部分的功能。

方便代码模块化：CTE 允许将常用的查询逻辑封装起来，在同一查询中多次引用，避免了重复编写相同的查询代码，提高了代码的复用性。比如，在一个复杂的销售数据分析查询中，需要多次计算每个产品的总销售额，就可以将计算总销售额的逻辑封装在一个 CTE 中，然后在其他需要的地方直接引用该 CTE。

支持递归查询：CTE 特别适合处理递归查询，如在处理树形结构数据时，通过递归 CTE 可以轻松地实现对层级数据的遍历和分析，这在构建组织架构图、产品类别层级展示等场景中非常实用。

3.2 多 CTE 联用与复杂查询优化

为了更深入地理解 CTE 在复杂查询中的应用，我们以电商销售数据分析为例。假设我们有一个 sales 表，包含以下字段：sale_id（销售记录 ID）、product_id（产品 ID）、region（销售地区）、sale_amount（销售金额）和 sale_date（销售日期）。

现在我们需要进行一项复杂的分析：计算每个产品在各地区的销售额占该产品总销售额的比例，以及每个地区的销售额占总销售额的比例。

首先，我们可以使用多个 CTE 分别计算不同维度的数据：

\-- 计算每个产品的总销售额

WITH product\_total\_sales AS (

    SELECT product\_id, SUM(sale\_amount) AS total\_sales\_per\_product

    FROM sales

    GROUP BY product\_id

),

\-- 计算每个地区的总销售额

region\_total\_sales AS (

    SELECT region, SUM(sale\_amount) AS total\_sales\_per\_region

    FROM sales

    GROUP BY region

),

\-- 计算总销售额

total\_sales AS (

    SELECT SUM(sale\_amount) AS overall\_total\_sales

    FROM sales

)

\-- 最终查询，计算各项比例

SELECT 

    s.product\_id,

    s.region,

    s.sale\_amount,

    pts.total\_sales\_per\_product,

    s.sale\_amount / pts.total\_sales\_per\_product \* 100 AS product\_sales\_percentage,

    rts.total\_sales\_per\_region,

    s.sale\_amount / rts.total\_sales\_per\_region \* 100 AS region\_sales\_percentage,

    ts.overall\_total\_sales,

    s.sale\_amount / ts.overall\_total\_sales \* 100 AS overall\_sales\_percentage

FROM 

    sales s

JOIN 

    product\_total\_sales pts ON s.product\_id = pts.product\_id

JOIN 

    region\_total\_sales rts ON s.region = rts.region

JOIN 

    total\_sales ts;

在这个查询中：

product_total_sales CTE 计算了每个产品的总销售额。

region_total_sales CTE 计算了每个地区的总销售额。

total_sales CTE 计算了总的销售额。

最后的主查询通过 JOIN 操作将这些 CTE 的结果组合起来，计算出每个产品在各地区的销售额占该产品总销售额的比例（product_sales_percentage），每个地区的销售额占总销售额的比例（region_sales_percentage），以及每个销售记录的销售额占总销售额的比例（overall_sales_percentage）。

通过这种方式，使用多个 CTE 分别处理不同的计算逻辑，使得整个查询结构清晰，易于理解和维护。如果不使用 CTE，将所有的计算逻辑都放在一个复杂的查询中，代码的可读性和可维护性将大大降低，而且容易出错。

四、子查询与派生表：查询中的 “隐藏武器”

4.1 子查询的类型与应用场景

子查询是 SQL 中一种强大的查询方式，它允许在一个查询中嵌套另一个查询，将子查询的结果作为主查询的条件或数据来源。根据子查询返回结果的形式，可分为标量子查询、列子查询、行子查询和表子查询，它们各自在不同的业务场景中发挥着关键作用。

标量子查询：返回单个值（一行一列），通常用于需要一个确定值作为条件的场景。例如，在员工表 employees 中，查询工资高于平均工资的员工信息。假设员工表包含员工 ID employee_id、姓名 employee_name 和工资 salary 字段。

SELECT employee\_id, employee\_name, salary

FROM employees

WHERE salary > (SELECT AVG(salary) FROM employees);

在这个查询中，(SELECT AVG(salary) FROM employees) 是标量子查询，它返回整个员工表的平均工资，主查询通过这个平均工资筛选出工资高于平均水平的员工。

列子查询：返回一列数据（多行一列），常用于需要在一组值中进行筛选的场景，常与 IN、NOT IN、ANY、ALL 等操作符配合使用。例如，在订单表 orders 和客户表 customers 中，查询购买过特定商品（假设商品 ID 为 100）的客户信息。订单表包含订单 ID order_id、客户 ID customer_id 和商品 ID product_id 字段，客户表包含客户 ID customer_id 和客户姓名 customer_name 字段。

SELECT customer\_id, customer\_name

FROM customers

WHERE customer\_id IN (SELECT customer\_id FROM orders WHERE product\_id = 100);

这里，(SELECT customer_id FROM orders WHERE product_id = 100) 是列子查询，它返回购买过商品 ID 为 100 的所有客户 ID，主查询通过 IN 操作符筛选出这些客户的详细信息。

行子查询：返回一行数据（一行多列），用于需要同时比较多个列值的场景。例如，在员工表中，查询员工编号最小且工资最高的员工信息。

SELECT \*

FROM employees

WHERE (employee\_id, salary) = (SELECT MIN(employee\_id), MAX(salary) FROM employees);

在这个例子中，(SELECT MIN(employee_id), MAX(salary) FROM employees) 是行子查询，它返回员工编号最小且工资最高的那一行数据的列值，主查询通过比较 (employee_id, salary) 与子查询返回的行值来筛选出对应的员工。

表子查询：返回多行多列数据，相当于一个临时表，通常用于需要对复杂结果集进行进一步处理的场景，常放在 FROM 子句中。例如，在销售表 sales 中，先筛选出销售额大于 1000 的记录，再统计每个销售人员的销售总额。销售表包含销售 ID sale_id、销售人员 ID salesperson_id 和销售额 amount 字段。

SELECT salesperson\_id, SUM(amount) AS total\_amount

FROM (SELECT \* FROM sales WHERE amount > 1000) AS temp\_sales

GROUP BY salesperson\_id;

这里，(SELECT * FROM sales WHERE amount > 1000) 是表子查询，它返回销售额大于 1000 的所有记录，作为一个临时表 temp_sales，主查询再对这个临时表进行分组统计，计算每个销售人员的销售总额。

4.2 派生表的使用与性能考量

派生表，也称为临时中间表，是子查询在 FROM 子句中的一种应用形式。它通过将子查询的结果作为一个临时表来使用，使得查询结构更加清晰，并且在一些复杂查询中能够提高可读性和可维护性。

以统计各部门平均薪资并筛选出平均薪资较高的部门为例，假设我们有员工表 employees，包含员工 ID employee_id、部门 ID department_id 和薪资 salary 字段。

SELECT department\_id, AVG(salary) AS avg\_salary

FROM (SELECT \* FROM employees) AS derived\_table

GROUP BY department\_id

HAVING AVG(salary) > (SELECT AVG(salary) FROM employees);

在这个查询中，(SELECT * FROM employees) AS derived_table 就是派生表，它将整个员工表作为一个临时表 derived_table，主查询先对这个临时表按部门进行分组，计算每个部门的平均薪资，然后通过 HAVING 子句筛选出平均薪资高于全体员工平均薪资的部门。

然而，使用派生表时需要注意性能问题。虽然派生表能够简化查询逻辑，但如果子查询返回的数据量较大，会增加内存消耗和查询执行时间。因为数据库需要先计算子查询的结果集，并将其存储在临时空间中，然后再对这个临时表进行后续操作。为了优化性能，可以考虑以下几点：

合理使用索引：确保在子查询和主查询涉及的列上创建合适的索引，这样可以加快数据的检索速度，减少数据扫描的范围。例如，在上述例子中，如果在 department_id 和 salary 列上创建索引，能够显著提高分组和计算平均薪资的效率。

减少子查询数据量：尽量在子查询中添加必要的筛选条件，减少返回的数据行数。例如，如果只需要统计某一年入职员工的部门平均薪资，那么在子查询中可以添加入职时间的筛选条件，避免不必要的数据处理。

分析查询执行计划：使用数据库提供的工具（如 MySQL 的 EXPLAIN 语句）来分析查询执行计划，了解派生表的使用对性能的影响，从而针对性地进行优化。通过执行计划，可以查看查询的执行顺序、是否使用了索引、数据扫描方式等信息，帮助发现性能瓶颈。

五、集合操作：合并与比较结果集

5.1 UNION、UNION ALL 的区别与应用

在 SQL 中，UNION 和 UNION ALL 是用于合并两个或多个结果集的操作符，它们在数据处理和分析中起着重要作用，但在使用时存在一些关键的区别。

UNION 操作符用于将多个查询的结果集合并为一个结果集，并且会自动去除重复的行。其语法结构如下：

SELECT column1, column2,...

FROM table1

UNION

SELECT column1, column2,...

FROM table2;

UNION ALL 同样用于合并多个结果集，但它不会去除重复行，而是直接将所有结果集按顺序拼接在一起。语法结构为：

SELECT column1, column2,...

FROM table1

UNION ALL

SELECT column1, column2,...

FROM table2;

为了更直观地理解这两个操作符的区别，我们通过一个具体的案例来演示。假设我们有两个表：customers（客户表）和 suppliers（供应商表），它们都包含 name（名称）和 contact_number（联系电话）字段。我们希望将客户和供应商的信息合并在一起，用于一份综合的联系人列表。

\-- 使用UNION合并客户和供应商信息

SELECT name, contact\_number

FROM customers

UNION

SELECT name, contact\_number

FROM suppliers;

\-- 使用UNION ALL合并客户和供应商信息

SELECT name, contact\_number

FROM customers

UNION ALL

SELECT name, contact\_number

FROM suppliers;

在这个例子中，如果 customers 表和 suppliers 表中存在名称和联系电话完全相同的记录，使用 UNION 时，这些重复记录只会在结果集中出现一次；而使用 UNION ALL 时，这些重复记录会全部保留。

在实际应用中，选择 UNION 还是 UNION ALL 主要取决于业务需求和数据特点。如果需要确保结果集中没有重复数据，并且对数据的唯一性有严格要求，那么 UNION 是更好的选择；如果更关注数据的完整性，包括重复数据，或者确定结果集中不会出现重复数据，为了提高查询效率（因为 UNION ALL 不需要进行去重操作，性能相对更高），可以使用 UNION ALL。

5.2 INTERSECT 与 EXCEPT：交集与差集运算

除了合并结果集，SQL 还提供了 INTERSECT 和 EXCEPT 操作符，用于对两个结果集进行交集和差集运算，这在数据对比和分析中非常有用。

INTERSECT 操作符用于获取两个结果集的交集，即返回同时存在于两个结果集中的行。其语法如下：

SELECT column1, column2,...

FROM table1

INTERSECT

SELECT column1, column2,...

FROM table2;

EXCEPT 操作符（在某些数据库中也称为 MINUS）用于获取两个结果集的差集，即返回存在于第一个结果集但不存在于第二个结果集的行。语法结构为：

SELECT column1, column2,...

FROM table1

EXCEPT

SELECT column1, column2,...

FROM table2;

假设我们有一个 products 表，记录了不同时间段的产品销售数据，包含 product_id（产品 ID）、product_name（产品名称）和 sale_date（销售日期）字段。现在我们想要找出在两个不同时间段都有销售的产品（交集），以及在第一个时间段销售但在第二个时间段未销售的产品（差集）。

\-- 找出两个时间段都有销售的产品（交集）

SELECT product\_id, product\_name

FROM products

WHERE sale\_date BETWEEN '2023-01-01' AND '2023-03-31'

INTERSECT

SELECT product\_id, product\_name

FROM products

WHERE sale\_date BETWEEN '2023-04-01' AND '2023-06-30';

\-- 找出在第一个时间段销售但在第二个时间段未销售的产品（差集）

SELECT product\_id, product\_name

FROM products

WHERE sale\_date BETWEEN '2023-01-01' AND '2023-03-31'

EXCEPT

SELECT product\_id, product\_name

FROM products

WHERE sale\_date BETWEEN '2023-04-01' AND '2023-06-30';

在上述例子中，第一个查询使用 INTERSECT 操作符，找出了在两个时间段都有销售的产品，这些产品同时满足两个时间段的销售条件；第二个查询使用 EXCEPT 操作符，筛选出了仅在第一个时间段销售而在第二个时间段未销售的产品，通过对比两个时间段的销售数据，得到了差异部分。

通过 INTERSECT 和 EXCEPT 操作符，我们能够快速地对不同数据集进行比较和分析，挖掘出数据之间的关联和差异，为业务决策提供有价值的信息，在处理复杂的数据问题时展现出强大的功能和高效性。

六、性能优化：让查询飞起来

在大数据时代，数据量呈爆发式增长，数据库查询性能成为了关键问题。一条高效的查询语句能够快速获取所需信息，为业务决策提供及时支持；而性能低下的查询则可能导致系统响应迟缓，甚至影响整个业务的正常运转。因此，掌握 SQL 查询性能优化的技巧至关重要。下面将从索引的创建与优化、避免全表扫描的技巧以及分页查询的优化策略等方面深入探讨，帮助大家提升查询效率，让数据查询如飞一般顺畅。

6.1 索引的创建与优化

索引是数据库中用于提高查询效率的数据结构，它就像是书籍的目录，通过建立索引，数据库可以快速定位到所需数据，而无需扫描整个表，从而大大提高查询速度。例如，在一个拥有千万条记录的员工表中查询某个员工的信息，若没有索引，数据库可能需要逐行扫描这千万条记录，这将耗费大量时间；而有了索引，数据库可以直接根据索引快速定位到该员工的记录，查询时间将大幅缩短。

常见的索引类型包括 B - Tree 索引、Hash 索引等，它们各有特点和适用场景。

B - Tree 索引：是最常见的索引类型，它通过平衡二叉树结构来组织数据，能够在 O (log n) 时间复杂度内完成数据查找。B - Tree 索引适用于大多数查询场景，包括精确查找、范围查找和排序操作。例如，在员工表中，如果经常需要根据员工 ID 查询员工信息，或者查询某个薪资范围内的员工，就可以在员工 ID 和薪资列上创建 B - Tree 索引，以提高查询效率。

Hash 索引：通过哈希函数将键值映射到表中的位置，查询速度非常快，适用于等值查询。比如，在一个存储用户登录信息的表中，经常需要根据用户名查询用户密码，由于用户名是唯一的，使用 Hash 索引可以快速定位到对应的用户记录。然而，Hash 索引不适合范围查询和排序操作，因为哈希函数的特性使得数据在索引中的存储是无序的。

下面通过一个具体案例来展示如何创建和使用索引提高查询效率。假设我们有一个 employees 员工表，包含以下字段：employee_id（员工 ID）、employee_name（员工姓名）、department_id（部门 ID）、salary（薪资）。

\-- 创建表

CREATE TABLE employees (

    employee\_id INT PRIMARY KEY,

    employee\_name VARCHAR(100),

    department\_id INT,

    salary DECIMAL(10, 2)

);

\-- 插入测试数据（假设插入了大量数据）

INSERT INTO employees (employee\_id, employee\_name, department\_id, salary)

VALUES

(1, '张三', 1, 5000.00),

(2, '李四', 2, 6000.00),

(3, '王五', 1, 5500.00),

\-- 此处省略更多数据插入语句

;

现在我们要查询部门 ID 为 1 的所有员工信息，如果没有索引，查询语句如下：

SELECT \* FROM employees WHERE department\_id = 1;

这条查询语句在数据量较大时可能会执行得很慢，因为它需要扫描整个 employees 表。为了提高查询效率，我们可以在 department_id 列上创建索引：

CREATE INDEX idx\_department\_id ON employees (department\_id);

创建索引后，再执行相同的查询语句，数据库会利用索引快速定位到 department_id 为 1 的记录，查询效率将显著提高。

6.2 避免全表扫描的技巧

全表扫描是指数据库在执行查询时，没有利用索引，而是逐行扫描整个表以查找符合条件的记录。这种情况通常会在表数据量较大时导致明显的性能下降，因为它需要读取并处理表中的每一行数据，产生大量的 I/O 操作，消耗较多的物理读资源，可能导致严重的争抢和延迟。

全表扫描产生的原因主要有以下几点：

缺乏索引：当查询条件没有相关的索引时，MySQL 只能遍历整个表。例如：SELECT * FROM employees WHERE age = 30;，如果 age 字段没有索引，数据库就会对整个 employees 表进行全表扫描。

使用了不适合的索引：如果查询条件使用了不合适的索引，可能也会导致全表扫描。例如：SELECT * FROM employees WHERE last_name = 'Smith' AND department_id = 5;，如果 department_id 有索引，但 last_name 没有索引，且 department_id 的基数较低，MySQL 可能选择全表扫描而不是使用 department_id 索引。

使用了不支持索引的函数：当在查询条件中使用了不支持索引的函数时，也会导致全表扫描。例如：SELECT * FROM employees WHERE YEAR(hire_date) = 2020;，在这个例子中，YEAR 函数无法利用索引，使得整个表都被扫描。

使用了模糊查询：模糊查询通常会导致全表扫描。例如：SELECT * FROM employees WHERE last_name LIKE '%ith';，上述查询无法使用索引，因为 LIKE 操作符的前面有一个通配符，导致全表扫描。

为了避免全表扫描，我们可以采取以下措施：

创建合理的索引：对于常用的查询条件，确保相关字段有索引。例如，在员工表中，如果经常根据员工姓名查询员工信息，就可以在 employee_name 列上创建索引：CREATE INDEX idx_employee_name ON employees (employee_name);。

优化 SQL 查询语句：尽量避免在 WHERE 子句中使用函数或模糊查询。例如，将 SELECT * FROM employees WHERE YEAR(hire_date) = 2020; 改为 SELECT * FROM employees WHERE hire_date >= '2020 - 01 - 01' AND hire_date < '2021 - 01 - 01';，这样可以利用 hire_date 列上的索引；对于模糊查询，尽量使用右匹配（如 LIKE 'ith%'），而避免左匹配（如 LIKE '%ith'）或全匹配（如 LIKE '%ith%'），因为右匹配可以使用索引，而左匹配和全匹配无法使用索引。

避免在索引列上进行计算或函数操作：在索引列上进行计算或函数操作会导致索引失效，从而引发全表扫描。例如，SELECT * FROM employees WHERE salary * 1.1 > 5000; 应改为 SELECT * FROM employees WHERE salary > 5000 / 1.1;。

合理使用 OR 条件：如果 OR 条件中的字段没有索引，或者其中一个字段有索引但另一个字段没有索引，可能会导致全表扫描。尽量使用 UNION 或 UNION ALL 替代 OR 条件。例如，SELECT * FROM employees WHERE id = 1 OR id = 2; 可以改为 SELECT * FROM employees WHERE id = 1 UNION ALL SELECT * FROM employees WHERE id = 2;。

6.3 分页查询的优化策略

分页查询在数据库应用中非常常见，例如在网站的列表页面展示数据时，需要将大量数据分成多页显示。在 SQL 中，通常使用 LIMIT 和 OFFSET 来实现分页查询，其基本语法为：SELECT * FROM table_name LIMIT offset, limit;，其中 offset 表示偏移量，即从第几行开始返回数据，limit 表示返回的行数。

例如，要查询员工表中第 11 到 20 条记录（假设每页显示 10 条记录），可以使用以下查询语句：

SELECT \* FROM employees LIMIT 10, 10;

然而，当数据量较大且偏移量很大时，这种简单的分页方法会出现性能问题。例如，SELECT * FROM employees LIMIT 100000, 10;，数据库需要先跳过前面的 100000 条记录，然后再返回 10 条记录，这会导致查询效率低下，因为它需要扫描大量的数据行，增加了 I/O 和 CPU 的消耗。

针对大偏移量分页查询效率低的问题，可以采用以下优化策略：

利用索引：如果表中有自增的主键或其他唯一索引，可以利用索引来提高分页效率。例如，假设 employee_id 是自增主键，我们可以通过以下方式优化分页查询：

SELECT \* FROM employees

WHERE employee\_id > (SELECT employee\_id FROM employees LIMIT 100000, 1)

LIMIT 10;

这条语句先通过子查询获取第 100001 条记录的 employee_id，然后在主查询中通过 WHERE employee_id > 条件直接定位到大于该 employee_id 的记录，再返回 10 条记录，避免了大量数据的扫描。

使用子查询和连接：可以通过子查询和连接的方式来优化分页。例如：

SELECT e.\*

FROM employees e

JOIN (SELECT employee\_id FROM employees LIMIT 100000, 10) AS sub

ON e.employee\_id = sub.employee\_id;

这里先通过子查询获取第 100001 到 100010 条记录的 employee_id，然后在主查询中通过 JOIN 操作将主表和子查询结果进行连接，获取对应的员工记录，减少了扫描的数据量。

基于书签的分页：对于一些支持书签（Bookmark）概念的数据库，可以使用书签来实现高效分页。书签是一种能够标识数据位置的标记，通过记录上一页最后一条记录的书签，在下一页查询时可以直接从书签位置开始获取数据，而无需跳过大量记录。这种方法在数据量非常大且需要频繁分页的场景下非常有效。

七、总结与展望

在大数据领域的浩瀚星空中，SQL 作为数据处理的核心语言，其高级技巧宛如璀璨的星辰，照亮了我们高效处理数据的道路。通过深入学习和实践窗口函数、递归查询、公共表表达式、子查询与派生表、集合操作以及性能优化等一系列高级技巧，我们不仅能够在复杂的数据迷宫中精准定位所需信息，还能大幅提升数据处理的效率和质量。

窗口函数让我们能够以全新的视角对数据进行分析和计算，在保留每一行数据细节的同时，实现各种复杂的统计和排名操作；递归查询则为我们打开了深入探索树形结构数据的大门，无论是组织架构的梳理，还是产品类别层级的展示，都能轻松应对；公共表表达式和子查询为我们提供了强大的查询逻辑封装和数据筛选能力，使复杂的查询变得清晰易读、灵活高效；集合操作则帮助我们在不同的结果集之间进行合并、比较和分析，挖掘出数据之间的潜在关系；而性能优化技巧更是让我们的查询如虎添翼，在数据量不断增长的情况下，依然能够保持高效运行。

这些高级 SQL 技巧在提升查询效率和数据处理能力方面的作用是毋庸置疑的。它们不仅能够帮助我们节省大量的时间和计算资源，还能为业务决策提供更加及时、准确的数据支持。在实际工作中，无论是电商行业的销售数据分析、金融领域的风险评估，还是医疗行业的病例研究，这些技巧都有着广泛的应用场景，能够帮助我们解决各种复杂的数据处理难题。

然而，SQL 的世界博大精深，这只是冰山一角。随着技术的不断发展和数据量的持续增长，新的挑战和机遇也在不断涌现。例如，在大数据分布式存储和计算环境下，如何进一步优化 SQL 查询性能，使其能够更好地适应海量数据的处理需求；如何结合人工智能和机器学习技术，实现更加智能化的数据查询和分析等。这些都是值得我们深入探索和研究的方向。

因此，我鼓励每一位读者，在日常工作中不断实践和运用这些高级 SQL 技巧，将其融入到实际的数据处理项目中。同时，也要保持学习的热情和好奇心，持续关注 SQL 技术的发展动态，不断探索新的技巧和方法。相信通过不断的努力和实践，我们都能够成为 SQL 数据处理的高手，在大数据的浪潮中乘风破浪，为企业和社会创造更大的价值。

你可能感兴趣的:(大数据修炼手册之SQL篇,sql)

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
程翔授《评价一篇记叙文》行吟斯基
桂林十一中高一2中学生自读程老师学生文章板书课题师巡看。看完举手。问：它是记叙文。不商量。独立打分。学生评价打分。师：高低都正常，不受干扰。师巡，略评。打完举手。调查：分层次举手——高分先举手。最低分。最高95分。最低45分。女：差距太大！师：同一篇，相差55分。若是你的文章，愿落谁手？男：身临其境感觉。师：你有此经历？没也没关系。女：不优美……，结尾无升华……无感悟……师：辞藻不美？(师追问)男
自律打卡第四天：比昨天进步一点点花儿的念想
今天新闻我们县城又确诊了一例，截止目前已经确诊的三例了，打开，看了一篇简友写的武汉的真实情况，有病住不了院，还没等到床位已经去世的消息，心里更加的难受，武汉尚且这样，如果是我们这没有高速没有火车的十八线的小县城发生这种情况，那情况将是更加的不堪设想，不敢想，唯有祈求灾难早点快去，平安才是最大的福气。突然觉得我的自律打卡，比昨天进步一点点。更希望疫情战争每一天都要比昨天好一点，希望一觉醒来听到的是好
25-1-2019 树藤与海岛呢
hello八月来报道了今天看到了一篇文章就只想记下那两句话：良田千顷不过一日三餐广夏万间只睡卧榻三尺大概的意思就是要珍惜当下不要等来不及的时候才珍惜分享今天的两餐最近没有时间运动呢下个月补回好了说完了哈哈goodnight图片发自App图片发自App
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
别再讲道理啦，对方听不进去的方所
我之前写过一篇叫做《你总妄想改变他人》，然后就有朋友跟我说，有一些方法可以改变他人之类的。嗯，是这样，但是任何具体的问题，都要限定好语境，描述清楚前提条件，然后再表达观点，我的这位朋友的说法就犯了一刀切的错误，这样并不能让讨论正常展开（这篇我得先给她看看，不然可能会挨揍）。好了，hhhh，谁让她不能写文章呢，我就来再说一说吧。我前面说过，我们在学到一个道理、学会一种方法之后，总是迫不及待地想要去与
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
恩小希美食成长日记之118：“摘星女神”王亚平归来，她的婚姻，治愈了多少职场女性的痛恩小希
上周最为热闹的消息,无疑是神舟13号的三位航天英雄回来了.其中,最为瞩目的就是王亚平.她是我国首位进行太空行走的女航天员,也是为自己小女儿“摘星星的妈妈”。作为最受关注的职场妈妈，王亚平之所以能够成就这样一番事业，跟背后默默支持她的丈夫--赵鹏分不开。01王亚平1980年出生于山东烟台。父母都是地地道道的农民。王亚平这个姑娘从小体质好，一直练习长跑。高中时，空军来家乡招收女飞行员，作为体育班里唯一
2019-07-30 西域社群
天地之间，分外热闹。望热浪涛涛，引无数帅哥竞开撩，夕窈窕淑女皆露腰。一代天骄，群里热闹。不见美女露妖娆，唯见帅哥手机忙，唐诗宋词，广为流传，惜字如金，声情并茂。君悉吾析，今日之局有套路，昨日之生惹人恋。聚往矣，数风流人物还看今朝！！
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
免费排版助手：智能修正段落 + 删除干扰符，杂乱文本一键变规范
各位文字工作者们！你们有没有被排版折磨到崩溃的时候？我跟你们说，我之前排版一篇文章，那简直就像在走迷宫，头晕眼花的！不过后来我发现了一款软件——排版助手！软件下载地址安装包这玩意儿是个文章智能排版工具，专门给新闻编辑、文摘网站这些文字工作者用的。它功能老多了，能修正段落，把那些乱七八糟的段落变得规规矩矩；还能删除干扰符，就像给文章做了个大扫除，把没用的东西都清理掉；简繁转换也不在话下，不管是简体还
【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
小白买保险科普篇-意外险手牵手走
意外险顾名思义，就是️对因意外导致的损失进行经济补偿的保险产品。我们看保险产品一定要看包含的责任。意外险通常包含：意外身故理赔金，额度10万-几百万不等。意外残疾理赔金，额度10万-几百万不等。意外医疗理赔金，额度通常在1-5万之间。这里的意外到底包含哪些意外事件，不能一概而论。综合意外险，我们重点看免责条款里的除外责任。比如：酒驾、违法不属于赔偿范围。这类产品小朋友和老人家往往有专属产品。年轻人
人物系列首篇｜总会有人陪你走一段路诗小蛮5786400
主题纲要：1.总会有人陪你走一段路2.不打扰也是一种幸福3.留在身边的，哪怕瞎逼逼一番也是珍贵一、总会有人陪你走一段路在综艺《向往的生活》，任嘉伦曾问过这样一个问题：“你们有没有过那样一种朋友：你们小时候关系很好，但因为你事业越来越好；他觉得你们之间的距离越来越远，然后他就自己疏远你的那种。”何炅说：我们要接受这是常态，我们每个人都有在乎的、喜欢的人，但我从来没有奢望，要把谁留在身边一辈子，因为这
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
营销活动-大转盘無缺520
写在前面最近，首先营销活动工具这块我是再熟悉不过了。曾经做了不下20个活动工具，然后通过监控活动数据反推活动的好坏。文中主要讲解幸运大转盘营销工具一.大转盘定义大转盘是比较常见的营销活动工具，它是通过消费者用户控制【开始/停止】操作获得奖品物品。用户在不知道自己能获得什么奖品的条件下，然后通过抽奖，大概率的获得未知的奖品。类似最近流行的盲盒玩法。二.为什么做大转盘大转盘是最常用的抽奖类的活动工具之
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
STM32入门之TIM基本定时器嵌入式白话 STM32入门学习 stm32 嵌入式硬件单片机
一、定时器简介定时器是嵌入式系统中的关键外设之一，它可以用于生成精确的延时、周期性中断、PWM波形生成等功能。在STM32F1系列单片机中，定时器不仅能为系统提供精确的时钟，还支持外部事件的捕获以及信号输出。对于定时器的功能，我们可以通过一个生活中非常常见的例子来形象地描述：微波炉的定时器。想象你正在使用微波炉加热食物。在微波炉里，定时器的作用就是帮助你控制食物加热的时间。当你设置了加热时间后，定
我最喜欢的公众号素颜创始人小云
一年多前，也是因为工作的原因。认识了她，她是我七个人物法其一，她在我心里也是很敬佩的一个女孩子。她会讲一些护肤知识，哪些产品好用哪些不好用而他讲解的产品都是我跃跃欲试的。图片发自App她做的每一篇文章都很精美，可以吸引到我从头看到尾，看每一个字都会很珍惜很期待，做事也特别的认真仔细。去年出了一本《活得漂亮》我也看了她的创业故事，很厉害！她的认真及敬业精神我觉得是很难学得来的，现在怀孕3个月了，依然
收集落叶申文秀
走啊，一起走，我们一起去收集落叶落叶的模样早已映入我的眼帘耳边已响起叶子落在地上的“沙沙”声走啊，去收集落叶，落叶是我们的回忆落叶的样子如此俏皮心形是写给秋姑娘的情书圆形是秋姑娘送给大地的礼物三角形是秋姑娘礼服上的碎珠片哟！秋姑娘举行的盛装宴会开始了你看！秋之宴会开始了松叶缓缓飘落在空中跳起了华尔兹枫叶跳着芭蕾兜着圈子盘旋而下银杏叶是杂技演员，正“七上八下”地翻跟头每个落叶都在宴会上展示自己最美妙
婴童医话（五百六十）妙手柯楠
探天地清浊之源，察阴阳顺逆之机。“乳食过饱蓄胃中，乳片不化吐频频，身热面黄腹膨胀。”伤乳吐者，因乳食过饱，停蓄胃中，以致运化不及，吐多乳片，犹如物盛满而上溢也。其证身热面黄，肚腹膨胀。治宜化其宿乳，安胃和中，节其乳食，自然止也。“过食伤胃腹胀热，恶食口臭吐酸粘，眼胞虚浮身潮热。”伤食吐者，因小儿饮食无节，过食油腻、面食等物，以致壅塞中脘而成也，其证肚腹胀热，恶食口臭，频吐酸粘，眼胞虚浮，身体潮热。
提升在直返APP中的等级：解锁更多特权与收益的秘诀古楼
在直返APP的世界里，每个用户都渴望提升自己的等级，以解锁更多特权与收益。那么，如何提升在直返APP中的等级呢？接下来，我们将为您揭示这一秘密。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。高省是公认的返利最高的软件。古楼导师高省邀请
【阳光️️☀️苑长幸福365】7月9日《就此刻确知》阳光苑长
音频文字原创|阳光苑长图片发自App一夜的梦境，情景相当的壮烈，那是前前后后多个情节的叠加，那是因为极其在意在正义的，完满的，在早已经确认——万古之先已经确认了一切美好的事物当中。当有假象，当有一些不好的势力，试图想去破坏夺取的时候，在梦境中一直得力的征战，为着身边最挚爱的朋友，为他，为所有美好的事业而守望。守望，英文叫做watcher，就是观望者。图片发自App在这个毫不奇怪，事实上一直发生的征
漫步，跳出藩篱张巧金沙
最近的教学，倍感不爽。一为这国庆之假，把这课上得支离破碎的。放假前，上了四天课，但我却只上了三天，9月30日，我工作室在搞活动，全天的活动，课当然未能上。10月8日学生回校，上了两天课，学生又放回家了。就觉得学生刚有点状态，又回去逍遥去了。感觉吧，教学内容也不敢大胆甩开膀子去教学，所以呀，这教学内容还真上不走，而且学生学下来效果特差。这不，国庆放假前的一个周，测试了两次，均为第一单元，是自考试以来
用好考评指挥棒答好时代新答卷天才码字选手
民之所望，施政所向。而群众评议正是检验发展质量和人民获得感的试金石。究竟是“走过场”、“栽盆景”，还是俯下身子，甘当为民服务的“孺子牛”或撸起袖子，做担当作为的“拓荒牛”，群众自是看得清清楚楚，最有发言权。因而也有这样一句话：干部脚下沾多少泥土，群众心里就有多少感情。民意不可或缺，群众的意见不能少。新时代下，要最大程度发挥群众评议在激励干部担当作为中的效能，才能汇聚起推动高质量发展的磅礴之力，答好
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR