晚夜微雨问海棠呀

Doris数据导入方式与Broker Load操作指南

Apache Doris作为新一代MPP分析型数据库，提供了六种高效的数据导入方式，每种方式针对不同的数据源、数据规模和实时性需求，形成了完整的数据集成解决方案。Broker Load作为其中最常用的异步批量导入方式，特别适合从HDFS、S3等远程存储系统导入TB级大数据量，具有高吞吐、易管理、支持多种文件格式等优势。本文将全面解析Doris支持的数据导入方式，并详细介绍Broker Load的完整操作流程。

一、Doris支持的数据导入方式

Apache Doris根据数据源类型和导入场景，提供了六种主要数据导入方式，各具特色，满足不同规模和实时性需求的数据集成场景：

Broker Load是异步批量导入方式，支持从HDFS、S3等远程存储系统读取数据。其优势在于高吞吐量和易管理性，特别适合数据量在几十到百GB级别的场景。用户通过MySQL协议提交导入任务，系统会异步执行并可通过SHOWLOAD命令查看导入状态。Broker Load内置支持HDFS和S3存储系统，对于其他存储系统则需要部署相应的Broker进程。

Stream Load是一种同步或异步的导入方式，通过HTTP协议推送数据。它适合快速导入本地文件或数据流，响应速度快，支持CSV、JSON等格式。Stream Load特别适合数据量在1GB到10GB之间的场景，默认最大导入文件大小为10GB。当数据量超过10GB时，需要调整BE的配置参数streaming_load_max_mb。

Insert是单条或小批量数据插入方式，支持JDBC，适用于低频次、低并发的场景。对于极少量数据（5分钟一次），可使用JDBC INSERT写入数据。当并发较高或写入频次较高（大于20并发或1分钟写入多次）时，建议开启Group Commit功能以提高性能。

Multi Load是多任务并行导入方式，支持同时提交多个导入作业，提升批量导入效率。Multi Load可以保证多个导入作业的原子生效，即要么全部成功，要么全部失败，适用于需要同时导入多张表的场景。

Routine Load是实时流式导入方式，用户通过MySQL协议提交例行导入作业，生成一个常驻线程，不间断地从数据源（如Kafka）中读取数据并导入到Doris中。这种方式特别适合高吞吐实时场景，如从Kafka消费流式数据并实时写入Doris进行分析。

Spark Load是通过Spark并行处理外部数据（如HDFS/对象存储）后导入Doris的方式，适合大规模分布式数据集的高效导入。它利用Spark的并行计算能力预处理数据，然后将结果写入Doris，特别适合数据量极大且需要复杂数据转换的场景。

导入方式	支持数据源	适用场景	支持格式	吞吐量	实时性
Broker Load	HDFS、S3等远程存储	批量导入，数据量在几十到百GB	CSV、Parquet、ORC	高	异步
Stream Load	本地文件或数据流	快速导入，数据量在1GB到10GB	CSV、JSON	中高	同步/异步
Insert	Doris内部表	小批量或单条数据插入	CSV	低	实时
Multi Load	多个数据源	多任务并行导入	CSV、Parquet、ORC等	高	异步
Routine Load	Kafka等流式数据源	实时流式数据持续导入	CSV、JSON	高	实时
Spark Load	HDFS/对象存储	大规模分布式数据集导入	CSV、Parquet、ORC等	极高	异步

二、Broker Load的语法结构

Broker Load的SQL语法结构清晰，包含多个关键部分，用户需根据数据源和导入需求进行相应配置：

基本语法结构如下所示：

LOAD LABEL [database.]label_name
(
    data_desc1,
    [data_desc2, ...]
)
WITH [BROKER broker_name | HDFS | S3]
(
    "key1" = "value1",
    [ "key2" = "value2", ... ]
)
PROPERTIES
(
    "timeout" = "14400",
    [ "max_filter_ratio" = "0.0",
      "exec_mem_limit" = "2147483648",
      ... ]
);

其中，Label是导入任务的唯一标识，在同一个数据库内必须唯一。用户可以通过这个Label查看导入任务的执行情况，也可以取消导入任务。Label的另一个重要作用是防止用户重复导入相同的数据，实现At-Most-Once语义。

data_desc部分用于描述一组需要导入的文件，语法如下：

[MERGE|APPEND|DELETE] DATA INFILE ("file_path1"[, "file_path2", ...])
[NEGATIVE] INTO TABLE `table_name`
[PARTITION (p1, p2, ...)]
[COLUMNS TERMINATED BY "columnSeparator"]
[(column_list)]
[FORMAT AS "file_type"]
[COMPRESS_TYPE AS "compress_type"]
[COLUMNS FROM PATH AS (c1, c2, ...)]
[SET (column_mapping)]
[PRECEDING FILTER predicate]
[WHERE predicate]
[DELETE ON expr]
[ORDER BY source_sequence]
[PROPERTIES ("key1"="value1", ...)]

在data_desc中，可以指定多种参数：

数据合并类型：MERGE、APPEND或DELETE，默认为APPEND。MERGE和DELETE仅适用于Unique Key模型表，其中MERGE需要配合DELETE ON使用，以标注Delete Flag列。
文件路径：通过DATA INFILE指定需要导入的文件路径，可以是多个文件，也可以使用通配符匹配多个文件。
表名和分区：通过INTO TABLE指定目标表，可选PARTITION参数指定导入的分区。
列分隔符：通过COLUMNS TERMINATED BY指定文件中的列分隔符，如CSV文件通常使用逗号作为分隔符。
文件格式：通过FORMAT AS指定文件格式，支持CSV、Parquet和ORC格式。
字段映射：通过SET子句进行字段顺序调整或数据转换，支持strftime、time_format等函数。
路径提取：通过COLUMNS FROM PATH AS从文件路径中提取分区字段，如Hive分区表的分区值。
数据过滤：通过PRECEDING FILTER在数据转换前过滤原始数据，或通过WHERE在转换后过滤数据。

Broker认证参数部分用于指定访问远程存储系统的凭证，如HDFS的username和password，或S3的AWSaccess_key和AWSsecret_key。这部分参数根据不同的存储系统有所区别。

PROPERTIES参数部分用于指定导入作业的特殊配置，包括超时时间、错误率容忍度、内存限制等。这些参数可以控制导入过程的行为和性能。

三、Broker Load的配置要求

要成功使用Broker Load导入数据，需要满足以下配置要求：

权限配置是首要条件。用户需要对目标表具有INSERT权限，可以通过以下SQL语句授权：

GRANT INSERT ON TABLE [database.]table_name TO [user];

对于公有云环境（如阿里云EMR StarRocks集群），Broker服务通常已经自动搭建并启动，位于每个Core节点上。用户可以通过以下命令查看Broker实例：

SHOW PROC "/brokers"\G

Broker进程配置是另一个关键点。Doris内置了对HDFS和S3两个Broker的支持，对于其他存储系统则需要部署相应的Broker进程。Broker是一个独立的无状态进程，封装了文件系统接口，为Doris提供读取远端存储系统中文件的能力。

存储格式支持方面，Broker Load支持CSV、Parquet和ORC格式，但不支持JSON格式。对于CSV文件，可以指定列分隔符和行分隔符；对于Parquet和ORC文件，则需要确保文件中的列名与Doris表中的列名保持一致，或通过SET子句进行映射。

系统参数配置会影响导入性能。FE配置文件中有多个参数可以调整Broker Load的行为：

max_bytes_per_broker_scanner：每个BE处理的数据量上限，默认为3GB。单次导入的最大数据量约为max_bytes_per_broker_scanner * BE节点数。
min_bytes_per_broker_scanner：每个BE处理的数据量下限，默认为64MB。
max_broker_concurrency：一个作业的最大并发数，默认为10。
stream_load_default_timeout_second：导入任务的默认超时时间，默认为14400秒（4小时）。

导入任务的并发数由以下公式计算得出：

本次导入并发数 = Math.min(源文件大小/min_bytes_per_broker_scanner，max_broker_concurrency，当前BE节点个数 * load_parallelism)

导入作业参数是用户在提交Broker Load时可以指定的配置，包括：

timeout：导入任务的超时时间，默认为14400秒（4小时）。范围是1秒到259200秒（3天）。
max_filter_ratio：最大容忍可过滤的数据比例，默认为0.0（零容忍）。取值范围为0到1。
exec_mem_limit：导入内存限制，默认为2GB。单位为字节。
strict_mode：是否对数据进行严格限制，默认为false。
load_parallelism：每个BE上并发instance数量的上限，默认为8。
send_batch_parallelism：sink节点发送数据的并发度，默认为1。
load_to_single_tablet：是否每个分区只导入一个tablet，默认为false。
trim_double quotes：是否裁剪字段最外层的双引号，默认为false。
skip_lines：跳过CSV文件的前几行，默认为0。
time_zone：本次导入所使用的时区，默认为"Asia/Shanghai"。

对于不同的存储系统，需要配置相应的Broker参数：

HDFS：需要配置fs.defaultFS（HDFS地址）和hadoop.username（访问HDFS的用户名）。
S3：需要配置AWSaccess_key、AWSsecret_key、AWSregion和AWSendpoint等参数。

四、Broker Load的操作流程

使用Broker Load导入数据需要遵循以下操作流程：

步骤1：准备数据

首先需要确保源数据存储在Broker可以访问的远程存储系统中，如HDFS或S3。数据文件可以是CSV、Parquet或ORC格式。对于CSV文件，需要确保列分隔符和行分隔符正确；对于Parquet和ORC文件，则需要确保文件中的列名与Doris表中的列名保持一致，或准备好字段映射关系。

# 示例：准备HDFS上的CSV数据
hdfs dfs -put data.csv /user/hive/warehouse/doris_load/

# 示例：准备S3上的Parquet数据
aws s3 cp data.parquet s3://doris-bucket/data/

步骤2：创建Doris表

在Doris中创建目标表，表结构需要与源数据匹配。根据业务需求选择合适的存储模型（如DUPLICATE KEY、UNIQUE KEY或AGGREGATE KEY），并指定分布方式和分桶数量。

-- 示例：创建Doris表
CREATE TABLE doris_load_table
(
    id BIGINT NOT NULL COMMENT "用户ID",
    name VARCHAR(20) COMMENT "用户名",
    age INT COMMENT "年龄",
    dt STRING COMMENT "日期"
)
DuPLICATE KEY(id)
Distributed BY Hash(id)
Buckets 10
Properties ("replication_allocation" = "tag.location.default: 3");

步骤3：提交Broker Load导入任务

通过MySQL客户端执行LOAD命令，提交Broker Load导入任务。根据数据源类型和文件格式，配置相应的Broker参数和PROPERTIES参数。

-- 示例：从HDFS导入CSV文件
LOAD LABEL doris_load_label
(
    DATA INFILE("hdfs://172.0.0.1:8020/user/hive/warehouse/doris_load/data.csv")
    INTO TABLE doris_load_table
    COLUMNS TERMINATED BY "," (id, name, age)
    COLUMNS FROM PATH AS (dt)
    WHERE dt = "2025-05-23"
)
WITH HDFS
(
    "fs.defaultFS" = "hdfs://172.0.0.1:8020",
    "hadoop.username" = "hdfs"
)
PROPERTIES
(
    "timeout" = "3600",
    "max_filter_ratio" = "0.1",
    "exec_mem_limit" = "4294967296"
);

-- 示例：从S3导入Parquet文件
LOAD LABEL doris_load_label
(
    DATA INFILE("s3://doris-bucket/data/data.parquet")
    INTO TABLE doris_load_table
    FORMAT AS "parquet"
    (id, name, age)
    COLUMNS FROM PATH AS (dt)
    WHERE dt = "2025-05-23"
)
WITH S3
(
    "AWSaccess_key" = "your-access-key",
    "AWSsecret_key" = "your-secret-key",
    "AWSregion" = "us-west-2",
    "AWSendpoint" = "s3.us-west-2.amazonaws.com"
)
PROPERTIES
(
    "timeout" = "3600",
    "max_filter_ratio" = "0.1",
    "exec_mem_limit" = "4294967296"
);

步骤4：监控导入任务

提交导入任务后，可以通过SHOWLOAD命令查看导入任务的执行状态和进度。可以指定Label或数据库来过滤查看特定任务。

-- 查看所有导入任务
SHOW LOAD;

-- 查看指定数据库的导入任务
SHOW LOAD FROM doris_load_db;

-- 查看指定Label的导入任务
SHOW LOAD WHERE LABEL="doris_load_label";

监控结果将显示任务状态（PENDING、LOADING、CANCELLED、FINISHED）、进度、ETL信息、错误信息等。如果任务状态为CANCELLED，可以根据错误信息进行调整后重新提交。

步骤5：处理导入错误

如果导入任务失败，需要根据错误信息进行排查和处理。常见的错误包括：

权限问题：确保用户具有INSERT权限，Broker进程具有访问远程存储系统的权限。
文件路径问题：确保文件路径正确，通配符匹配到文件而非目录。
列名不匹配：对于Parquet和ORC文件，如果列名不匹配，需要使用SET子句进行映射。
数据格式问题：确保数据格式正确，CSV文件的分隔符正确，数据类型匹配。
文件过大：如果导入文件超过单BE处理上限（默认3GB），需要调整max_bytes_per_broker_scanner参数。

步骤6：取消导入任务

当导入任务未完成且需要取消时，可以使用CANCELLOAD命令。取消时需要指定待取消导入任务的Label。

-- 取消指定数据库的导入任务
CANCELLOAD FROM doris_load_db WHERE LABEL="doris_load_label";

五、Broker Load的高级功能

Broker Load不仅支持基本的数据导入，还提供多种高级功能，满足复杂的数据集成需求：

多表导入是Broker Load的一个重要特性，允许用户在一次导入任务中向多张表导入数据。每个单独的data_desc可以指定属于该表的数据源地址。Broker Load保证了单次导入的多张表之间原子性成功或失败，这对于需要保持数据一致性的场景非常有用。

数据取反导入（negative）功能主要用于当数据表中聚合列的类型都为SUM类型时，撤销某一批导入的数据。通过negative参数导入同一批数据，Doris会自动为这一批数据在聚合列上数据取反，达到消除同一批数据的效果。这在数据纠错场景中非常实用。

部分列更新功能允许用户在导入过程中只更新表中的部分列，而不是全部字段值。这在实时动态列更新场景中非常有用，例如用户标签表中需要实时更新某些字段值，而不影响其他字段。

数据过滤与转换是Broker Load的另一个重要功能。用户可以通过PRECEDING FILTER在数据转换前过滤原始数据，或通过WHERE在转换后过滤数据。此外，还可以通过SET子句进行字段映射和类型转换，支持多种函数如strftime、time_format等。

分区处理功能允许用户通过文件路径动态指定分区。例如，对于Hive分区表，可以通过COLUMNS FROM PATH AS从文件路径中提取分区字段。这在处理分区表时非常方便，可以自动将数据导入到对应的分区中。

数据合并类型（MERGE、APPEND、DELETE）功能允许用户根据需求选择不同的数据合并方式。默认为APPEND，表示普通的追加写操作。MERGE和DELETE仅适用于Unique Key模型表，其中MERGE需要配合DELETE ON使用，以标注Delete Flag列，而DELETE表示本次导入的所有数据皆为删除数据。这在需要进行数据更新或删除的场景中非常有用。

六、Broker Load的性能优化

要充分发挥Broker Load的性能优势，需要进行以下优化：

文件大小与数量优化：Broker Load建议的数据文件大小在几十到百GB级别。文件数量不宜过多，也不宜过少。如果文件数量过多且单个文件较小，可以考虑合并文件；如果文件数量过少且单个文件较大，可以考虑拆分文件。最佳实践是将文件数量调整为BE节点数的倍数，单个文件大小在几十GB级别。

并发度优化：Broker Load的并发度由源文件大小、min_bytes_per_broker_scanner、max_broker_concurrency和当前BE节点数共同决定。要提高导入性能，可以适当增加并发度，但需要注意不要超过系统的处理能力。

内存配置优化：通过调整PROPERTIES中的exec_mem_limit参数，可以控制导入过程的内存使用。对于大文件或复杂数据转换，可以适当增加内存限制，但需要根据系统资源合理设置。

网络带宽优化：Broker Load依赖于网络传输数据，因此需要确保Broker进程与BE节点之间的网络带宽充足。在高吞吐场景中，可以考虑使用多线程或分片导入来提高网络利用率。

数据压缩优化：对于大数据文件，可以考虑使用压缩格式（如GZIP）来减少传输和存储开销。Broker Load支持通过COMPRESS_TYPE参数指定压缩类型。

并行导入优化：对于多个数据源或多个表的导入，可以考虑使用Multi Load进行并行导入，提高整体效率。

七、Broker Load的典型应用场景

Broker Load在多种数据集成场景中表现出色：

数据迁移场景是Broker Load最常见的应用场景。当需要将数据从HDFS、OSS等存储系统迁移到Doris时，Broker Load提供了高效、可靠的解决方案。例如，将Hive表中的数据迁移到Doris进行分析，可以使用Broker Load一次性完成大量数据的导入。

定时批量导入场景中，Broker Load也表现出色。例如，每天凌晨将前一天的数据从数据仓库导入到Doris进行分析。由于Broker Load是异步的，可以在后台执行，不影响其他操作。

多表原子导入场景中，Broker Load的多表导入功能非常有用。例如，需要同时导入订单表和订单明细表，并且确保两者要么都成功，要么都失败。Broker Load可以保证这种原子性，避免数据不一致。

大数据文件导入场景中，Broker Load的高吞吐特性使其成为理想选择。例如，导入单个大小超过10GB的Parquet文件，Broker Load可以高效处理，而Stream Load则可能因为默认限制而失败。

分区表动态导入场景中，Broker Load的COLUMNS FROM PATH AS功能非常实用。例如，导入Hive分区表时，可以从文件路径中提取分区字段，自动将数据导入到对应的分区中。

数据纠错场景中，Broker Load的negative功能可以撤销之前导入的错误数据。例如，如果某一批数据导入后发现有问题，可以通过negative参数重新导入同一批数据，Doris会自动将之前的错误数据撤销。

八、Broker Load与其他导入方式的对比

Broker Load与其他导入方式相比，有其独特的优势和适用场景：

与Stream Load对比：Stream Load通过HTTP协议推送数据，适合快速导入本地文件或数据流，响应速度快。而Broker Load通过Broker进程读取远程存储系统中的数据，适合批量导入大数据量。在数据量方面，Stream Load适合1GB到10GB的数据量，而Broker Load适合几十到百GB的数据量。在实时性方面，Stream Load可以同步返回结果，而Broker Load是异步的，需要通过SHOWLOAD查看结果。

与Insert对比：Insert用于单条或小批量数据插入，支持JDBC，适用于低频次、低并发的场景。而Broker Load适合批量导入大数据量。在性能方面，Broker Load明显优于Insert，特别是在处理大量数据时。

与Multi Load对比：Multi Load支持同时提交多个导入作业，但本质上还是多个Broker Load或Stream Load的组合。Multi Load的优势在于可以保证多个导入作业的原子生效，这对于需要同时导入多张表的场景非常有用。

与Routine Load对比：Routine Load是实时流式导入方式，适合高吞吐实时场景。而Broker Load是批量导入方式，适合非实时场景。在数据来源方面，Routine Load通常从Kafka等流式数据源导入，而Broker Load从HDFS、S3等存储系统导入。

与Spark Load对比：Spark Load通过Spark并行处理外部数据后导入Doris，适合大规模分布式数据集。Spark Load的优势在于可以利用Spark的并行计算能力进行复杂的数据预处理，而Broker Load主要专注于高效地读取和导入数据。

在实际应用中，选择哪种导入方式取决于数据规模、实时性和数据来源等因素。对于大数据量、非实时场景且数据存储在HDFS、S3等远程存储系统中，Broker Load是最佳选择；对于小数据量、实时场景，Stream Load或Insert更合适；对于需要同时导入多张表且保证原子性的场景，Multi Load更合适；对于流式数据源，Routine Load更合适；对于需要复杂数据预处理的场景，Spark Load更合适。

九、Broker Load的常见问题与解决方案

在使用Broker Load过程中，可能会遇到以下常见问题：

文件路径问题：如果文件路径不正确，或者通配符没有匹配到文件，导入任务会失败。解决方案是确保文件路径正确，通配符能够匹配到实际文件。

列名不匹配问题：对于Parquet和ORC文件，如果文件中的列名与Doris表中的列名不一致，导入会失败。解决方案是使用SET子句进行字段映射，或者修改文件列名使其与Doris表一致。

文件过大问题：如果导入的文件超过单BE处理上限（默认3GB），导入任务会失败。解决方案是调整FE配置中的max_bytes_per_broker_scanner参数，或者将大文件拆分为多个较小文件。

认证失败问题：如果Broker进程无法访问远程存储系统，导入任务会失败。解决方案是检查Broker进程的认证配置是否正确，如HDFS的username和password，或S3的AK/SK。

数据类型不匹配问题：如果源数据与Doris表的列类型不匹配，导入会失败。解决方案是使用SET子句进行类型转换，或者修改数据使其类型匹配。

网络问题：如果Broker进程与BE节点之间的网络连接不稳定，导入任务可能会失败。解决方案是检查网络配置，确保网络带宽充足且连接稳定。

权限问题：如果用户没有INSERT权限，或者Broker进程没有访问远程存储系统的权限，导入任务会失败。解决方案是通过GRANT INSERT ON TABLE授权用户，或者配置Broker进程的访问权限。

错误率超过阈值问题：如果导入的数据中错误率超过max_filter_ratio参数设置的值，导入任务会失败。解决方案是检查数据质量，修正错误数据，或者适当调整max_filter_ratio参数。

超时问题：如果导入任务在timeout参数设置的时间内未完成，任务会被取消。解决方案是检查导入任务的进度和状态，优化数据文件大小和数量，或者适当调整timeout参数。

数据重复问题：如果导入的数据中包含重复数据，可能会影响分析结果。解决方案是使用Doris的主键模型（如Unique Key）进行去重，或者在导入前对数据进行去重处理。

十、Broker Load的最佳实践

基于实际应用经验，以下是Broker Load的最佳实践：

合理调整文件大小：将数据文件大小控制在几十GB级别，避免过小或过大的文件。如果文件数量过多且单个文件较小，可以考虑合并文件；如果文件数量过少且单个文件较大，可以考虑拆分文件。

优化并发度配置：根据数据量、BE节点数和系统资源，合理设置max_bytes_per_broker_scanner和max_broker_concurrency参数，以获得最佳导入性能。

使用合适的文件格式：根据数据特性和导入需求，选择CSV、Parquet或ORC格式。Parquet和ORC作为列式存储格式，通常比CSV格式具有更高的压缩率和更快的读取速度。

配置适当的错误容忍度：根据数据质量，合理设置max_filter_ratio参数，避免因少量错误数据导致整个导入任务失败。对于高质量数据，可以设置较低的错误容忍度；对于可能包含一些错误数据的场景，可以适当提高错误容忍度。

使用合适的内存限制：根据数据复杂度和转换需求，合理设置exec_mem_limit参数。对于简单数据，可以使用默认值；对于复杂数据或需要大量计算的场景，可以适当增加内存限制。

定期清理已完成任务：导入任务完成后，可以通过DROPLOAD命令删除已完成的任务，释放系统资源。命令如下：

DROPLOAD [IF EXISTS] [database.]label_name;

监控导入性能：通过SHOWLOAD命令查看导入任务的进度和状态，了解导入性能。可以关注Progress、EtlInfo和TaskInfo等字段，了解导入的详细情况。

使用分区表：对于需要按时间或其他维度查询的数据，建议使用分区表。Broker Load支持通过文件路径动态指定分区，可以自动将数据导入到对应的分区中。

使用严格模式：对于需要严格保证数据质量的场景，可以开启strict_mode参数。开启后，系统会过滤掉类型转换错误的数据，确保导入的数据质量。

使用部分列更新：对于只需要更新表中部分列的场景，可以使用部分列更新功能。这在实时动态列更新场景中非常有用，可以避免全字段更新带来的性能开销。

使用数据转换函数：Broker Load支持在导入过程中使用多种函数进行数据转换，如strftime、time_format等。合理使用这些函数可以在导入过程中完成部分数据预处理，减少后续计算开销。

十一、总结与展望

Apache Doris提供了丰富多样的数据导入方式，每种方式都有其独特的优势和适用场景。Broker Load作为其中最常用的异步批量导入方式，特别适合从HDFS、S3等远程存储系统导入TB级大数据量，具有高吞吐、易管理、支持多种文件格式等优势。

随着大数据技术的发展和应用场景的扩展，Doris的数据导入功能也在不断完善和优化。未来，我们可以期待更多增强功能，如更高效的文件处理算法、更丰富的数据转换函数、更好的错误处理机制等。同时，Doris与其他大数据组件的集成也将更加紧密，为用户提供更便捷的数据集成解决方案。

在实际应用中，选择合适的导入方式并正确配置参数，是确保数据高效、可靠导入的关键。对于大数据量、非实时场景且数据存储在HDFS、S3等远程存储系统中，Broker Load是理想选择；而对于小数据量、实时场景，Stream Load或Insert更合适。无论选择哪种导入方式，都需要根据实际需求和系统资源进行合理配置和优化，以获得最佳的导入性能和数据质量。

你可能感兴趣的:(大数据,sql)

在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
Spark SQL架构及高级用法 Aurora_NeAr spark sql 架构
SparkSQL架构概述架构核心组件API层（用户接口）输入方式：SQL查询；DataFrame/DatasetAPI。统一性：所有接口最终转换为逻辑计划树（LogicalPlan），进入优化流程。编译器层（Catalyst优化器）核心引擎：基于规则的优化器（Rule-BasedOptimizer,RBO）与成本优化器（Cost-BasedOptimizer,CBO）。处理流程：阶段输入输出关键动
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac os 10.9 mysql_MAC OSX 10.9 apache php mysql 环境配置 AY05 mac os 10.9 mysql
＃终端内运行sudoapachectlstart#启动Apachesudoapachectlrestart#重启Apachesudoapachectlstop#停止Apache＃配置Apachesudovi/private/etc/apache2/httpd.conf#将里面的这一行去掉前面的##LoadModulephp5_modulelibexec/apache2/libphp5.so＃配置P
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
Ubuntu24安装MariaDB/MySQL后不知道root密码如何解决
Ubuntu24.04安装MariaDB后root密码未知？解决方案在此在Ubuntu24.04上新安装MariaDB后，许多用户会发现自己不知道root用户的密码，甚至在安装过程中也没有提示设置密码。这是因为在较新的MariaDB版本中，默认情况下root用户采用了unix_socket身份验证插件。这意味着您可以使用操作系统的root用户权限直接登录MariaDB，而无需输入密码。本文将为您详
mysql创建线程处理链接请求斜不靠谱
mysqld通过RUN_HOOK(server_state,before_handle_connection,(NULL));调用/**Threadhandlerforaconnection@paramargConnectionobject(Channel_info)Thisfunction(normally)doesthefollowing:-Initializethread//初始化线程-In
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
Java朴实无华按天计划从入门到实战（强化速战版-66天）岫珩 Java 后端 java 开发语言学习 Java 时间安排学习计划
致敬读者感谢阅读笑口常开生日快乐⬛早点睡觉博主相关博主信息博客首页专栏推荐活动信息文章目录Java朴实无华按天计划从入门到实战（强化速战版-66天）1.基础（18）1.1JavaSE核心（5天）1.2数据库与SQL（5天）1.3前端基础（8天）2.进阶（17天）2.1JavaWeb核心（5天）2.2Mybatis与Spring全家桶（6天）2.3中间件入门（4天）2.4实践项目（2天）3.高阶（1
Navicat练习与实操（第九节课内容总结见下篇）咩? android 前端 sql
MySQL练习练习题目现在有以下四张表Student学生ID学生名字学生生日学生性别s_ids_names_births_sexCourse课程ID课程名字教师IDc_idc_namet_idTeacher教师ID教师名字t_idt_nameScore学生ID课程ID学生分数s_idc_ids_score1.对以上表格分别建表(要求：id为各个表的主键、其他字段非空设置默认值为、给表以及表中字段设
小白学习mysql 阿什么名字不会重复呢 mysql 数据库大数据人工智能
推荐自学网站不用下载本地环境带自测头歌https://www.educoder.net✅适合基础小白的MySQL简单实用学习计划总学习时间建议：10~14天，每天1小时左右即可最终目标：掌握基础SQL操作，能完成简单项目需求第1阶段：认识数据库与环境搭建（1~2天）你需要学会：•数据库是什么？SQL是什么？•安装MySQLServer+Navicat（推荐用Navicat可视化工具）✅推荐学习内容
MySql基础：事务无敌摆烂仔 mysql 数据库
1.事务的简介1.1什么是事务事务就是一组DML语句组成，这些语句在逻辑上存在相关性，这一组DML语句要么全部成功，要么全部失败，是一个整体。MySQL提供一种机制，保证我们达到这样的效果。事务还规定不同的客户端看到的数据是不相同的。事务就是要做的或所做的事情，主要用于处理操作量大，复杂度高的数据。假设一种场景：你毕业了，学校的教务系统后台MySQL中，不在需要你的数据，要删除你的所有信息(一般不
MYSQL：MySQL 事务隔离级别详解奋斗的狍子007 MySQL核心知识点 mysql 数据库 java spring 架构 spring boot ide
一、MySQL事务是什么？ MySQL事务是一组在数据库中执行的操作，这些操作要么全部成功执行，要么全部不执行，以确保数据库的完整性和一致性。事务的ACID 事务具有四个特征：原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持续性（Durability）。这四个特性简称为ACID特性。原子性：事务是数据库的逻辑工作单位，事务中包含的各操作要么都做，
分布式事务Seata的4种模式详解「已注销」分布式 wpf
Seata是一个开源的分布式事务解决方案，它在微服务架构下提供了高性能和简单易用的分布式事务服务。Seata的设计基于AT、TCC、Saga和XA事务模式，以满足不同场景下的分布式事务处理需求，今天的内容针对Seata来详细介绍一下。1、四种事务模式介绍1.AT模式：这是一种无侵入的分布式事务解决方案。用户只需关注自己的业务SQL，Seata框架会自动生成事务的二阶段提交和回滚操作。在一阶段，Se
java知识点分享篇（一）微笑的小小刀
java分享篇一大家好，我是小小刀，我们又见面啦，本文是一个新的系列->java分享系列，现在有三个系列，java学习系列：一篇系统的讲一个知识点，java故事系列：散文随笔，有知识点也有生活。本篇是java分享系列第一篇：收集大家在学习交流群中的分享，并做简单的发散进学习交流群可加小刀微信：best396975802公众号:java技术大本营sql分页（小小刀）原分享sqlserver中的分页语
Ubuntu lamp 会飞的灰大狼 linux ubuntu
Ubuntulamp前言在Ubuntu安装lamp架构我们了解到lamp是完整的架构我们前面了解到了集合了Linux系统apacheMySQL和PHP语言的完整架构我们前面说了Centos7中编译安装lamp那么我们去说一下在Ubuntu中安装‍‍安装apache2‍apt直接安装apache2apt-yinstallapache2‍启动apache2systemctlstartapache2#测
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方