IvanCodes

六、Sqoop 导出

作者：IvanCodes
日期：2025年6月7日
专栏：Sqoop教程

Apache Sqoop 不仅擅长从关系型数据库 (RDBMS) 向 Hadoop (HDFS, Hive, HBase) 导入数据，同样也强大地支持反向操作——将存储在 Hadoop 中的数据导出 (Export) 回关系型数据库。这在数据分析结果回写、数据仓库ETL、业务系统数据填充等场景中非常有用。

一、Sqoop 导出基础

核心目标：将HDFS上的文件数据 (通常是文本文件，如CSV、TSV) 解析并插入或更新到目标RDBMS的表中。
关键组件：Sqoop Export 会启动MapReduce作业 (或在Sqoop 2中可能是其他执行引擎) 来并行读取HDFS上的数据，并将其转换为SQL语句 (INSERT或UPDATE) 在目标数据库上执行。

通用导出参数：

sqoop export: Sqoop导出的主命令。
--connect : 目标RDBMS的JDBC连接字符串。
--username : 数据库用户名。
--password : 数据库密码 (生产环境建议使用密码文件或credential provider)。
--table : 目标RDBMS中的表名。
--export-dir : 包含源数据的HDFS目录路径。目录下的文件应为文本格式，且字段与目标表列对应。
--input-fields-terminated-by : HDFS文件中字段间的分隔符，默认为逗号 ,。
--input-lines-terminated-by : HDFS文件中行间的分隔符，默认为换行符 \n。
--columns : (可选) 指定HDFS文件中哪些列以及它们的顺序要导出到目标表的对应列。如果不指定，Sqoop会假设HDFS文件的列顺序和数量与目标表完全匹配。
--m 或 --num-mappers : 指定并行导出的Map任务数量。

二、默认导出模式 (INSERT 模式)

行为：
默认情况下，Sqoop Export 会将HDFS中的每一行数据都尝试作为一条新的记录 INSERT 到目标数据库表中。
如果目标表有主键或唯一约束，并且HDFS中的数据导致了重复键，则该条记录的INSERT操作会失败 (具体行为取决于数据库，可能抛出错误并中止该Map任务的部分批次，或整个作业失败)。

适用场景：

目标表是空的。
确定HDFS中的数据在目标表中不存在重复主键。
目标表允许重复记录 (如果没有主键或唯一约束)。

一般结构：

sqoop export \
--connect jdbc:mysql://db_host:3306/db_name \
--username db_user --password db_password \
--table target_table \
--export-dir /user/hadoop/hdfs_data_dir \
[--input-fields-terminated-by '\t'] \
[--columns "col_a,col_b,col_c"] \
--m 4

代码案例：
假设HDFS目录 /user/data/new_employees 下有如下CSV文件内容 (假设字段分隔符为 ,)：
part-m-00000:

101,Alice,HR,60000
102,Bob,Engineering,75000

目标MySQL表 employees_target (emp_id INT PRIMARY KEY, name VARCHAR(50), department VARCHAR(50), salary INT)。

导出命令：

sqoop export \
--connect jdbc:mysql://mysql.example.com:3306/companydb \
--username export_user --password 'p@$$wOrd' \
--table employees_target \
--export-dir /user/data/new_employees \
--input-fields-terminated-by ',' \
--m 1

这会将HDFS中的两条记录作为新行插入到 employees_target 表中。

三、更新导出模式 (--update-key 与 --update-mode)

当HDFS中的数据可能包含目标数据库表中已存在的记录，并且你希望更新这些记录而不是简单插入 (或因主键冲突而失败) 时，需要使用更新导出模式。

关键参数：

--update-key : 必需。指定一个或多个用逗号分隔的列名，这些列构成了目标表的主键或唯一键，Sqoop将使用这些列来匹配HDFS记录与数据库表中的现有行。
--update-mode : 必需。定义当找到匹配记录时的行为。主要有两种模式：
- updateonly (默认，如果指定了 --update-key 但未指定 --update-mode)
- allowinsert

3.1 更新导出：updateonly 模式

行为：

Sqoop会读取HDFS中的每一行数据。
对于每一行，它会使用 --update-key 指定的列的值去目标数据库表中查找匹配的记录。
- 如果找到匹配记录：则更新 (UPDATE) 该数据库记录，使用HDFS行中其他列的值。
- 如果未找到匹配记录：则忽略该HDFS行，不会进行插入操作。

适用场景：

你只想更新数据库中已存在的记录，不希望HDFS中额外的数据被插入到数据库中。

一般结构：

sqoop export \
--connect <jdbc-uri> \
--username <user> --password <pass> \
--table <table-name> \
--export-dir <hdfs-path> \
--update-key <primary-key-column> \
--update-mode updateonly \
[--columns "col_to_update1,col_to_update2,primary_key_column"] \
--m <num-mappers>

重要：如果使用了 --columns，确保 --update-key 指定的列也包含在 --columns 列表中，并且顺序正确，以便Sqoop能正确解析出用于匹配的键值。

代码案例：
HDFS目录 /user/data/employee_updates 内容 (字段分隔符 ,，顺序: emp_id, new_salary, new_department)：
part-m-00000:

101,65000,Sales
103,80000,Engineering

目标MySQL表 employees_target 中已有记录：

(101, 'Alice', 'HR', 60000)
(102, 'Bob', 'Engineering', 75000)

导出命令 (updateonly)：

sqoop export \
--connect jdbc:mysql://mysql.example.com:3306/companydb \
--username export_user --password 'p@$$wOrd' \
--table employees_target \
--export-dir /user/data/employee_updates \
--update-key emp_id \
--update-mode updateonly \
--columns "emp_id,salary,department" \
--input-fields-terminated-by ',' \
--m 1

结果：

ID为 101 的员工 Alice 的薪水更新为 65000，部门更新为 Sales。
ID为 103 的记录在数据库中不存在，所以会被忽略。
ID为 102 的员工 Bob 的信息保持不变。

3.2 更新导出：allowinsert 模式

行为：

Sqoop会读取HDFS中的每一行数据。
对于每一行，它会使用 --update-key 指定的列的值去目标数据库表中查找匹配的记录。
- 如果找到匹配记录：则更新 (UPDATE) 该数据库记录。
- 如果未找到匹配记录：则插入 (INSERT) 该HDFS行作为一条新记录到数据库表中。
  这种行为有时被称为 “Upsert” (Update or Insert)。

适用场景：

你需要同步HDFS中的数据到数据库，如果记录已存在则更新，如果不存在则插入。

一般结构：

sqoop export \
--connect <jdbc-uri> \
--username <user> --password <pass> \
--table <table-name> \
--export-dir <hdfs-path> \
--update-key <primary-key-column> \
--update-mode allowinsert \
[--columns "col1,col2,primary_key_column,col3"] \
--m <num-mappers>

代码案例：
使用与 updateonly 案例相同的HDFS数据和初始数据库状态。
导出命令 (allowinsert)：

sqoop export \
--connect jdbc:mysql://mysql.example.com:3306/companydb \
--username export_user --password 'p@$$wOrd' \
--table employees_target \
--export-dir /user/data/employee_updates \
--update-key emp_id \
--update-mode allowinsert \
--columns "emp_id,salary,department,name" \
--input-fields-terminated-by ',' \
--m 1

注意：为了演示插入，假设HDFS数据中包含 name 列，并且目标表 employees_target 有 name 列。如果HDFS数据中没有 name，而表定义中有，则插入时该列可能为 NULL 或默认值 (取决于表定义)。为简化，我们假设HDFS数据是 emp_id,salary,department,name 顺序。
HDFS /user/data/employee_updates 内容 (顺序: emp_id, salary, department, name):
part-m-00000:

101,65000,Sales,Alice_Updated
103,80000,Engineering,David_New

结果：

ID为 101 的员工 Alice 的薪水更新为 65000，部门更新为 Sales，名字更新为 Alice_Updated。
ID为 103 的记录在数据库中不存在，所以会作为新记录插入 (David_New, Engineering, 80000)。
ID为 102 的员工 Bob 的信息保持不变。

四、导出过程中的 Staging Table

为了提高导出的原子性和可靠性 (尤其是在更新模式下)，Sqoop 可以使用一个临时的暂存表 (staging table)。

工作流程：
1. Sqoop 首先将HDFS数据批量插入到一个在目标数据库中自动创建的临时暂存表。
2. 然后，Sqoop 执行一条 (或多条，取决于数据库方言) SQL语句，将暂存表中的数据与最终目标表进行合并或更新 (基于 --update-key 和 --update-mode)。
3. 成功后，删除暂存表。
启用暂存表：通过 --staging-table 参数指定暂存表名。如果不指定，Sqoop 可能不会使用暂存表 (取决于具体情况和数据库)，或者自动生成一个临时表名。
好处：如果在第二步合并/更新时发生错误，最终目标表的数据不会被部分修改，保持了一致性。

代码案例 (使用暂存表)：

sqoop export \
--connect jdbc:mysql://mysql.example.com:3306/companydb \
--username export_user --password 'p@$$wOrd' \
--table employees_target \
--export-dir /user/data/employee_updates \
--update-key emp_id \
--update-mode allowinsert \
--columns "emp_id,salary,department,name" \
--input-fields-terminated-by ',' \
--staging-table employees_staging_temp \
--clear-staging-table \
--m 1

--clear-staging-table: 确保每次运行前如果暂存表已存在则清空它。

五、重要注意事项

目标表结构：目标数据库表必须预先存在，并且其列类型应与HDFS数据能够兼容转换。
事务性：Sqoop Export 本身不提供跨多个Map任务或整个作业的端到端事务。每个Map任务会独立地向数据库提交批次。使用暂存表可以增强单个作业运行内的原子性。
性能调优：
- --batch: (已废弃，但早期版本有) 控制Sqoop批量执行SQL语句。
- --num-mappers: 并行度。需要平衡Hadoop集群资源和数据库负载能力。
- 数据库端的索引、表锁定、事务日志等都会影响导出性能。
数据类型转换：Sqoop会尝试进行HDFS文本数据到目标数据库列类型的自动转换。确保数据格式正确，否则可能导致错误。可使用 --map-column-java 或 --map-column-hive (当从Hive导出时) 指定特定列的Java或Hive类型。
空值处理：HDFS中的空值表示 (如 \N) 需要与Sqoop的 --input-null-string 和 --input-null-non-string 参数正确配置，以便正确地在数据库中插入NULL。

总结： Sqoop Export 提供了多种模式将Hadoop中的数据回写到关系型数据库。理解默认的插入模式以及基于 --update-key 的 updateonly 和 allowinsert 模式，并结合暂存表的使用，可以灵活高效地完成各种数据同步需求。

练习题 (共5道)

背景：

HDFS目录 /user/data/product_feed 包含产品信息，CSV格式，字段分隔符为逗号 (,)。文件内容示例：
part-00000:
```
P101,LaptopX,1200.00,Electronics
P102,DeskLamp,25.50,HomeGoods
P103,CoffeeMug,10.75,Kitchenware
```
字段顺序：product_sku, product_name, price, category
MySQL数据库 inventory_db 中有一个表 products_live：

CREATE TABLE products_live (
    sku VARCHAR(50) PRIMARY KEY,
    name VARCHAR(100),
    current_price DECIMAL(10,2),
    category_name VARCHAR(50),     
    stock_level INT DEFAULT 0 -- 假设此列不由Sqoop直接更新
    );

题目：

首次全量导出：假设 products_live 表是空的。写一个Sqoop命令，将 /user/data/product_feed 的所有数据导出到 products_live 表。明确指定HDFS数据的列名和顺序 (product_sku,product_name,price,category) 对应到目标表的 sku,name,current_price,category_name。
仅更新现有产品价格：HDFS目录 /user/data/price_updates 包含需要更新价格的产品信息，格式为 sku,new_price。写一个Sqoop命令，使用 updateonly 模式，根据 sku 更新 products_live 表中的 current_price。
更新或插入产品信息：HDFS目录 /user/data/daily_product_sync 包含每日的产品信息（可能有新产品，也可能有现有产品的信息变更），格式为 sku,name,price,category。写一个Sqoop命令，使用 allowinsert 模式，根据 sku 更新或插入记录到 products_live 表。
使用暂存表导出：在第3题的基础上，修改命令，使其在导出时使用一个名为 products_sync_stage 的暂存表，并在操作开始前清理该暂存表。
思考题： 如果在执行 updateonly 或 allowinsert 模式的导出时，HDFS源数据中 --update-key 指定的列的值在目标数据库表中找不到匹配，并且你没有使用 --update-mode allowinsert (即是 updateonly 模式或默认行为)，Sqoop会如何处理这条HDFS记录？

答案：

首次全量导出：

sqoop export \
--connect jdbc:mysql://your_mysql_host:3306/inventory_db \
--username your_user --password your_password \
--table products_live \
--export-dir /user/data/product_feed \
--input-fields-terminated-by ',' \
--columns "sku=product_sku,name=product_name,current_price=price,category_name=category" \
--m 1

(注意 --columns 的用法，这里使用了 target_col=source_col 的格式，更准确的应该是直接列出HDFS中的列名，Sqoop会按顺序映射。如果HDFS列名与表列名不同且顺序也可能不同，则需要预处理HDFS数据或使用更复杂的映射，但Sqoop --columns 主要用于选择和排序HDFS列。为了简单起见，通常做法是保证HDFS文件中的列顺序和名称能直接对应目标表，或仅通过--columns选择子集和重排序。)

更标准的做法是，如果HDFS文件列名和顺序与表列名和顺序一致（或你能通过--columns使其一致）：

sqoop export \
--connect jdbc:mysql://your_mysql_host:3306/inventory_db \
--username your_user --password your_password \
--table products_live \
--export-dir /user/data/product_feed \
--input-fields-terminated-by ',' \
--columns "product_sku,product_name,price,category" \
--map-column-java product_sku=String,product_name=String,price=java.math.BigDecimal,category=String \
--m 1

(这里假设Sqoop能自动按顺序将HDFS的 product_sku 映射到表的 sku，product_name到name等。如果表列名和HDFS源数据列名不一致，Sqoop Export 没有直接的 target_col=source_col 语法，通常需要在HDFS端准备好与目标表列序一致的数据，或使用 --call 调用存储过程进行更复杂的映射。)
为了简化，最常见的做法是确保HDFS文件列顺序与目标表列顺序一致，然后Sqoop会自动映射。如果只需导出部分列，则用 --columns 指定HDFS中要导出的列名。

让我们假设HDFS文件列序与目标表列序一致，且列名在HDFS中就是 sku,name,current_price,category_name:

sqoop export \
--connect jdbc:mysql://your_mysql_host:3306/inventory_db \
--username your_user --password your_password \
--table products_live \
--export-dir /user/data/product_feed \
--input-fields-terminated-by ',' \
--m 1

仅更新现有产品价格 (updateonly)：
(假设 /user/data/price_updates 文件中列顺序是 sku,current_price)

sqoop export \
--connect jdbc:mysql://your_mysql_host:3306/inventory_db \
--username your_user --password your_password \
--table products_live \
--export-dir /user/data/price_updates \
--update-key sku \
--update-mode updateonly \
--columns "sku,current_price" \
--input-fields-terminated-by ',' \
--m 1

更新或插入产品信息 (allowinsert)：
(假设 /user/data/daily_product_sync 文件中列顺序是 sku,name,current_price,category_name)

sqoop export \
--connect jdbc:mysql://your_mysql_host:3306/inventory_db \
--username your_user --password your_password \
--table products_live \
--export-dir /user/data/daily_product_sync \
--update-key sku \
--update-mode allowinsert \
--columns "sku,name,current_price,category_name" \
--input-fields-terminated-by ',' \
--m 1

使用暂存表导出 (allowinsert)：

sqoop export \
--connect jdbc:mysql://your_mysql_host:3306/inventory_db \
--username your_user --password your_password \
--table products_live \
--export-dir /user/data/daily_product_sync \
--update-key sku \
--update-mode allowinsert \
--columns "sku,name,current_price,category_name" \
--input-fields-terminated-by ',' \
--staging-table products_sync_stage \
--clear-staging-table \
--m 1

思考题答案：
如果在执行 updateonly 模式的导出时 (或者指定了 --update-key 但未明确指定 --update-mode，此时默认为 updateonly)，HDFS源数据中 --update-key 指定的列的值在目标数据库表中找不到匹配的记录，Sqoop会简单地忽略这条HDFS记录。它不会尝试插入这条记录，也不会报错 (除非有其他问题导致整个批次失败)。这条记录相当于被丢弃了，不会影响目标数据库。

你可能感兴趣的:(Sqoop教程,sqoop,hadoop,大数据)

三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
淘宝内部优惠劵领取教程，淘宝内部优惠劵软件使用方法！测评君高省
淘宝优惠券一般分为2种：第1种：是你在淘宝上买东西经常能看到的那种店铺优惠券，商家主动将一些有门槛的优惠券摆在旁边，这种券一般需要你满足消费金额或者去邀请好友才能减个几块钱。第2种：就是淘宝内部优惠券，商家为了打造爆款时会低价促销从而发放一些低价优惠券，只要下单就能立减，而且优惠的金额都非常高。但是为了控制成本并设置一定的销售目标，一旦达成预订销售额，就会停止发送优惠券。优惠劵导购平台哪个好？今天
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
Selenium基础教程 lemontree1945 selenium python 测试工具
1.Selenium环境安装1.1浏览器安装Chrome和ChromeDriver下载地址:https://googlechromelabs.github.io/chrome-for-testing/注意：驱动版本号要和浏览器版本号一致；安装后关闭浏览器自动更新:services.msc:打开系统服务找到和google相关的服务，全部修改为禁用1.2安装第三方库seleniumpipinstall
京东优惠劵在哪领取，分享京东优惠劵领取渠道使用教程氧惠全网优惠
大家好，我是氧惠遇见晴空，很多人京东优惠劵在哪领，在哪可以领取京东大额优惠劵，今天把方法分享给大家；一、京东app领券中心可以选择自己想要的类别查看，很多实用的券。还有几个整点的秒杀券，一般都是全品券之类的含金量很高的券。大家可以多多关注领券中心。如果没有时间盯着、不知道哪些券有用的话，可以加一些购物群，有好券会及时提醒领，但是我建议大家使用下面的方法更划算！二、氧惠app，（邀请码111999）
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
搭建云手机教程云博客-资源宝智能手机
搭建云手机教程本教程由分享：ziyouhua资源宝整理分享：www.httple.net首先检查自己vps是否支持这个项目sudoaptinstallcpu-checkerkvm-ok如果显示INFO:/dev/kvmexistsKVMaccelerationcanbeused表示支持，可以继续往下看ac13首先安装dockercurl-fsSLhttps://get.docker.com|sud
最新二级域名分发系统网站源码可商用 huihuixxx 程序源码小鬼授权系统源码全解密源码授权代码二级域名分发系统网站源码
介绍：1.源码楼主网上买的没有后门是旧版本2.支付接口调用的是码支付来进行的3.支付接口需要登陆管理员后台安装4.支付接口必须信息正确只能装一次5.在线充值默认的充值比例是1：1【搭建教程】1.把源码上传主机并解压2.绑定根目录和域名并解析3.访问你的域名即可提示安装4.后台登陆地址：你的域名/admin5.登陆后台安装你的支付接口（需要的话）6.码支付怎么使用方法百度一下！网盘下载地址：http
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
2025最新系统 Git 教程（七）（完结）嘿rasa 2025最新教程系列 git
第4章分布式Git4.1分布式Git-分布式工作流程你现在拥有了一个远程Git版本库，能为所有开发者共享代码提供服务，在一个本地工作流程下，你也已经熟悉了基本Git命令。你现在可以学习如何利用Git提供的一些分布式工作流程了。这一章中，你将会学习如何作为贡献者或整合者，在一个分布式协作的环境中使用Git。你会学习为一个项目成功地贡献代码，并接触一些最佳实践方式，让你和项目的维护者能轻松地完成这个过
2025最新Mybatis-plus教程（二）
三、CRUD（一）BaseMapper接口方法介绍BaseMapper中提供了crud方法，具体方法如下：//插入一条记录intinsert(Tentity);//根据entity条件，删除记录intdelete(@Param(Constants.WRAPPER)Wrapperwrapper);//删除（根据ID批量删除）intdeleteBatchIds(@Param(Constants.COL
2025最新Mybatis-plus教程（四）
五、MyBatis-Plus的service封装（一）通用Service简介MyBatis-Plus除了通用的Mapper还有通用的Service层，这也减少了相对应的代码工作量，把通用的接口提取到公共。其实按照mp的这种思想，可以自己也实现一些通用的Controller。（二）通用Service方法介绍/***插入一条记录（选择字段，策略插入）**@paramentity实体对象*/defaul
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
2025最新Mybatis-plus教程（三）
四、MyBatis-Plus条件构造器（一）条件构造器介绍在MyBatis-Plus中提了构造条件的类Wrapper，它可以根据自己的意图定义我们需要的条件。Wrapper是一个抽象类，一般情况下我们用它的子类QueryWrapper来实现自定义条件查询。（二）selectOne方法@TestpublicvoidtestSelectOne(){ QueryWrapperqueryWrapper=n
高省邀请码怎么获得?邀请码填写步骤教学! 柚子导师
今天说说：高省邀请码千万不要随便填写,不然会后悔！高省邀请码怎么获取高省邀请码多少?官方邀请码及邀请码填写教程高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码【555555这个是花桃APP的佣金比高省高出一倍】，注册送2皇冠会员，送万元推广大
实时行情接口使用教程 kk_stoper 区块链 python 开发语言后端数据结构
市场数据接口主要分为实时行情接口和延时行情接口两种。它们最根本的区别在于数据更新的频率和时效性。延时行情，顾名思义，提供的是滞后于市场真实情况的数据，通常会有10到15分钟的时间延迟。这种延迟意味着你看到的价格和交易量并不是此刻市场上的最新数据。而实时行情则能提供几乎没有延迟的、毫秒级别的最新报价和交易信息。这种瞬间性对于交易者而言至关重要，因为市场的微小变动都可能影响交易结果。因此，选择哪种接口
2025 最强 Agent 智能体学习笔记 (71) 一刀7段学习笔记人工智能
Agent智能体的系统学习与职业发展核心内容概览本集是《2025最强Agent智能体全套教程》的第72集，聚焦Agent智能体领域的系统学习方法与职业发展路径，系统梳理了从入门到专家的能力体系、关键学习资源、职业方向选择及行业发展机遇。内容结合技术趋势与职场需求，为不同背景的学习者（学生、开发者、转行人士）提供清晰的成长蓝图，帮助其在Agent智能体领域高效成长，实现职业目标。系统学习的能力体系与
Mac安装navicat17版本教程mac下载Navicat Premium for Mac v17.1.9【好用】光头才能变强 Mac软件 macos navicat
Mac安装NavicatPremiumforMacv17.1.9【亲测】安装提示“已损坏无法打开，你应该将它移到废纸篓！”肯定还有朋友走完上面流程还是不行安装包获取今天给大家分享下Mac系统安装navicat17.1.9版本，文末下载安装包！亲测好用，旧版本的还保存不了密码，这个版本很稳定！安装直接双击打开下载的安装包左侧应用拖入右侧文件夹提示“已损坏无法打开，你应该将它移到废纸篓！”别慌，接着往
ESP32-s3开发板按键中断处理详解 - 从零开始实现Boot按键功能
ESP32-s3开发板按键中断处理详解-从零开始实现Boot按键功能前言各位小伙伴们好！今天给大家带来一篇ESP32开发板上按键中断处理的干货教程。在嵌入式开发中，按键是最基础但也最常用的输入方式，掌握了按键中断的处理，你就能实现更加灵活的人机交互功能。本文将带你一步步实现ESP32开发板上Boot按键的中断检测功能，希望能对你的项目开发有所帮助！目录开发环境准备按键硬件介绍官方示例代码运行从零创
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
9、Docker Compose 实战小醉你真好 #部署不求人 docker 容器运维
DockerCompose实战教程（含完整Nginx案例+配置项详解）适合读者：开发者、后端工程师、运维工程师、初学者环境要求：CentOS9+Docker已安装教程亮点：实战驱动、配置项详解、挂载说明、可直接复制使用标签：#Docker#DockerCompose#运维实战#Nginx部署一、什么是DockerCompose？DockerCompose是Docker官方推出的多容器应用编排工具，
CentOS 7 安装最新版Docker教程朽～ docker centos
CentOS7Docker安装教程1、更新yum2、安装`yum-utils`3、通过`yum-config-manager`添加dockerrepository4、安装docker4.1、直接安装最新版本4.2、或者安装指定版本5、启动docker6、测试7、卸载dockerdocker安装官方文档：InstallDockerEngineonCentOS1、更新yumyumupdate-y2、安
Navicat Premium 17.1 的详细使用教程春云资源 mysql
下载地址：NavicatPremium17.1最新官方版|春云资源#NavicatPremium17.1功能全解析与使用教程指南在当今数字化的时代，数据库管理的高效性与便捷性成为众多企业和开发者追求的目标。NavicatPremium17.1作为一款备受瞩目的数据库管理工具，以其强大的功能和友好的用户界面脱颖而出。以下将为您详细介绍其使用方法，助力您轻松驾驭数据库管理工作。##一、下载与安装流程开
＜六＞ CentOS 8 配置YUM源超详细教程（本地源+网络源）随风fraya Docker centos 网络 linux
一、本地YUM源配置（离线环境适用）1.挂载ISO镜像创建挂载目录并执行挂载命令：sudomkdir-p/mnt/cdrom sudomount/app/CentOS-8.1.1911-x86_64-dvd1.iso/mnt/cdrom #mount后第一个参数为ISO文件路径，也可替换为/dev/sr0为光驱设备注意：若提示设备未就绪，需检查虚拟机光驱设置或ISO文件完整性13。2.配置仓库文件
Nvivo20 中文版安装包免费下载附详细安装教程|Nvivo20软件下载
[下载通道]:迅雷网盘[下载链接]:点击高速下载https://pan.xunlei.com/s/VOWJoryt_BBFsPixpPJxB1f0A1?pwd=5cei#⚠️:先用手机下载迅雷网盘保存到手机中，再用电脑登录下载，否则下载后文件容易报错❗保存的朋友点赞支持一下❗更多免费软件，影视，歌曲，游戏点这里https://docs.qq.com/sheet/DRkdWVFFCWm9UeGJP?
不会PS也不会建模，却想把敦煌鸣沙山塞进小方块里！自律的音律
掐指一算，好像很久没出特殊玩法的教程了~刚好前几天有小伙伴提问：有没有立体图表可以参考一下？由此延伸到以前发的一篇文章，里面整合了一些高质量的立体图表：我知道，PPT自带的图表你已经看腻了，是时候养养眼啦！那么问题来了，文章中的这种效果，要是只会PPT能不能做？经过@隔壁家老廖的提醒，通过关键词microworld找到了一些参考图：仔细想了想，似乎也没有很难，主要是用到了裸眼3D效果，结合切面光影
LLaMA-Factory微调教程1：LLaMA-Factory安装及使用 Cachel wood LLM和AIGC llama python 开发语言 react.js javascript 前端 microsoft
文章目录环境搭建LLaMA-Factory安装教程模型大小选择环境搭建Windows系统RTX4060Ti（16G显存）python3.10cuda=12.6cudnntorch==2.7.1+cu126torchvision==0.22.1+cu126torchaudio==2.7.1+cu126PSC:\Users\18098>nvidia-smiTueJul2201:52:192025+<
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，