宅男很神经

【Python】PyMySQL

第一章：基石之下——解密 Python 与 MySQL 的网络通信协议

在我们敲下 import pymysql 这行代码之前，一个至关重要的问题摆在面前：当 Python 程序需要与一个远在网络另一端、甚至就在本地的 MySQL 服务器对话时，它们之间究竟发生了什么？这并非魔法，而是一套严谨、高效、历经考验的二进制通信协议在起作用。理解这套协议，就如同拥有了透视眼，能看穿 PyMySQL 这类库的优雅封装，直达其工作的本质。本章的使命，就是剥去所有高级抽象的外壳，使用最原始的 Python 网络套接字（Socket）工具，手动模拟客户端与服务器的通信过程，让你从零开始，亲手构建起连接的桥梁。

1.1 万物之始：数据库客户端-服务器模型与网络套接字

在数据库的世界里，客户端-服务器（Client-Server, C/S）模型是绝对的核心架构。

服务器（Server）：通常是指运行在特定机器上的 MySQL 数据库管理系统（DBMS）。它是一个持续运行、被动等待的守护进程。它的核心职责是：
1. 管理数据：物理上存储数据文件，并提供高效的增删改查机制。
2. 维护一致性：通过事务、锁等机制保证数据的准确性和一致性。
3. 执行指令：监听来自网络的连接请求，接收并解析客户端发送的 SQL 指令。
4. 返回结果：将 SQL 指令的执行结果（数据集、成功或失败信息）打包，通过网络回传给客户端。
客户端（Client）：任何需要与数据库交互的应用程序都可以被视为客户端。我们的 Python 程序，通过 PyMySQL 库，扮演的就是这个角色。它的核心职责是：
1. 发起连接：主动向服务器的指定网络地址和端口发起连接请求。
2. 身份认证：向服务器证明自己的合法身份（提供用户名、密码等）。
3. 发送指令：将应用程序的意图（如“查询所有用户信息”）翻译成 SQL 语句，并将其打包成符合协议的格式发送给服务器。
4. 接收并解析结果：接收服务器返回的二进制数据包，并将其解析成应用程序可以理解的数据结构（如列表、字典等）。

而连接客户端与服务器的这座桥梁，就是网络套接字（Socket）。你可以将 Socket 想象成一个电话插座，它代表了网络连接的一个端点。服务器在它的 IP 地址和特定端口（MySQL 默认为 3306）上“安装”了一个监听插座，时刻准备接听电话。客户端则创建一个“拨号”插座，向服务器的地址和端口发起“呼叫”。一旦服务器“接听”，两者之间就建立了一条全双工的通信管道，数据可以在这条管道上双向流动。

PyMySQL 的所有功能，无论多么高级，其最底层的根基，都是通过 Python 的 socket 模块创建套接字，连接到 MySQL 服务器，然后在这条数据管道上，依据MySQL 客户端/服务器协议的规则，发送和接收二进制数据包。

1.2 MySQL 通信协议深度剖析：握手、认证与指令交换

客户端与服务器的每一次完整交互，都遵循着一套精确的二进制协议。这个过程主要分为两个阶段：连接阶段（握手与认证）和命令阶段（查询与响应）。

1.2.1 连接阶段：至关重要的初次“握手” (Handshake)

当客户端的 Socket 成功连接到服务器的 3306 端口时，一场精心编排的“舞蹈”——握手协议——便开始了。这个过程的目的是确认双方的“身份”、能力和通信规则。

第一步：服务器的欢迎礼 - HandshakeV10 Packet

连接建立后，服务器会立刻主动向客户端发送一个“初始握手包”（Initial Handshake Packet），最常见的版本是 HandshakeV10。这个数据包包含了服务器的大量信息，告知客户端如何进行下一步。

一个典型的 HandshakeV10 数据包的二进制结构如下（所有多字节整数均为小端序 Little-Endian）：

字段名 (Field Name)	长度 (Bytes)	描述 (Description)
协议版本 (protocol_version)	1	`0x0a` (代表版本 10)
服务器版本 (server_version)	N (C-String)	一个以 `\0` 结尾的字符串，如 “8.0.28-log”。描述了 MySQL 服务器的具体版本。
连接 ID (connection_id)	4	一个唯一的线程 ID，服务器为此次连接分配的标识。
认证插件数据 (auth_plugin_data)	8	认证“种子”数据的前 8 个字节，也称为 scramble (挑战码)。用于密码加密。
填充字节 (filler_1)	1	`0x00`，一个填充字节。
能力标志 (capability_flags)	2	服务器支持的功能标志位 (低 16 位)。客户端需要根据这些标志来决定自己能使用哪些功能。
字符集 (character_set)	1	服务器默认的字符集编码，如 `0xff` 代表 `utf8mb4`。
状态标志 (status_flags)	2	服务器当前的状态，如是否在事务中。
能力标志 (capability_flags)	2	服务器支持的功能标志位 (高 16 位)。
认证插件数据长度 (auth_plugin_data_len)	1	认证插件数据的总长度。如果为 0，则忽略。对于 `mysql_native_password` 通常是 21。
保留字节 (reserved)	10	10 个 `0x00`，保留供将来使用。
认证插件数据 (auth_plugin_data)	13	认证“种子”数据的后 13 个字节（如果 `auth_plugin_data_len` > 0）。与前面的 8 字节共同组成完整的 scramble。
认证插件名称 (auth_plugin_name)	N (C-String)	（可选）一个以 `\0` 结尾的字符串，指明服务器期望使用的认证插件，如 “mysql_native_password”。

第二步：客户端的回应 - HandshakeResponse Packet

客户端在收到并解析了服务器的 HandshakeV10 包之后，必须构造一个“握手响应包”（Handshake Response Packet）发回给服务器，以完成认证。

这个响应包的结构如下：

字段名 (Field Name)	长度 (Bytes)	描述 (Description)
客户端能力标志 (client_flag)	4	客户端自身支持并希望使用的功能标志位。必须是服务器能力的子集。
最大包大小 (max_packet_size)	4	客户端能处理的最大数据包大小。
字符集 (character_set)	1	客户端希望使用的字符集编码。
保留字节 (reserved)	23	23 个 `0x00`，保留。
用户名 (username)	N (C-String)	一个以 `\0` 结尾的字符串，表示登录的用户名。
认证响应 (auth_response)	N (LenEnc Int)	核心部分。一个长度编码的二进制串。其内容是经过加密的密码。
数据库 (database)	N (C-String)	（可选）如果客户端能力标志中设置了 `CLIENT_CONNECT_WITH_DB`，则这里包含要连接的数据库名称。
认证插件名称 (client_auth_plugin)	N (C-String)	（可选）客户端明确告知服务器它使用了哪个认证插件来生成 `auth_response`。

密码加密的奥秘 (mysql_native_password)

在 auth_response 字段中，密码并不是明文传输的，这是为了安全。对于经典的 mysql_native_password 认证插件，加密过程如下：

对原始密码进行 SHA1 哈希：hash1 = SHA1(password)
对 hash1 再进行一次 SHA1 哈希：hash2 = SHA1(hash1)
将服务器发来的 scramble (挑战码) 与 hash2 拼接，然后进行 SHA1 哈希：hash3 = SHA1(scramble + hash2)
将 hash1 与 hash3 进行异或（XOR）操作：result = hash1 XOR hash3

这个 result 就是最终要发送给服务器的 auth_response 内容。服务器端会执行同样的操作，如果计算出的结果与客户端发来的一致，则密码验证通过。这个过程确保了即使网络传输被窃听，攻击者也无法直接获得原始密码。

第三步：服务器的最终裁决 - OK_Packet 或 ERR_Packet

服务器在收到客户端的 HandshakeResponse 并完成认证后，会发送一个最终结果包。

OK_Packet: 如果一切顺利（认证通过），服务器会发送一个 OK_Packet。这表示连接已成功建立，客户端现在可以发送 SQL 命令了。
ERR_Packet: 如果出现任何问题（如用户名或密码错误、用户没有权限从该主机登录等），服务器会发送一个 ERR_Packet，其中包含了错误码和具体的错误信息。客户端需要解析这个包，并向用户报告错误。

1.3 动手实践：用 Python `socket` 模拟 MySQL 握手

理论终须实践。现在，我们将使用 Python 最基础的 socket 和 struct 库，编写一个程序来手动完成上述的整个握手过程。这将让你对协议的每一个细节都有刻骨铭心的理解。

准备工作：
确保你有一个正在运行的 MySQL 服务器，并且知道一个可以登录的用户名和密码。为了方便演示，我们假设：

服务器地址: 127.0.0.1 (localhost)
端口: 3306
用户名: root
密码: your_password (请替换成你自己的密码)

import socket # 导入 socket 模块，用于创建和管理网络连接
import struct # 导入 struct 模块，用于处理二进制数据，打包和解包
import hashlib # 导入 hashlib 模块，用于进行哈希计算，如 SHA1
import logging # 导入 logging 模块，用于记录程序运行信息

# --- 配置日志 ---
# 配置日志记录的基本设置，方便观察程序执行流程和关键信息
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- MySQL 服务器连接信息 ---
# 定义要连接的 MySQL 服务器的配置信息
MYSQL_HOST = '127.0.0.1' # MySQL 服务器的主机名或 IP 地址
MYSQL_PORT = 3306 # MySQL 服务器的端口号，默认为 3306
MYSQL_USER = 'root' # 登录 MySQL 的用户名
MYSQL_PASSWORD = 'your_password' # 登录 MySQL 的密码，请务必替换成你自己的密码

# --- MySQL 协议常量 ---
# 定义一些在 MySQL 协议中使用的常量，增加代码可读性
CLIENT_LONG_PASSWORD = 1 # 客户端能力标志：表示使用长密码认证
CLIENT_FOUND_ROWS = 2 # 客户端能力标志：表示返回找到的行数，而非受影响的行数
CLIENT_LONG_FLAG = 4 # 客户端能力标志：表示支持更长的列标志
CLIENT_CONNECT_WITH_DB = 8 # 客户端能力标志：表示连接时会指定数据库
CLIENT_PROTOCOL_41 = 512 # 客户端能力标志：表示使用协议版本4.1
CLIENT_SECURE_CONNECTION = 1 << 15 # 客户端能力标志：表示使用安全的认证握手

# --- 辅助函数：解析变长整数 (Length-Encoded Integer) ---
# MySQL 协议中常用的一种紧凑的整数表示法
def parse_length_encoded_integer(data, offset):
    """
    解析 MySQL 协议中的长度编码整数。
    :param data: 包含二进制数据的字节串。
    :param offset: 开始解析的偏移量。
    :return: (解析出的整数值, 新的偏移量)
    """
    first_byte = data[offset] # 读取第一个字节
    offset += 1 # 偏移量加 1
    if first_byte < 0xfb: # 如果第一个字节小于 251
        return first_byte, offset # 它本身就是整数的值
    elif first_byte == 0xfc: # 如果第一个字节是 251
        # 接下来的 2 个字节（小端序）代表整数值
        value, = struct.unpack(', data[offset:offset+2]) # 使用 struct 解包 2 字节无符号短整数
        return value, offset + 2 # 返回整数值和新的偏移量
    elif first_byte == 0xfd: # 如果第一个字节是 253
        # 接下来的 3 个字节（小端序）代表整数值
        low, high = struct.unpack(', data[offset:offset+2]) # 解包 2 字节和 1 字节
        return low | (high << 16), offset + 3 # 组合成 3 字节整数并返回
    elif first_byte == 0xfe: # 如果第一个字节是 254
        # 接下来的 8 个字节（小端序）代表整数值
        value, = struct.unpack(', data[offset:offset+8]) # 解包 8 字节无符号长整数
        return value, offset + 8 # 返回整数值和新的偏移量
    else: # 其他情况，表示 NULL 值或错误
        return None, offset

# --- 辅助函数：解析以 NULL 结尾的字符串 (C-Style String) ---
def parse_null_terminated_string(data, offset):
    """
    解析以 '\\0' 结尾的 C 风格字符串。
    :param data: 包含二进制数据的字节串。
    :param offset: 开始解析的偏移量。
    :return: (解析出的字符串, 新的偏移量)
    """
    null_pos = data.find(b'\0', offset) # 查找从 offset 开始的第一个 '\\0' 的位置
    if null_pos == -1: # 如果没有找到 '\\0'
        raise ValueError("在数据中未找到 NULL 结尾的字符串") # 抛出异常
    
    string_data = data[offset:null_pos] # 提取从 offset 到 '\\0' 之前的数据
    return string_data.decode('utf-8'), null_pos + 1 # 使用 utf-8 解码并返回字符串和新的偏移量

# --- 核心握手逻辑 ---
def perform_mysql_handshake():
    """
    使用原生 socket 执行与 MySQL 服务器的握手和认证过程。
    """
    # 步骤 1: 创建 TCP socket 并连接到服务器
    logging.info(f"正在连接到 MySQL 服务器 {
     MYSQL_HOST}:{
     MYSQL_PORT}...")
    # 创建一个 TCP/IP 套接字
    client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    try: # 使用 try...finally 确保 socket 最终会被关闭
        client_socket.connect((MYSQL_HOST, MYSQL_PORT)) # 连接到指定的服务器地址和端口
        logging.info("连接成功！")

        # 步骤 2: 接收并解析服务器的初始握手包 (HandshakeV10)
        # MySQL 数据包的前 3 个字节是载荷长度，第 4 个字节是序列号
        header = client_socket.recv(4) # 首先接收 4 字节的包头
        payload_length, = struct.unpack(', header[:3] + b'\0') # 解包前 3 字节获取载荷长度
        sequence_id = header[3] # 第 4 字节是序列号
        logging.info(f"收到服务器数据包：载荷长度={
     payload_length}, 序列号={
     sequence_id}")

        server_handshake_packet = client_socket.recv(payload_length) # 根据载荷长度接收完整的数据包
        logging.info(f"收到的原始握手包 (前50字节): {
     server_handshake_packet[:50]}")
        
        # 开始解析 HandshakeV10 包
        offset = 0 # 初始化解析偏移量
        protocol_version = server_handshake_packet[offset] # 第 1 字节是协议版本
        offset += 1
        logging.info(f"  解析 -> 协议版本: {
     protocol_version}")

        server_version, offset = parse_null_terminated_string(server_handshake_packet, offset) # 解析服务器版本字符串
        logging.info(f"  解析 -> 服务器版本: {
     server_version}")

        connection_id, = struct.unpack(', server_handshake_packet[offset:offset+4]) # 解析 4 字节的连接 ID
        offset += 4
        logging.info(f"  解析 -> 连接 ID: {
     connection_id}")

        scramble_part1 = server_handshake_packet[offset:offset+8] # 解析挑战码的前 8 字节
        offset += 8
        offset += 1 # 跳过 1 字节的填充符

        server_capabilities_low, = struct.unpack(', server_handshake_packet[offset:offset+2]) # 解析服务器能力的低 16 位
        offset += 2
        logging.info(f"  解析 -> 服务器能力 (低16位): {
     bin(server_capabilities_low)}")
        
        character_set = server_handshake_packet[offset] # 解析默认字符集
        offset += 1
        logging.info(f"  解析 -> 默认字符集: {
     character_set}")

        # 跳过 status_flags (2字节) 和 capabilities_high (2字节)
        offset += 4 

        # 检查是否还有更多认证数据
        auth_plugin_data_len = server_handshake_packet[offset] # 获取认证插件数据长度
        offset += 1
        
        # 跳过保留的 10 个字节
        offset += 10

        # 解析挑战码的第二部分
        # 挑战码总长度为 max(13, auth_plugin_data_len - 8)
        scramble_part2_len = max(13, auth_plugin_data_len - 8) # 计算第二部分的长度
        scramble_part2 = server_handshake_packet[offset:offset+scramble_part2_len-1] # 获取第二部分，减去结尾的 NULL
        offset += scramble_part2_len

        full_scramble = scramble_part1 + scramble_part2 # 拼接成完整的挑战码
        logging.info(f"  解析 -> 完整的挑战码 (scramble): {
     full_scramble}")
        
        # 步骤 3: 构造并发送客户端握手响应包
        # 客户端能力标志
        client_flags = CLIENT_PROTOCOL_41 | CLIENT_SECURE_CONNECTION | CLIENT_LONG_FLAG | CLIENT_LONG_PASSWORD
        
        # 加密密码
        # 1. SHA1(password)
        sha1_pass = hashlib.sha1(MYSQL_PASSWORD.encode('utf-8')).digest() # 计算密码的 SHA1 哈希
        # 2. SHA1(SHA1(password))
        sha1_sha1_pass = hashlib.sha1(sha1_pass).digest() # 对哈希结果再次进行 SHA1 哈希
        # 3. SHA1(scramble + SHA1(SHA1(password)))
        sha1_scramble_plus_hash = hashlib.sha1(full_scramble + sha1_sha1_pass).digest() # 拼接挑战码和双重哈希后再次哈希
        # 4. token = SHA1(password) XOR a
        token = bytes(x ^ y for x, y in zip(sha1_pass, sha1_scramble_plus_hash)) # 将步骤1和3的结果进行异或操作
        logging.info("密码已使用 mysql_native_password 方法成功加密")

        # 构建响应包载荷
        # 客户端标志 (4字节) + 最大包大小 (4字节) + 字符集 (1字节) + 23个保留字节
        response_payload = struct.pack(', client_flags, 16777215, character_set) + (b'\0' * 23)
        # 添加用户名 (以 NULL 结尾)
        response_payload += MYSQL_USER.encode('utf-8') + b'\0'
        # 添加加密后的密码 (长度编码)
        response_payload += bytes([len(token)]) + token
        # 这里不指定数据库，所以没有 database 字段
        
        # 封装成 MySQL 数据包 (载荷长度 + 序列号 + 载荷)
        packet_header = struct.pack(', len(response_payload))[:3] + bytes([sequence_id + 1]) # 构建包头
        client_response_packet = packet_header + response_payload # 拼接成完整的数据包
        
        logging.info("正在向服务器发送客户端握手响应包...")
        client_socket.sendall(client_response_packet) # 发送响应包

        # 步骤 4: 接收并解析服务器的最终响应 (OK_Packet 或 ERR_Packet)
        server_final_response_header = client_socket.recv(4) # 接收最终响应的包头
        final_payload_length, = struct.unpack(', server_final_response_header[:3] + b'\0') # 解包获取载荷长度
        final_sequence_id = server_final_response_header[3] # 获取序列号
        
        server_final_response_payload = client_socket.recv(final_payload_length) # 接收最终响应的载荷
        
        # 检查响应类型
        response_type = server_final_response_payload[0] # 第一个字节是响应类型标志
        if response_type == 0x00: # 0x00 代表 OK_Packet
            logging.info("认证成功！服务器返回 OK_Packet。")
            # 可以进一步解析 OK_Packet 中的受影响行数、最后插入ID等信息
        elif response_type == 0xff: # 0xff 代表 ERR_Packet
            error_code, = struct.unpack(', server_final_response_payload[1:3]) # 解包获取错误码
            # 跳过 SQL state marker (#) 和 5 字节的 SQL state
            error_message = server_final_response_payload[9:].decode('utf-8') # 获取错误信息
            logging.error(f"认证失败！服务器返回 ERR_Packet。")
            logging.error(f"  错误码: {
     error_code}, 错误信息: '{
     error_message}'")
        else: # 其他未知响应
            logging.warning(f"收到未知的服务器响应类型: {
     hex(response_type)}")

    except ConnectionRefusedError: # 捕获连接被拒绝的异常
        logging.error("连接被服务器拒绝。请检查 MySQL 服务器是否正在运行，以及防火墙设置。")
    except Exception as e: # 捕获其他所有异常
        logging.error(f"发生未知错误: {
     e}")
    finally: # 无论成功还是失败，都确保关闭 socket
        logging.info("关闭 socket 连接。")
        client_socket.close() # 关闭 socket

# --- 执行主函数 ---
if __name__ == "__main__": # 如果此脚本作为主程序运行
    # 在运行前，请确保 MYSQL_PASSWORD 已被正确设置
    if MYSQL_PASSWORD == 'your_password': # 检查密码是否已设置
        logging.error("请在脚本中将 'your_password' 替换为您的真实 MySQL 密码！")
    else: # 如果密码已设置
        perform_mysql_handshake() # 执行握手函数

运行与分析：

将上述代码保存为 manual_handshake.py。
修改密码：找到 MYSQL_PASSWORD = 'your_password' 这一行，将其替换为你的真实 MySQL root 用户密码。
运行脚本：python manual_handshake.py

如果成功，你将看到类似以下的日志输出：

2023-10-27 15:30:00,123 - INFO - 正在连接到 MySQL 服务器 127.0.0.1:3306...
2023-10-27 15:30:00,124 - INFO - 连接成功！
2023-10-27 15:30:00,124 - INFO - 收到服务器数据包：载荷长度=85, 序列号=0
... (详细的解析日志) ...
2023-10-27 15:30:00,126 - INFO -   解析 -> 完整的挑战码 (scramble): b'...'
2023-10-27 15:30:00,127 - INFO - 密码已使用 mysql_native_password 方法成功加密
2023-10-27 15:30:00,127 - INFO - 正在向服务器发送客户端握手响应包...
2023-10-27 15:30:00,128 - INFO - 认证成功！服务器返回 OK_Packet。
2023-10-27 15:30:00,128 - INFO - 关闭 socket 连接。

如果密码错误，你将看到：

...
2023-10-27 15:32:10,567 - ERROR - 认证失败！服务器返回 ERR_Packet。
2023-10-27 15:32:10,567 - ERROR -   错误码: 1045, 错误信息: 'Access denied for user 'root'@'localhost' (using password: YES)'
2023-10-27 15:32:10,567 - INFO - 关闭 socket 连接。

1.4 命令阶段：客户端与服务器的 SQL 对话

当握手成功，客户端与服务器之间便建立了一条可信的通信管道。此刻，连接进入了核心的命令阶段（Command Phase）。在这个阶段，客户端将主动发送各种命令包，而服务器则根据命令类型和执行结果，返回相应的响应包。这是一个持续的“请求-响应”循环，直到客户端发送 COM_QUIT 命令或连接意外中断。

PyMySQL 中所有的数据操作，如执行 SELECT、INSERT、UPDATE、DELETE，本质上都是在向服务器发送一个 COM_QUERY 命令包。

1.4.1 命令包的通用结构

几乎所有的客户端命令包都遵循一个简单的通用结构：

包头（Packet Header）：固定的 4 字节。
- 载荷长度 (Payload Length): 3 字节，小端序整数，表示后面载荷的字节数。
- 序列号 (Sequence ID): 1 字节，用于保证包的顺序。每次新的交互（一个完整的请求-响应周期），序列号从 0 开始。
载荷（Payload）：长度由包头中的 载荷长度 决定。
- 命令类型 (Command Type): 1 字节，一个枚举值，用来告诉服务器客户端想要执行什么操作。
- 命令参数 (Command Arguments): N 字节，紧跟在命令类型后面的数据，其结构和内容由具体的 命令类型 决定。

1.4.2 `COM_QUERY`：执行 SQL 语句的核心命令

这是最常用、最重要的命令，它的 命令类型 值为 0x03。

命令类型: 0x03 (代表 COM_QUERY)
命令参数: 就是我们平时编写的、未经任何修改的、原生的 SQL 查询字符串。例如，SELECT * FROM users。

所以，如果我们想让服务器执行 SELECT user, host FROM mysql.user;，客户端需要构建并发送的载荷（Payload）就是：

0x03 (1 字节) + "SELECT user, host FROM mysql.user;" (字符串的 UTF-8 编码字节流)

PyMySQL 在执行 cursor.execute("SELECT ...") 时，其内部最核心的操作之一，就是构造并发送这样一个 COM_QUERY 包。

1.4.3 服务器的响应：一个远比想象中复杂的舞蹈

客户端发送 COM_QUERY 之后，服务器的响应并不是一个简单的“结果包”，而是一个结构化、分阶段的数据流，其复杂性取决于 SQL 语句的类型。

场景一：查询产生结果集（如 SELECT, SHOW）

这是最复杂的场景。服务器需要将一个完整的表格数据（包含列信息和多行数据）发送给客户端。这个过程被细分为多个步骤，通过发送不同类型的包来完成：

第一步：结果集头部包 (Result Set Header Packet)
- 作用：告诉客户端，“我将要发送一个结果集，它包含 N 个列”。
- 结构：它的载荷只有一个字段，是一个长度编码整数（Length-Encoded Integer），这个整数的值就是结果集的列数。

第二步：列定义包 (Column Definition Packets)

作用：在告知总列数后，服务器会为每一列发送一个详细的描述包。如果结果集有 N 列，这里就会连续发送 N 个 ColumnDefinition41 包。

结构 (ColumnDefinition41): 这是一个信息量非常丰富的数据包，它详细描述了一列的所有元数据。

字段名 (Field Name)	类型 (Type)	描述 (Description)
`catalog`	LenEnc Str	目录名称，恒为 “def”。
`schema`	LenEnc Str	数据库（模式）名称，如 “employees”。
`table`	LenEnc Str	表的别名。如果 SQL 中使用了 `AS`，这里是别名。
`org_table`	LenEnc Str	表的原始名称。
`name`	LenEnc Str	列的别名。如果 SQL 中使用了 `AS`，这里是别名。
`org_name`	LenEnc Str	列的原始名称。
`next_length`	LenEnc Int	固定长度字段的长度，固定为 `0x0c`。
`character_set`	2 Bytes	字符集编码，如 `0xff` (utf8mb4)。
`column_length`	4 Bytes	列的最大长度（字节数）。
`type`	1 Byte	极其重要。列的数据类型枚举值，如 `0xfd` (VARCHAR), `0x03` (LONG)。
`flags`	2 Bytes	列的标志位，如是否为 `PRIMARY KEY`, `NOT NULL` 等。
`decimals`	1 Byte	小数位数。对于非数字类型，为 `0x00`。
`filler`	2 Bytes	`0x0000` 填充。

PyMySQL 正是根据这些包中的 type, name 等信息，来构建 cursor.description，并决定如何将后续的行数据转换成 Python 对象。

第三步：元数据结束包 (EOF_Packet)
- 作用：在发送完所有 N 个 ColumnDefinition41 包之后，服务器会发送一个 EOF_Packet。EOF 意为 “End of File”。这个包像一个分隔符，告诉客户端：“所有列的元数据我已经全部告诉你了，接下来我要开始发送真正的行数据了。”
- 结构：
  - 包头: 0xfe (1 字节)
  - 警告数 (warning_count): 2 字节整数
  - 状态标志 (status_flags): 2 字节整数
第四步：行数据包 (Row Data Packets)
- 作用：服务器会为结果集中的每一行发送一个行数据包。
- 结构：包的载荷由 N 个**长度编码字符串（Length-Encoded String）**组成，N 等于结果集的列数。
- 重要细节：无论原始数据类型是整数、浮点数、日期还是其他，MySQL 在协议层面都会将其序列化为字符串再发送。例如，整数 123 会被发送为字符串 "123"。NULL 值有特殊的表示法（0xfb）。PyMySQL 的职责之一，就是接收这些字符串，并根据之前在 ColumnDefinition41 包中获取的列类型信息，将它们反序列化成正确的 Python 类型（如 int, float, datetime.date 等）。
第五步：结果集结束包 (Final EOF_Packet)
- 作用：当所有行数据都发送完毕后，服务器会发送第二个 EOF_Packet。这个包标志着整个结果集的传输彻底结束。
- 结构：与第一个 EOF_Packet 相同。客户端收到这个包后，就知道可以准备接收下一个查询的结果，或者结束会话了。

场景二：查询不产生结果集（如 INSERT, UPDATE, DELETE）

对于这些数据操作（DML）或数据定义（DDL）语句，服务器的响应要简单得多。

成功: 如果命令执行成功，服务器直接返回一个 OK_Packet。这个包里会包含有用的信息，如 affected_rows（受影响的行数）和 last_insert_id（最后插入行的自增 ID）。
失败: 如果命令执行失败（如语法错误、违反约束），服务器直接返回一个 ERR_Packet，包含错误码和错误信息。

这套复杂的响应机制，保证了无论多大的结果集，都可以被高效、结构化地流式传输，客户端可以一边接收一边处理，而不需要一次性将所有数据加载到内存中。

1.5 动手实践：发送 `COM_QUERY` 并手动解析结果集

现在，我们将扩展之前的 manual_handshake.py 脚本，在成功握手后，继续发送一个 SELECT 查询，并手动解析服务器返回的完整结果集。这将是一个激动人心的过程，它将揭示 PyMySQL 中 cursor.fetchall() 的全部秘密。

我们将执行 SELECT 1+1, 'hello', NOW(); 这个查询。它包含三种不同类型的数据，非常适合演示。

import socket # 导入 socket 模块，用于创建和管理网络连接
import struct # 导入 struct 模块，用于处理二进制数据，打包和解包
import hashlib # 导入 hashlib 模块，用于进行哈希计算，如 SHA1
import logging # 导入 logging 模块，用于记录程序运行信息
import datetime # 导入 datetime 模块，用于处理日期时间

# --- 配置日志 (与之前相同) ---
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- MySQL 服务器连接信息 (与之前相同) ---
MYSQL_HOST = '127.0.0.1' # MySQL 服务器的主机名或 IP 地址
MYSQL_PORT = 3306 # MySQL 服务器的端口号
MYSQL_USER = 'root' # 登录 MySQL 的用户名
MYSQL_PASSWORD = 'your_password' # 登录 MySQL 的密码，请务必替换成你自己的密码

# --- MySQL 协议常量 (与之前相同) ---
CLIENT_LONG_PASSWORD = 1
CLIENT_FOUND_ROWS = 2
CLIENT_LONG_FLAG = 4
CLIENT_CONNECT_WITH_DB = 8
CLIENT_PROTOCOL_41 = 512
CLIENT_SECURE_CONNECTION = 1 << 15

# --- 辅助函数：解析变长整数 (与之前相同，但增加了解析变长字符串) ---
def parse_length_encoded_integer(data, offset): # 定义解析长度编码整数的函数
    first_byte = data[offset] # 读取第一个字节
    offset += 1 # 偏移量加 1
    if first_byte < 0xfb: # 如果第一个字节小于 251
        return first_byte, offset # 返回该字节的值和新偏移量
    elif first_byte == 0xfc: # 如果第一个字节等于 251
        value, = struct.unpack(', data[offset:offset+2]) # 解包 2 字节无符号短整型
        return value, offset + 2 # 返回值和新偏移量
    elif first_byte == 0xfd: # 如果第一个字节等于 253
        low, high = struct.unpack(', data[offset:offset+2]) # 解包 2 字节和 1 字节
        return low | (high << 16), offset + 3 # 组合成 3 字节整数并返回
    elif first_byte == 0xfe: # 如果第一个字节等于 254
        value, = struct.unpack(', data[offset:offset+8]) # 解包 8 字节无符号长整型
        return value, offset + 8 # 返回值和新偏移量
    return None, offset # 其他情况返回 None

def parse_length_encoded_string(data, offset): # 新增：定义解析长度编码字符串的函数
    """解析 MySQL 协议中的长度编码字符串。"""
    length, offset = parse_length_encoded_integer(data, offset) # 首先解析出字符串的长度
    if length is None: # 如果长度为 None，表示 SQL NULL
        return None, offset # 返回 None 和新偏移量
    string_data = data[offset:offset+length] # 根据长度提取字符串数据
    return string_data, offset + length # 返回字符串数据和新偏移量

def parse_null_terminated_string(data, offset): # (与之前相同)
    null_pos = data.find(b'\0', offset) # 查找 NULL 终止符的位置
    if null_pos == -1: # 如果未找到
        raise ValueError("在数据中未找到 NULL 结尾的字符串") # 抛出异常
    string_data = data[offset:null_pos] # 提取字符串数据
    return string_data.decode('utf-8'), null_pos + 1 # 解码并返回

# --- 新增：一个统一的接收和解析包的函数 ---
def receive_packet(sock): # 定义接收数据包的函数
    """从 socket 接收一个完整的 MySQL 数据包。"""
    header = sock.recv(4) # 接收 4 字节的包头
    if not header: # 如果包头为空，表示连接已关闭
        raise ConnectionAbortedError("连接已由服务器关闭") # 抛出连接中断异常
    payload_length, = struct.unpack(', header[:3] + b'\0') # 解包获取载荷长度
    sequence_id = header[3] # 获取序列号
    payload = sock.recv(payload_length) # 根据长度接收完整的载荷
    return payload, sequence_id # 返回载荷和序列号

# --- 主逻辑：合并握手和查询 ---
def main_process():
    """
    执行完整的流程：连接、握手、发送查询、解析结果。
    """
    client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 创建 TCP socket
    try: # 使用 try...finally 确保 socket 最终会被关闭
        # --- 阶段一: 握手 (大部分代码与之前相同，简化日志) ---
        logging.info("--- 阶段一: 开始执行握手 ---")
        client_socket.connect((MYSQL_HOST, MYSQL_PORT)) # 连接到服务器
        
        # 接收并解析服务器握手包
        server_handshake_payload, _ = receive_packet(client_socket) # 接收服务器握手包
        offset = 1 # 跳过协议版本
        _, offset = parse_null_terminated_string(server_handshake_payload, offset) # 跳过服务器版本
        offset += 4 # 跳过连接 ID
        scramble_part1 = server_handshake_payload[offset:offset+8] # 获取挑战码第一部分
        offset += 9 # 跳过 scranble_part1 和填充符
        _, = struct.unpack(', server_handshake_payload[offset:offset+2]) # 跳过服务器能力低 16 位
        offset += 16 # 跳过字符集、状态标志、能力高 16 位、认证插件数据长度、保留字节
        auth_plugin_data_len = server_handshake_payload[12] # 获取认证插件数据长度
        scramble_part2_len = max(13, auth_plugin_data_len - 8) # 计算挑战码第二部分长度
        scramble_part2 = server_handshake_payload[offset:offset+scramble_part2_len-1] # 获取挑战码第二部分
        full_scramble = scramble_part1 + scramble_part2 # 拼接完整的挑战码

        # 构造并发送客户端响应包
        client_flags = CLIENT_PROTOCOL_41 | CLIENT_SECURE_CONNECTION
        sha1_pass = hashlib.sha1(MYSQL_PASSWORD.encode('utf-8')).digest() # 计算密码的 SHA1 哈希
        sha1_sha1_pass = hashlib.sha1(sha1_pass).digest() # 对哈希结果再次进行 SHA1 哈希
        sha1_scramble_plus_hash = hashlib.sha1(full_scramble + sha1_sha1_pass).digest() # 拼接挑战码和双重哈希后再次哈希
        token = bytes(x ^ y for x, y in zip(sha1_pass, sha1_scramble_plus_hash)) # 将步骤1和3的结果进行异或操作

        response_payload = struct.pack(', client_flags, 16777215, 255) + (b'\0' * 23) # 构造响应载荷，字符集用255(utf8mb4)
        response_payload += MYSQL_USER.encode('utf-8') + b'\0' # 添加用户名
        response_payload += bytes([len(token)]) + token # 添加加密后的密码

        packet_header = struct.pack(', len(response_payload))[:3] + b'\x01' # 序列号为 1
        client_socket.sendall(packet_header + response_payload) # 发送客户端响应包
        
        # 接收服务器的认证结果
        auth_result_payload, _ = receive_packet(client_socket) # 接收认证结果
        if auth_result_payload[0] != 0x00: # 如果不是 OK_Packet
            error_code, = struct.unpack(', auth_result_payload[1:3]) # 解包获取错误码
            error_message = auth_result_payload[9:].decode('utf-8') # 获取错误信息
            logging.error(f"握手失败: {
     error_code} - {
     error_message}") # 记录错误日志
            return # 结束函数执行
        logging.info("--- 握手成功！ ---")

        # --- 阶段二: 发送 COM_QUERY 并解析结果集 ---
        logging.info("--- 阶段二: 发送 COM_QUERY 并解析结果集 ---")
        sql_query = "SELECT 1+1, 'hello', NOW(), '你好世界';" # 定义要执行的 SQL 查询
        logging.info(f"将要执行的 SQL: {
     sql_query}")

        # 构造 COM_QUERY 包
        query_payload = b'\x03' + sql_query.encode('utf-8') # 载荷 = 命令类型 (0x03) + SQL 字符串
        query_header = struct.pack(', len(query_payload))[:3] + b'\x00' # 新的交互，序列号从 0 开始
        client_socket.sendall(query_header + query_payload) # 发送查询包
        
        # 开始解析响应流
        # 1. 读取结果集头部包
        logging.info("--- 正在解析服务器响应 ---")
        column_count_payload, _ = receive_packet(client_socket) # 接收第一个包（结果集头部）
        column_count, _ = parse_length_encoded_integer(column_count_payload, 0) # 解析列数
        logging.info(f"1. 结果集头部：发现 {
     column_count} 列。")

        # 2. 循环读取列定义包
        columns = [] # 创建一个列表来存储列信息
        for i in range(column_count): # 根据列数循环
            col_def_payload, _ = receive_packet(client_socket) # 接收一个列定义包
            # 为了简化，我们只解析列名，但实际上这里包含了所有元数据
            offset = 0
            _, offset = parse_length_encoded_string(col_def_payload, offset) # 跳过 catalog
            _, offset = parse_length_encoded_string(col_def_payload, offset) # 跳过 schema
            _, offset = parse_length_encoded_string(col_def_payload, offset) # 跳过 table
            _, offset = parse_length_encoded_string(col_def_payload, offset) # 跳过 org_table
            column_name_bytes, offset = parse_length_encoded_string(col_def_payload, offset) # 解析列名
            column_name = column_name_bytes.decode('utf-8') # 将列名解码为字符串
            columns.append(column_name) # 将列名添加到列表中
            logging.info(f"2. 第 {
     i+1}/{
     column_count} 列定义：名称='{
     column_name}'")

        # 3. 读取第一个 EOF 包
        eof_payload_1, _ = receive_packet(client_socket) # 接收第一个 EOF 包
        if eof_payload_1[0] != 0xfe: # 检查包类型是否为 EOF
            raise ValueError("预期应收到第一个 EOF 包，但收到其他类型") # 抛出异常
        logging.info("3. 收到元数据结束包 (第一个 EOF)。")

        # 4. 循环读取行数据包，直到遇到第二个 EOF 包
        rows = [] # 创建一个列表来存储所有行数据
        row_index = 0 # 初始化行索引
        while True: # 无限循环，直到遇到 EOF
            row_payload, _ = receive_packet(client_socket) # 接收一个数据包
            if row_payload[0] == 0xfe: # 检查是否为 EOF 包
                logging.info("5. 收到结果集结束包 (第二个 EOF)。")
                break # 如果是，跳出循环
            
            # 如果不是 EOF 包，那么它就是行数据包
            row_index += 1
            logging.info(f"4. 正在解析第 {
     row_index} 行数据...")
            row_data = [] # 创建一个列表来存储当前行的数据
            offset = 0 # 初始化行数据解析的偏移量
            for _ in range(column_count): # 根据列数循环解析每一列的值
                value_bytes, offset = parse_length_encoded_string(row_payload, offset) # 解析一个列的值
                if value_bytes is None: # 如果值为 None (SQL NULL)
                    row_data.append(None) # 添加 None 到行数据列表
                else: # 否则
                    # 这里是关键：所有数据都是字符串，需要客户端自己解码
                    # PyMySQL 会根据列类型进行转换，我们这里只做 utf-8 解码
                    try:
                        value_str = value_bytes.decode('utf-8')
                        row_data.append(value_str) # 添加解码后的字符串到行数据列表
                    except UnicodeDecodeError:
                        row_data.append(value_bytes) # 如果解码失败，保留原始字节串
            rows.append(row_data) # 将解析完的行数据添加到总的行列表中

        # --- 阶段三: 打印最终结果 ---
        logging.info("--- 阶段三: 查询完成，打印结果 ---")
        print("\n" + "="*40)
        print("查询结果:")
        print(" | ".join(columns)) # 打印表头
        print("-" * 40)
        for row in rows: # 遍历每一行
            # 将每一行的数据转换为字符串并打印
            print(" | ".join(str(item) for item in row))
        print("="*40 + "\n")

        # --- 阶段四: 发送 COM_QUIT 命令，优雅关闭连接 ---
        logging.info("--- 阶段四: 发送 COM_QUIT 命令 ---")
        quit_payload = b'\x01' # COM_QUIT 命令的载荷只有一个字节 0x01
        quit_header = struct.pack(', len(quit_payload))[:3] + b'\x00' # 新的交互，序列号为 0
        client_socket.sendall(quit_header + quit_payload) # 发送退出命令
        logging.info("连接已优雅关闭。")

    except ConnectionRefusedError: # 捕获连接被拒绝的异常
        logging.error("连接被服务器拒绝。请检查 MySQL 服务器是否正在运行，以及防火墙设置。")
    except Exception as e: # 捕获其他所有异常
        logging.error(f"发生未知错误: {
     e}", exc_info=True) # 记录错误并打印堆栈信息
    finally: # 无论成功还是失败，都确保关闭 socket
        logging.info("关闭 socket 连接。")
        client_socket.close() # 关闭 socket

# --- 执行主函数 ---
if __name__ == "__main__": # 如果此脚本作为主程序运行
    if MYSQL_PASSWORD == 'your_password': # 检查密码是否已设置
        logging.error("请在脚本中将 'your_password' 替换为您的真实 MySQL 密码！")
    else: # 如果密码已设置
        main_process() # 执行主流程

运行与分析：

将上述代码保存为 manual_query.py。
修改密码：确保 MYSQL_PASSWORD 已被正确设置。
运行脚本：python manual_query.py

你将会看到非常详细的日志，记录了从握手到查询再到解析的全过程，最终打印出格式化的查询结果：

... (握手日志) ...
2023-10-27 16:15:30,123 - INFO - --- 阶段二: 发送 COM_QUERY 并解析结果集 ---
2023-10-27 16:15:30,123 - INFO - 将要执行的 SQL: SELECT 1+1, 'hello', NOW(), '你好世界';
2023-10-27 16:15:30,124 - INFO - --- 正在解析服务器响应 ---
2023-10-27 16:15:30,124 - INFO - 1. 结果集头部：发现 4 列。
2023-10-27 16:15:30,125 - INFO - 2. 第 1/4 列定义：名称='1+1'
2023-10-27 16:15:30,125 - INFO - 2. 第 2/4 列定义：名称='hello'
2023-10-27 16:15:30,126 - INFO - 2. 第 3/4 列定义：名称='NOW()'
2023-10-27 16:15:30,126 - INFO - 2. 第 4/4 列定义：名称='你好世界'
2023-10-27 16:15:30,127 - INFO - 3. 收到元数据结束包 (第一个 EOF)。
2023-10-27 16:15:30,127 - INFO - 4. 正在解析第 1 行数据...
2023-10-27 16:15:30,128 - INFO - 5. 收到结果集结束包 (第二个 EOF)。
2023-10-27 16:15:30,128 - INFO - --- 阶段三: 查询完成，打印结果 ---

========================================
查询结果:
1+1 | hello | NOW() | 你好世界
----------------------------------------
2 | hello | 2023-10-27 16:15:30 | 你好世界
========================================

2023-10-27 16:15:30,129 - INFO - --- 阶段四: 发送 COM_QUIT 命令 ---
2023-10-27 16:15:30,129 - INFO - 连接已优雅关闭。
2023-10-27 16:15:30,129 - INFO - 关闭 socket 连接。

通过这个实验，你已经完成了对 PyMySQL 最核心功能的底层复现。你现在深刻地理解了：

流式处理：结果集不是一次性发送的，而是通过一个定义清晰的协议分阶段、分部分地流式传输。
元数据与数据的分离：服务器先发送所有列的元数据，再发送行数据。这种设计让客户端可以预先准备好数据结构，并进行高效解析。
数据类型的客户端责任：协议层面只传输字符串（或字节串）。将这些“无类型”的字符串转换成 Python 中有意义的 int、float、datetime 等类型，是客户端驱动（如 PyMySQL）的核心职责之一。
状态管理的重要性：客户端在解析响应时，必须维护一个内部状态机，以区分当前应该接收的是列定义包、行数据包，还是 EOF 包。

第二章：PyMySQL 的首次亮相：从连接到游标的优雅抽象

2.1 `pymysql.connect()`：封装了握手协议的艺术

一切的起点是 pymysql.connect() 函数。这个函数是通往数据库世界的大门，它一个函数就浓缩了我们在 manual_handshake.py 中编写的全部握手逻辑。它的每一个参数，都精确地映射到了握手协议中的特定字段或行为。

让我们来深入剖析这个函数的核心参数，看看它们是如何驱动底层协议的：

host (str), port (int):
- 作用: 指定 MySQL 服务器的网络地址和端口号。
- 底层映射: 这两个参数被直接传递给 socket.socket() 创建的套接字对象的 connect((host, port)) 方法。这是建立 TCP 连接的第一步，也是所有通信的物理基础。如果服务器不在本地或端口不是默认的 3306，就必须指定它们。
user (str), password (str):
- 作用: 提供登录数据库所需的用户名和密码。
- 底层映射: 这两个参数是构建握手响应包 (HandshakeResponse Packet) 的核心。
  - user 的值会被编码后，直接放入响应包的 username 字段。
  - password 的值则会经历我们在第一章中手动实现的 mysql_native_password 加密过程：PyMySQL 内部会获取服务器初始握手包中的 scramble (挑战码)，然后用 hashlib 模块对 password 进行两次 SHA1 哈希，再与 scramble 结合进行第三次 SHA1 哈希，最后与第一次的哈希结果进行异或，得到的加密 token 被放入响应包的 auth_response 字段。如果密码错误，服务器将返回一个 ERR_Packet，PyMySQL 捕获到这个包后，会将其转换为一个 OperationalError 异常并抛出。
database (str) (或 db):
- 作用: 指定连接成功后要默认使用的数据库（模式）。
- 底层映射: 如果提供了这个参数，PyMySQL 在构建握手响应包时，会做两件事：
  1. 在客户端能力标志 client_flag 字段中，添加 CLIENT_CONNECT_WITH_DB (值为8) 这个标志位，告知服务器：“我接下来会提供一个数据库名称”。
  2. 将 database 参数的值编码后，放入响应包的 database 字段。服务器收到后，会直接将当前会话的默认数据库设置为这个值，等同于连接成功后立刻执行了 USE a_database;。
charset (str):
- 作用: 指定客户端与服务器之间通信时使用的字符集。这是一个极其重要的参数，正确设置它可以从根本上避免“乱码”（mojibake）问题。
- 底层映射: 这个参数的值（如 "utf8mb4"）会被 PyMySQL 翻译成 MySQL 协议中对应的数字 ID（utf8mb4 对应 255 或 45，取决于版本）。这个数字 ID 会被放入握手响应包的 character_set 字段。这等于在告诉服务器：“从现在开始，我发给你的所有字符串，请你用 utf8mb4 来解码；你返回给我的所有字符串，也请你用 utf8mb4 来编码。” 双方达成编码共识，数据传输就不会出现误解。
connect_timeout (int):
- 作用: 设置建立连接的超时时间（秒）。
- 底层映射: 在调用 socket.connect() 之前，PyMySQL 会先调用 socket.settimeout(connect_timeout)。如果在指定时间内 TCP 连接还未建立（例如，服务器无响应、网络不通），socket 库会抛出一个 socket.timeout 异常，PyMySQL 会捕获它并通常会重新抛出一个更友好的 OperationalError，并提示“连接超时”。
autocommit (bool):
- 作用: 设置是否开启自动提交模式。
- 底层映射: 这个参数不直接影响握手协议，而是影响连接成功后的行为。
  - 如果 autocommit=True (默认在某些驱动中是 False，但 PyMySQL 中似乎倾向于是 False，需要确认)，PyMySQL 在连接成功后，可能会发送一条 SET autocommit=1 的 COM_QUERY 命令。在此模式下，每一条 SQL 语句都会被视为一个独立的事务并被立即执行和提交，你不需要手动调用 commit()。
  - 如果 autocommit=False，PyMySQL 会确保会话处于 autocommit=0 的状态。这意味着一个事务开始了，你执行的所有 INSERT, UPDATE, DELETE 语句都会被服务器缓存起来，直到你显式调用连接对象的 .commit() 方法（发送 COMMIT 命令）或 .rollback() 方法（发送 ROLLBACK 命令），事务才会结束。
cursorclass (Cursor):
- 作用: 指定创建游标时使用的类。这是一个强大的定制化功能。
- 底层映射: 这纯粹是 PyMySQL 客户端层面的行为。它决定了当你调用 connection.cursor() 时，返回的是一个标准的 pymysql.cursors.Cursor 对象，还是一个像 pymysql.cursors.DictCursor 这样的特殊对象。我们将在后面详细探讨它的妙用。

动手实践：使用 pymysql.connect() 建立健壮的连接

现在，让我们用 PyMySQL 来重写连接过程，并加入专业的错误处理。

import pymysql # 导入 pymysql 库
from pymysql.err import OperationalError, InterfaceError, ProgrammingError # 从 pymysql.err 模块导入特定的异常类，用于更精确的错误处理
import logging # 导入 logging 模块

# --- 配置日志 ---
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- MySQL 服务器连接信息 ---
# 这里我们将配置信息放入一个字典，这在真实项目中是更好的实践
db_config = {
   
    'host': '127.0.0.1', # MySQL 服务器的主机名或 IP 地址
    'port': 3306, # MySQL 服务器的端口号
    'user': 'root', # 登录 MySQL 的用户名
    'password': 'your_password', # 登录 MySQL 的密码，请务必替换成你自己的密码
    'database': 'mysql', # 指定连接后默认使用的数据库
    'charset': 'utf8mb4', # 指定通信使用的字符集，强烈推荐 utf8mb4 以支持 emoji 等
    'connect_timeout': 5, # 设置连接超时时间为 5 秒
    'autocommit': False, # 关闭自动提交，以便进行事务管理
}

def create_robust_connection(config):
    """
    使用给定的配置创建一个到 MySQL 的健壮连接。
    包含详细的错误处理逻辑。
    :param config: 包含连接参数的字典。
    :return: 一个 pymysql 连接对象，如果失败则返回 None。
    """
    connection = None # 初始化连接对象为 None
    try: # 使用 try...except 块来捕获可能发生的连接错误
        logging.info(f"正在尝试使用以下配置连接到数据库: host={
     config['host']}, database={
     config['database']}")
        # pymysql.connect() 函数会执行所有底层的握手和认证协议
        connection = pymysql.connect(**config) # 使用字典解包 (**) 的方式传递所有参数
        
        # 连接成功后，可以获取一些服务器信息来验证
        server_info = connection.get_server_info() # 获取服务器版本信息
        protocol_version = connection.protocol_version # 获取协议版本
        logging.info(f"数据库连接成功！服务器版本: {
     server_info}, 协议版本: {
     protocol_version}")
        
        return connection # 返回成功的连接对象

    except OperationalError as e: # 捕获操作层面的错误，这是最常见的连接错误类型
        # OperationalError 通常表示网络问题或认证失败
        # 例如：密码错误(对应 ERR_Packet 1045)、主机无权限(1130)、连接超时、数据库不存在(1049)
        error_code, error_message = e.args # OperationalError 的参数通常是一个包含错误码和错误信息的元组
        logging.error(f"连接操作失败，无法连接到数据库。")
        logging.error(f"  底层协议错误码: {
     error_code}")
        logging.error(f"  错误详情: {
     error_message}")
        if error_code == 1045: # 针对特定的错误码给出更具体的建议
            logging.error("  -> 可能的原因: 用户名或密码错误。")
        elif error_code == 2003:
            logging.error(f"  -> 可能的原因: 无法连接到 MySQL 服务器 '{
     config['host']}'。请检查主机名、端口是否正确，以及服务器是否正在运行。")
        elif error_code == 1049:
            logging.error(f"  -> 可能的原因: 数据库 '{
     config.get('database')}' 不存在。")
        return None # 连接失败，返回 None

    except InterfaceError as e: # 捕获接口层面的错误
        # 这通常表示驱动程序本身的问题，或者与 DB-API 规范的兼容性问题，比较少见
        logging.error(f"数据库驱动接口错误: {
     e}")
        return None # 连接失败，返回 None

    except Exception as e: # 捕获所有其他未预料到的异常
        logging.error(f"发生未知的连接错误: {
     e}", exc_info=True) # exc_info=True 会记录完整的堆栈跟踪信息
        return None # 连接失败，返回 None

def main():
    """主执行函数"""
    logging.info("--- 开始数据库连接测试 ---")
    
    # 场景一: 成功的连接
    logging.info("\n--- 场景一: 尝试一个有效的连接 ---")
    # 确保 db_config 中的密码是正确的
    if db_config['password'] == 'your_password':
        logging.warning("请在 db_config 字典中将 'your_password' 替换为您的真实 MySQL 密码！")
        return

    connection = create_robust_connection(db_config) # 调用函数创建连接
    if connection: # 如果连接对象被成功创建
        logging.info("连接对象已成功创建。现在可以执行操作了。")
        # 在真实应用中，你会在这里开始使用 connection 对象
        connection.close() # 操作完成后，务必关闭连接
        logging.info("连接已关闭。")

    # 场景二: 密码错误的连接
    logging.info("\n--- 场景二: 尝试一个密码错误的连接 ---")
    invalid_config = db_config.copy() # 复制一份配置，以免修改原始配置
    invalid_config['password'] = 'wrong_password_12345' # 设置一个错误的密码
    failed_connection = create_robust_connection(invalid_config) # 尝试使用错误配置创建连接
    if not failed_connection: # 预期连接会失败
        logging.info("预期内的连接失败，错误处理正常。")

    # 场景三: 连接不存在的数据库
    logging.info("\n--- 场景三: 尝试连接一个不存在的数据库 ---")
    invalid_db_config = db_config.copy() # 复制配置
    invalid_db_config['database'] = 'non_existent_database_xyz' # 设置一个不存在的数据库名
    failed_db_connection = create_robust_connection(invalid_db_config) # 尝试连接
    if not failed_db_connection: # 预期连接会失败
        logging.info("预期内的连接失败，错误处理正常。")

if __name__ == "__main__":
    main() # 执行主函数

分析与洞察：

抽象的力量：对比第一章的 manual_handshake.py，pymysql.connect() 将近百行的底层代码压缩成了一行函数调用。这就是优秀库设计的价值——隐藏复杂性，提供简洁的接口。
错误处理的必要性：网络和数据库交互天然是不可靠的。pymysql 将底层的 ERR_Packet 和网络异常，转换成了 Python 世界中我们可以理解和处理的 OperationalError 等异常。专业的代码必须包含健壮的 try...except 块来应对这些可预见的失败。
配置驱动：将连接参数放入一个字典中，并通过 **config 的方式传递，是真实项目中推荐的做法。这使得配置可以轻松地从文件（如 config.ini, settings.py）、环境变量或配置中心加载，使代码与环境配置解耦。
从协议到异常的映射：
- OperationalError: (1045, ...) -> 服务器返回了 ERR_Packet，因为认证失败。
- OperationalError: (2003, ...) -> socket.connect() 超时或被拒绝，TCP 连接未能建立。
- OperationalError: (1049, ...) -> 握手成功，但在设置默认数据库时，服务器返回了 ERR_Packet。

现在，你不仅知道如何使用 pymysql.connect()，更重要的是，你理解了它在水面之下所做的每一件细微而关键的工作。当连接失败时，你看到的不再仅仅是一个 Python 异常，而是能够联想到那场发生在二进制层面、不幸失败了的“握手之舞”。

2.2 连接对象 (`Connection`): 不仅仅是一条管道

当 pymysql.connect() 成功执行后，它返回的是一个 pymysql.connections.Connection 对象。初学者可能会认为它就是那条网络管道，但实际上，它是一个远比管道更智能的会话管理器。它封装了底层的 socket，并在此之上维护着与当前数据库会话相关的所有状态和功能。

把它想象成一个高度专业的“数据库通信总监”，它负责：

状态管理：它知道当前连接是否存活（open 属性），事务是否已开始，服务器的版本信息等。
资源分配：它能为你创建“任务执行官”——游标对象（Cursor）。
事务控制：它掌握着最终的决定权，可以提交（commit）或回滚（rollback）由游标执行的所有数据修改操作。
生命周期管理：它负责优雅地结束会话（close），确保所有资源都被正确释放。

让我们深入探索这个“总监”的核心方法和属性。

2.2.1 `connection.cursor()`: 创建命令执行者

这是 Connection 对象最核心的方法。

作用: 创建并返回一个游标对象 (Cursor)。
底层映射: 这个操作在协议层面并不会立即与服务器发生通信。它纯粹是在 Python 客户端内部创建了一个新的对象。这个游标对象会持有对 Connection 对象的引用，以便将来可以通过它来发送命令和接收数据。你可以把游标看作是专门用来执行 SQL 命令和处理结果的“遥控器”，而 Connection 对象则是这个遥控器连接的“电视机”。一个 Connection 对象可以创建多个 Cursor 对象，它们共享同一个数据库连接和事务状态。

2.2.2 事务控制：`commit()` 与 `rollback()`

这两个方法是数据库事务管理的核心，只有在 autocommit=False 时才有意义。

connection.commit():
- 作用: 提交当前事务。这将使得从上一次 commit 或 rollback 之后，由该连接上任何游标执行的所有数据修改（INSERT, UPDATE, DELETE）被永久地保存在数据库中。
- 底层映射: 调用此方法会向服务器发送一个内容为 "COMMIT" 的 COM_QUERY 命令包。服务器收到后，会执行事务提交，并返回一个 OK_Packet。
connection.rollback():
- 作用: 回滚当前事务。这将撤销从上一次 commit 或 rollback 之后的所有数据修改。
- 底层映射: 调用此方法会向服务器发送一个内容为 "ROLLBACK" 的 COM_QUERY 命令包。服务器收到后，会撤销所有未提交的更改，并返回一个 OK_Packet。

事务是保证数据一致性的基石。想象一个银行转账操作，它至少包含两步：A 账户减钱，B 账户加钱。我们必须保证这两步要么都成功，要么都失败。如果 A 减钱后程序崩溃，B 没能加上钱，数据就出现了严重错误。通过将这两个操作包裹在一个事务中，我们可以确保只有当两个 UPDATE 都成功执行后，才调用 connection.commit() 进行提交。任何一步失败，我们都可以调用 connection.rollback()，让数据库恢复到转账之前的状态。

2.2.3 生命周期管理：`close()` 与 Python 的 `with` 语句

connection.close():
- 作用: 关闭数据库连接。
- 底层映射: 这个方法做了两件重要的事情：
  1. 向服务器发送一个 COM_QUIT 命令包（命令类型 0x01）。这是一种“优雅”的告别，它告诉服务器：“我要下线了，你可以安全地释放为我分配的所有资源了（如内存、锁等）。”
  2. 调用底层 socket 对象的 close() 方法，关闭 TCP 连接，释放客户端的网络资源。
- 重要性: 用完连接后必须关闭！ 如果忘记关闭，连接会一直保持，持续占用服务器和客户端的资源。当这种“僵尸连接”过多时，可能会耗尽服务器的最大连接数，导致新的用户无法连接。
使用 with 语句进行自动管理:
PyMySQL 的 Connection 对象实现了 Python 的上下文管理协议（__enter__ 和 __exit__ 方法）。这使得我们可以使用 with 语句来自动管理连接的生命周期，这是更推荐、更安全的方式。
```
with pymysql.connect(**db_config) as connection:
    # 在这里执行数据库操作
    # ...
# 当代码块结束时（无论正常结束还是发生异常），
# connection.close() 会被自动调用。
```
当 with 语句开始时，pymysql.connect() 被调用并返回 connection 对象。当 with 代码块结束时，PyMySQL 会在 connection 对象的 __exit__ 方法中自动调用 close()。这种方式可以确保即使在代码块中发生异常，连接也一定会被关闭，极大地增强了代码的健壮性。

2.2.4 `connection.ping()`: 探测连接的脉搏

作用: 检查到服务器的连接是否仍然有效。
底层映射: 调用此方法会向服务器发送一个 COM_PING 命令包（命令类型 0x0e）。
- 如果服务器收到 COM_PING 并且连接是健康的，它会立刻返回一个 OK_Packet。
- 如果连接已经因为网络问题或服务器超时而断开，发送 COM_PING 的操作会失败，并抛出 OperationalError。
应用场景: 在长连接应用（如 Web 服务器的后台进程、长时间运行的数据处理任务）中非常有用。由于网络防火墙、路由器或 MySQL 服务器自身的 wait_timeout 设置，一个长时间空闲的连接可能会被单方面断开。在执行一次数据库查询之前，先调用 ping() 可以快速检查连接是否存活。PyMySQL 的 connect 函数有一个 reconnect 参数，如果设置为 True，ping() 在发现连接断开时会自动尝试重新连接，这在某些场景下可以简化应用的容错逻辑。

动手实践：体验 Connection 对象的完整生命周期和事务

让我们编写一个完整的示例，来模拟一次银行转账，体验 Connection 对象的事务控制和生命周期管理。

import pymysql
from pymysql.err import OperationalError, IntegrityError # 导入 IntegrityError，用于处理像主键冲突这样的错误
import logging

# --- 日志和配置 (与之前类似) ---
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
db_config = {
   
    'host': '127.0.0.1',
    'port': 3306,
    'user': 'root',
    'password': 'your_password', # 请替换成你的真实密码
    'charset': 'utf8mb4',
    # 我们将在这里创建一个新的数据库用于测试
}

def setup_database_and_table(config):
    """
    连接到 MySQL 服务器，创建用于测试的数据库和表。
    """
    # 先不指定数据库，连接到 mysql 服务本身
    temp_config = config.copy() # 复制配置
    temp_config.pop('database', None) # 移除 database 键
    
    try: # 使用 try...finally 确保连接关闭
        conn = pymysql.connect(**temp_config) # 连接到服务器
        logging.info("成功连接到 MySQL 服务器，准备初始化环境。")
        with conn.cursor() as cursor: # 使用 with 语句管理游标
            db_name = "pymysql_test_db" # 定义测试数据库名
            logging.info(f"正在创建数据库 '{
     db_name}' (如果不存在)...")
            cursor.execute(f"CREATE DATABASE IF NOT EXISTS {
     db_name} CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;") # 创建数据库
            logging.info(f"正在切换到数据库 '{
     db_name}'...")
            cursor.execute(f"USE {
     db_name};") # 切换到新创建的数据库
            
            table_name = "accounts" # 定义表名
            logging.info(f"正在创建表 '{
     table_name}' (如果不存在)...")
            # 创建一个账户表，使用 InnoDB 引擎以支持事务
            create_table_sql = f"""
            CREATE TABLE IF NOT EXISTS {
     table_name} (
                id INT PRIMARY KEY,
                holder_name VARCHAR(100) NOT NULL,
                balance DECIMAL(10, 2) NOT NULL CHECK (balance >= 0)
            ) ENGINE=InnoDB;
            """
            cursor.execute(create_table_sql) # 执行建表语句
            
            logging.info("正在清空并插入初始数据...")
            cursor.execute(f"TRUNCATE TABLE {
     table_name};") # 清空表数据
            initial_data = [ # 定义初始数据
                (101, 'Alice', 1000.00),
                (102, 'Bob', 500.00)
            ]
            # 使用 executemany 批量插入数据
            insert_sql = f"INSERT INTO {
     table_name} (id, holder_name, balance) VALUES (%s, %s, %s);"
            cursor.executemany(insert_sql, initial_data) # 执行批量插入
            
        conn.commit() # 提交所有建库、建表和插入数据的操作
        logging.info("数据库和表初始化成功并已提交。")
        return db_name # 返回创建的数据库名
    finally: # 无论成功与否
        if 'conn' in locals() and conn.open: # 检查连接是否存在并打开
            conn.close() # 关闭连接

def perform_transactional_transfer(config, from_id, to_id, amount):
    """
    执行一次事务性的银行转账操作。
    :param config: 数据库配置。
    :param from_id: 付款方账户 ID。
    :param to_id: 收款方账户 ID。
    :param amount: 转账金额。
    """
    logging.info(f"\n--- 开始执行转账: 从账户 {
     from_id} 到 {
     to_id}，金额 {
     amount} ---")
    
    # 使用 with 语句自动管理连接的生命周期
    try: # 外层 try 用于捕获连接错误
        with pymysql.connect(**config) as conn: # `with` 语句确保 conn.clo

你可能感兴趣的:(python,开发语言)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

【Python】PyMySQL

第一章：基石之下——解密 Python 与 MySQL 的网络通信协议

1.1 万物之始：数据库客户端-服务器模型与网络套接字

1.2 MySQL 通信协议深度剖析：握手、认证与指令交换

1.2.1 连接阶段：至关重要的初次“握手” (Handshake)

1.3 动手实践：用 Python socket 模拟 MySQL 握手

1.4 命令阶段：客户端与服务器的 SQL 对话

1.4.1 命令包的通用结构

1.4.2 COM_QUERY：执行 SQL 语句的核心命令

1.4.3 服务器的响应：一个远比想象中复杂的舞蹈

1.5 动手实践：发送 COM_QUERY 并手动解析结果集

第二章：PyMySQL 的首次亮相：从连接到游标的优雅抽象

2.1 pymysql.connect()：封装了握手协议的艺术

2.2 连接对象 (Connection): 不仅仅是一条管道

2.2.1 connection.cursor(): 创建命令执行者

2.2.2 事务控制：commit() 与 rollback()

2.2.3 生命周期管理：close() 与 Python 的 with 语句

2.2.4 connection.ping(): 探测连接的脉搏