wolf犭良

22、Python 多线程编程与GIL锁机制深度解析

Python 多线程编程与GIL锁机制深度解析

引言：多线程的意义与挑战

在Python并发编程领域，多线程技术因其轻量级和易用性广受欢迎。然而全球解释器锁（GIL）的存在使得Python多线程在CPU密集型任务中表现特殊。本文将通过理论解析、代码实战和性能测试，带你全面掌握线程同步机制，深入理解GIL的工作机制，并提供绕过性能瓶颈的解决方案。

一、多线程编程基础

1.1 线程创建方式

Python通过threading模块提供线程操作支持，以下是两种经典创建方式：

方式一：继承Thread类

import threading

class DownloadThread(threading.Thread):
    def __init__(self, url):
        super().__init__()
        self.url = url
    
    def run(self):
        print(f"开始下载 {self.url}")
        # 模拟下载耗时
        time.sleep(2)
        print(f"完成下载 {self.url}")

if __name__ == "__main__":
    t1 = DownloadThread("https://example.com/file1.zip")
    t2 = DownloadThread("https://example.com/file2.zip")
    t1.start()  # 启动线程
    t2.start()
    t1.join()   # 等待线程结束
    t2.join()

方式二：传递可调用对象

def download_task(url):
    print(f"开始下载 {url}")
    time.sleep(2)
    print(f"完成下载 {url}")

t = threading.Thread(target=download_task, args=("https://example.com/file3.zip",))
t.start()
t.join()

关键点说明：

start()方法触发线程执行，而非直接调用run()
join()用于阻塞主线程直至子线程完成
daemon属性控制线程是否随主线程退出

二、GIL锁机制深度剖析

2.1 GIL工作原理

全局解释器锁（Global Interpreter Lock）是CPython解释器的核心机制，表现为：

同一时刻仅允许单个线程执行字节码
线程切换发生在字节码边界或I/O阻塞时
对纯Python代码影响显著，但对C扩展可能无效

2.2 CPU密集型任务测试

def countdown(n):
    while n > 0:
        n -= 1

# 单线程执行
start = time.time()
countdown(100000000)
print(f"单线程耗时: {time.time() - start:.2f}s")

# 多线程执行
t1 = threading.Thread(target=countdown, args=(50000000,))
t2 = threading.Thread(target=countdown, args=(50000000,))
start = time.time()
t1.start(); t2.start()
t1.join(); t2.join()
print(f"双线程耗时: {time.time() - start:.2f}s")

典型输出结果：

单线程耗时: 3.12s
双线程耗时: 3.25s  # 多线程反而更慢！

2.3 突破GIL限制的方案

方案	适用场景	实现方式
多进程	CPU密集型	multiprocessing模块
C扩展	关键代码优化	Cython/Numba
异步IO	I/O密集型	asyncio库
Jython实现	全场景	使用无GIL的解释器

三、线程池高效管理

3.1 ThreadPoolExecutor使用

from concurrent.futures import ThreadPoolExecutor
import requests

def download_page(url):
    resp = requests.get(url)
    return len(resp.content)

urls = ["https://www.baidu.com"] * 10

with ThreadPoolExecutor(max_workers=4) as executor:
    # 提交任务
    futures = [executor.submit(download_page, url) for url in urls]
    # 获取结果
    results = [f.result() for f in futures]

print(f"下载总字节数: {sum(results)}")

特性说明：

自动管理线程生命周期
支持上下文管理器协议
提供map()方法简化批量任务

四、线程同步机制详解

4.1 互斥锁(threading.Lock())

import threading
import time


class Account:
    def __init__(self):
        self.balance = 0
        self.lock = threading.Lock()

    def deposit(self, amount):
        with self.lock:  # 自动获取和释放锁
            new_balance = self.balance + amount
            time.sleep(0.001)  # 增加竞争概率
            self.balance = new_balance


account = Account()
threads = []
for _ in range(100):
    t = threading.Thread(target=account.deposit, args=(1,))
    threads.append(t)
    t.start()

for t in threads:
    t.join()

print(f"最终余额: {account.balance}")  # 正确应为100

4.2 事件通知(threading.Event())

import threading
import time

# 定义一个下载调度器类
class DownloadScheduler:
    def __init__(self):
        # 初始化一个 threading.Event 对象
        # Event 对象可以用于线程间的通信，它有一个内部标志，默认为 False
        self.event = threading.Event()

    def prepare_data(self):
        # 打印提示信息，表示开始准备数据
        print("准备数据...")
        # 模拟准备数据的耗时操作，暂停 2 秒
        time.sleep(2)
        # 调用 set 方法将 Event 对象的内部标志设置为 True
        # 这会通知所有等待该事件的线程可以继续执行
        self.event.set()

    def start_download(self):
        # 调用 wait 方法，线程会阻塞在这里，直到 Event 对象的内部标志变为 True
        # 也就是等待 prepare_data 方法调用 set 方法
        self.event.wait()
        # 当事件被触发后，打印提示信息，表示开始下载
        print("开始下载...")

# 创建 DownloadScheduler 类的一个实例
scheduler = DownloadScheduler()

# 创建一个新线程，目标函数为 scheduler.prepare_data，并启动该线程
# 这个线程负责准备数据
threading.Thread(target=scheduler.prepare_data).start()

# 创建另一个新线程，目标函数为 scheduler.start_download，并启动该线程
# 这个线程会等待数据准备好后开始下载
threading.Thread(target=scheduler.start_download).start()

4.3 条件变量(threading.Condition())

生产者-消费者模型实现：

import threading

# 定义消息队列类
class MessageQueue:
    def __init__(self):
        # 初始化一个空列表用于存储消息
        self.queue = []
        # 初始化一个条件变量，用于线程间的同步
        self.cond = threading.Condition()

    def put(self, msg):
        # 使用条件变量的上下文管理器，自动获取锁
        with self.cond:
            # 将消息添加到队列中
            self.queue.append(msg)
            # 唤醒一个等待在该条件变量上的线程
            self.cond.notify()

    def get(self):
        # 使用条件变量的上下文管理器，自动获取锁
        with self.cond:
            # 当队列中没有消息时，线程进入等待状态
            while not self.queue:
                # 自动释放锁并等待其他线程唤醒
                self.cond.wait()
            # 从队列头部取出并返回消息
            return self.queue.pop(0)

# 生产者函数，用于向消息队列中添加消息
def producer(queue):
    for i in range(5):
        # 模拟生产消息
        message = f"Message {i}"
        print(f"Producing {message}")
        # 将消息放入队列
        queue.put(message)
        # 模拟生产耗时
        threading.Event().wait(1)

# 消费者函数，用于从消息队列中取出消息
def consumer(queue):
    for i in range(5):
        # 从队列中获取消息
        message = queue.get()
        print(f"Consuming {message}")

if __name__ == "__main__":
    # 创建消息队列实例
    queue = MessageQueue()

    # 创建生产者线程
    producer_thread = threading.Thread(target=producer, args=(queue,))
    # 创建消费者线程
    consumer_thread = threading.Thread(target=consumer, args=(queue,))

    # 启动生产者线程
    producer_thread.start()
    # 启动消费者线程
    consumer_thread.start()

    # 等待生产者线程执行完毕
    producer_thread.join()
    # 等待消费者线程执行完毕
    consumer_thread.join()

    print("All tasks are done.")

五、性能优化与实战案例

5.1 I/O密集型任务对比测试

import time
from concurrent.futures import ThreadPoolExecutor

# 定义一个模拟 I/O 任务的函数
def test_io_task():
    # 模拟数据库查询操作，让线程休眠 0.1 秒
    time.sleep(0.1)

# 定义一个单线程执行任务的函数
def run_single_thread():
    # 记录开始时间
    start = time.time()
    # 循环执行 100 次模拟 I/O 任务
    for _ in range(100):
        test_io_task()
    # 记录结束时间，并计算耗时，保留两位小数输出
    print(f"单线程耗时: {time.time() - start:.2f}s")

# 定义一个使用线程池执行任务的函数
def run_multi_thread():
    # 记录开始时间
    start = time.time()
    # 创建一个最大线程数为 20 的线程池，并使用上下文管理器管理其生命周期
    with ThreadPoolExecutor(20) as executor:
        # 利用线程池中的线程并发执行 100 次模拟 I/O 任务
        executor.map(test_io_task, range(100))
    # 记录结束时间，并计算耗时，保留两位小数输出
    print(f"20线程池耗时: {time.time() - start:.2f}s")

# 调用单线程执行任务的函数
run_single_thread()   # 约10.2秒
# 调用使用线程池执行任务的函数
run_multi_thread()    # 约0.6秒

5.2 混合型任务处理策略

from multiprocessing import Pool
import os
import time
from concurrent.futures import ThreadPoolExecutor

# CPU密集型任务函数，计算 0 到 n-1 的平方和
def cpu_bound(n):
    return sum(i * i for i in range(n))

# I/O密集型任务函数，模拟 I/O 操作（睡眠 0.1 秒），并返回当前进程的 ID
def io_bound(url):
    time.sleep(0.1)
    return os.getpid()

if __name__ == '__main__':
    # CPU密集型使用进程池
    with Pool(4) as p:
        # 使用进程池并行执行 cpu_bound 函数，参数为 [10**6]*4，即 4 个 10**6
        # p.map 会将 cpu_bound 函数应用到列表的每个元素上，并返回结果列表
        print(p.map(cpu_bound, [10**6]*4))

    # I/O密集型使用线程池
    with ThreadPoolExecutor(10) as executor:
        # 使用线程池并行执行 io_bound 函数，参数为 ["url"]*10，即 10 个 "url"
        # executor.map 会将 io_bound 函数应用到列表的每个元素上，并返回结果迭代器，转换为列表输出
        print(list(executor.map(io_bound, ["url"]*10)))

六、练习题与思考

6.1 死锁场景复现

lockA = threading.Lock()
lockB = threading.Lock()

def thread1():
    with lockA:
        time.sleep(1)
        with lockB:  # 此处将阻塞
            print("Thread1完成")

def thread2():
    with lockB:
        time.sleep(1)
        with lockA:  # 此处将阻塞
            print("Thread2完成")

# 启动两个线程观察现象

挑战： 如何修改代码避免死锁？

方法一：按相同顺序获取锁
方法二：在获取锁时设置超时时间，如果在规定时间内无法获取到锁，则放弃获取，避免无限期等待。这种可能会使程序不能正确执行达到预期效果（可以用超时后释放锁，等待一定时间后再执行的方式）
方法三：使用 contextlib 中的 ExitStack 一次性获取多个锁

6.2 生产者消费者模型实现

要求：

使用Condition实现缓冲区
支持多生产者和多消费者
当缓冲区满时生产者等待
当缓冲区空时消费者等待

import threading
import time

# 缓冲区大小
BUFFER_SIZE = 5
# 缓冲区
buffer = []
# 条件变量
condition = threading.Condition()

# 生产者函数
def producer(id):
    global buffer
    while True:
        with condition:
            # 当缓冲区满时，生产者等待
            while len(buffer) == BUFFER_SIZE:
                print(f"生产者 {id} 发现缓冲区已满，等待...")
                condition.wait()
            # 生产一个数据
            item = f"Item-{id}"
            buffer.append(item)
            print(f"生产者 {id} 生产了 {item}，当前缓冲区: {buffer}")
            # 通知可能正在等待的消费者
            condition.notify_all()
        # 模拟生产耗时
        time.sleep(1)

# 消费者函数
def consumer(id):
    global buffer
    while True:
        with condition:
            # 当缓冲区为空时，消费者等待
            while len(buffer) == 0:
                print(f"消费者 {id} 发现缓冲区为空，等待...")
                condition.wait()
            # 消费一个数据
            item = buffer.pop(0)
            print(f"消费者 {id} 消费了 {item}，当前缓冲区: {buffer}")
            # 通知可能正在等待的生产者
            condition.notify_all()
        # 模拟消费耗时
        time.sleep(1)

if __name__ == "__main__":
    # 创建生产者线程
    producers = [threading.Thread(target=producer, args=(i,)) for i in range(2)]
    # 创建消费者线程
    consumers = [threading.Thread(target=consumer, args=(i,)) for i in range(2)]

    # 启动生产者线程
    for p in producers:
        p.start()
    # 启动消费者线程
    for c in consumers:
        c.start()

    # 等待所有线程结束（这里实际上不会结束，因为是无限循环）
    for p in producers:
        p.join()
    for c in consumers:
        c.join()

6.3 性能对比实验

设计实验对比以下场景：

纯计算任务（如素数计算）在单线程、多线程、多进程中的表现
网络请求任务在不同线程池大小下的性能曲线
混合任务中进程池+线程池的组合效果

import time
import threading
import multiprocessing


# 判断一个数是否为素数
def is_prime(n):
    if n < 2:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True


# 单线程计算素数
def single_threaded(n):
    primes = []
    for i in range(n):
        if is_prime(i):
            primes.append(i)
    return primes


# 多线程计算素数
def multi_threaded(n, num_threads):
    def worker(start, end, result):
        local_primes = []
        for i in range(start, end):
            if is_prime(i):
                local_primes.append(i)
        result.extend(local_primes)

    chunk_size = n // num_threads
    threads = []
    results = [[] for _ in range(num_threads)]

    for i in range(num_threads):
        start = i * chunk_size
        end = start + chunk_size if i < num_threads - 1 else n
        t = threading.Thread(target=worker, args=(start, end, results[i]))
        threads.append(t)
        t.start()

    for t in threads:
        t.join()

    primes = []
    for res in results:
        primes.extend(res)
    return primes


# 多进程计算素数
def multi_processed(n, num_processes):
    def worker(start, end, queue):
        local_primes = []
        for i in range(start, end):
            if is_prime(i):
                local_primes.append(i)
        queue.put(local_primes)

    chunk_size = n // num_processes
    processes = []
    queue = multiprocessing.Queue()

    for i in range(num_processes):
        start = i * chunk_size
        end = start + chunk_size if i < num_processes - 1 else n
        p = multiprocessing.Process(target=worker, args=(start, end, queue))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

    primes = []
    while not queue.empty():
        primes.extend(queue.get())
    return primes


if __name__ == "__main__":
    n = 100000
    num_threads = 4
    num_processes = 4

    # 单线程
    start_time = time.time()
    single_threaded(n)
    single_time = time.time() - start_time
    print(f"单线程耗时: {single_time:.4f} 秒")

    # 多线程
    start_time = time.time()
    multi_threaded(n, num_threads)
    multi_thread_time = time.time() - start_time
    print(f"多线程（{num_threads} 线程）耗时: {multi_thread_time:.4f} 秒")

    # 多进程
    start_time = time.time()
    multi_processed(n, num_processes)
    multi_process_time = time.time() - start_time
    print(f"多进程（{num_processes} 进程）耗时: {multi_process_time:.4f} 秒")

结语：选择正确的并发模型

理解GIL机制是掌握Python并发的关键。对于I/O密集型任务，多线程仍然是高效选择；而CPU密集型任务应考虑多进程或混合编程。合理使用线程同步工具和线程池，结合asyncio等异步方案，才能最大化发挥Python的并发潜力。

学习路线建议：

掌握本文的同步原语
学习multiprocessing模块
研究asyncio异步编程模型
了解分布式任务队列（Celery）

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d