ftpeak

Python并发多进程编程

一、多进程（Multiprocessing）

多进程是指在操作系统中同时运行多个进程，每个进程都有自己独立的内存空间和系统资源。Python 的multiprocessing模块提供了多进程编程的支持。

优点

可以利用多核 CPU 的优势，并行执行任务，提高程序的运行效率。
各个进程之间相互独立，一个进程的崩溃不会影响其他进程。

缺点

进程的创建和销毁开销较大。
进程之间的通信和数据共享相对复杂。

代码示例

import multiprocessing

# 定义一个简单的任务函数
def worker(num):
    """进程要执行的任务"""
    # 打印当前工作进程的编号，表示该进程已开始执行任务
    print(f'Worker {num} started')
    # 计算当前工作进程编号的平方，作为任务的结果
    result = num * num
    # 打印当前工作进程的编号和任务结果，表示该进程已完成任务
    print(f'Worker {num} finished with result: {result}')
    # 返回任务结果
    return result

if __name__ == '__main__':
    # 创建一个进程池，最多同时运行3个进程
    pool = multiprocessing.Pool(processes=3)
    # 向进程池提交任务
    results = [pool.apply_async(worker, args=(i,)) for i in range(5)]
    # 关闭进程池，不再接受新的任务
    pool.close()
    # 等待所有进程完成任务
    pool.join()
    # 获取每个进程的返回结果
    output = [p.get() for p in results]
    # 打印最终结果，即所有进程执行任务后的返回结果
    print(f'Final results: {output}')

二、充分利用CPU

multiprocessing.Pool 并不是最多只能同时运行 3 个进程，在创建 Pool 对象时，processes 参数指定了进程池中的进程数量，示例代码中设置为 3 只是一个示例，你可以根据实际需求调整该参数。

如何全面使用 16 核 CPU？

当你的 CPU 是 16 核时，你可以将 processes 参数设置为 16，这样进程池就会创建 16 个进程，理论上可以充分利用 CPU 的多核性能。不过，在实际应用中，还需要考虑系统资源的其他使用情况（如内存），有时候并不一定需要将进程数量设置得和 CPU 核心数完全一致。

下面是一个示例代码，展示了如何将 processes 参数设置为 16 来充分利用 16 核 CPU：

import multiprocessing

# 定义一个简单的任务函数，模拟 CPU 密集型任务
def worker(num):
    """进程要执行的任务"""
    # 打印当前进程的开始信息
    print(f'Worker {num} started')
    # 模拟一些 CPU 密集型计算
    # 初始化结果变量
    result = 0
    # 循环从0到999999
    for i in range(1000000):
        # 将当前循环变量i累加到结果变量result中
        result += i
    # 打印当前进程的完成信息
    print(f'Worker {num} finished')
    # 返回累加结果
    return result

if __name__ == '__main__':
    # 获取 CPU 的核心数
    cpu_count = multiprocessing.cpu_count()
    print(f"CPU 核心数: {cpu_count}")

    # 创建一个进程池，进程数量设置为 CPU 核心数
    pool = multiprocessing.Pool(processes=cpu_count)
    # 向进程池提交任务，这里假设要执行 20 个任务
    results = [pool.apply_async(worker, args=(i,)) for i in range(20)]
    # 关闭进程池，不再接受新的任务
    pool.close()
    # 等待所有进程完成任务
    pool.join()
    # 获取每个进程的返回结果
    output = [p.get() for p in results]
    # 打印最终结果列表的长度
    print(f'Final results length: {len(output)}')

代码解释

multiprocessing.cpu_count()：用于获取当前系统的 CPU 核心数。
multiprocessing.Pool(processes=cpu_count)：创建一个进程池，进程数量设置为 CPU 核心数，这样可以充分利用多核 CPU 的性能。
pool.apply_async(worker, args=(i,))：向进程池异步提交任务，worker 是任务函数，args 是传递给任务函数的参数。
pool.close()：关闭进程池，不再接受新的任务。
pool.join()：等待所有进程完成任务。
p.get()：获取每个进程的返回结果。

注意事项

虽然设置进程数量为 CPU 核心数可以充分利用多核性能，但在实际应用中，还需要考虑内存等其他系统资源的使用情况。如果任务需要大量的内存，过多的进程可能会导致内存不足。
对于 I/O 密集型任务，使用多进程可能并不是最佳选择，异步编程或多线程可能更合适。

三、多进程之间的通讯和数据共享

在 Python 多进程编程中，由于每个进程都有自己独立的内存空间，进程间的通讯（Inter - Process Communication，IPC）和数据共享就变得尤为重要。下面说明几种常见的进程间通讯和数据共享的方式：

1. `Queue`（队列）

multiprocessing.Queue 是一个线程和进程安全的队列，可用于在多个进程间传递数据。

示例代码

import multiprocessing

def producer(queue):
    # 生产者进程，向队列中放入数据
    for i in range(5):
        queue.put(i)
        print(f"Produced {i}")

def consumer(queue):
    # 消费者进程，从队列中取出数据
    while True:
        item = queue.get()
        if item is None:
            break
        print(f"Consumed {item}")

if __name__ == '__main__':
    # 创建一个队列
    queue = multiprocessing.Queue()
    # 创建生产者进程
    p1 = multiprocessing.Process(target=producer, args=(queue,))
    # 创建消费者进程
    p2 = multiprocessing.Process(target=consumer, args=(queue,))

    p1.start()
    p2.start()

    p1.join()
    # 向队列中放入 None 作为结束信号
    queue.put(None)
    p2.join()

    print("All processes finished.")

代码解释

multiprocessing.Queue()：创建一个队列对象。
queue.put(item)：将数据 item 放入队列。
queue.get()：从队列中取出数据。

2. `Pipe`（管道）

multiprocessing.Pipe 返回一对连接对象，可用于在两个进程间进行双向通讯。

示例代码

import multiprocessing

def sender(conn):
    # 发送进程，向管道发送数据
    messages = ["Hello", "World", "!"]
    for message in messages:
        conn.send(message)
        print(f"Sent: {message}")
    conn.close()

def receiver(conn):
    # 接收进程，从管道接收数据
    while True:
        try:
            message = conn.recv()
            print(f"Received: {message}")
        except EOFError:
            break
    conn.close()

if __name__ == '__main__':
    # 创建一个管道，返回两个连接对象
    parent_conn, child_conn = multiprocessing.Pipe()
    # 创建发送进程
    p1 = multiprocessing.Process(target=sender, args=(child_conn,))
    # 创建接收进程
    p2 = multiprocessing.Process(target=receiver, args=(parent_conn,))

    p1.start()
    p2.start()

    p1.join()
    p2.join()

    print("All processes finished.")

代码解释

multiprocessing.Pipe()：创建一个管道，返回两个连接对象 parent_conn 和 child_conn。
conn.send(data)：向管道发送数据。
conn.recv()：从管道接收数据。

3. `Value` 和 `Array`

multiprocessing.Value 和 multiprocessing.Array 可用于在多个进程间共享单个值或数组。

示例代码

import multiprocessing

def increment(counter):
    # 增加共享值
    for _ in range(1000):
        with counter.get_lock():
            counter.value += 1

if __name__ == '__main__':
    # 创建一个共享的整数对象
    counter = multiprocessing.Value('i', 0)
    processes = []
    # 创建多个进程
    for _ in range(4):
        p = multiprocessing.Process(target=increment, args=(counter,))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

    print(f"Final counter value: {counter.value}")

代码解释

multiprocessing.Value('i', 0)：创建一个共享的整数对象，初始值为 0。'i' 表示整数类型。
counter.get_lock()：获取锁，确保在修改共享值时不会发生数据竞争。
counter.value：访问共享值。

4. `Manager`

multiprocessing.Manager 提供了一种更高级的方式来实现进程间的数据共享，它可以创建共享的列表、字典等对象。

示例代码

import multiprocessing

def worker(dictionary, key, value):
    # 向共享字典中添加键值对
    dictionary[key] = value

if __name__ == '__main__':
    # 创建一个管理器对象
    manager = multiprocessing.Manager()
    # 创建一个共享的字典
    shared_dict = manager.dict()
    processes = []
    # 创建多个进程
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(shared_dict, i, i * 2))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

    print(f"Shared dictionary: {shared_dict}")

代码解释

multiprocessing.Manager()：创建一个管理器对象。
manager.dict()：创建一个共享的字典对象。
可以像操作普通字典一样操作共享字典。

通过上述四种方式，你可以在 Python 多进程编程中实现进程间的通讯和数据共享。不同的方式适用于不同的场景，你可以根据具体需求选择合适的方法。

四、Python多进程方式的独特优势

1. 充分利用多核 CPU

在现代计算机系统中，CPU 通常具有多个核心。然而，由于 Python 的全局解释器锁（GIL）的存在，多线程在处理 CPU 密集型任务时并不能充分发挥多核 CPU 的性能优势。而 multiprocessing 模块可以创建多个独立的进程，每个进程都有自己独立的 Python 解释器实例和内存空间，它们可以并行地在不同的 CPU 核心上运行，从而充分利用多核 CPU 的计算能力，显著提高程序在 CPU 密集型任务上的执行效率。

2. 提高程序的稳定性

由于每个进程都是相互独立的，一个进程的崩溃不会影响其他进程的正常运行。如果在多线程编程中，某个线程出现了未处理的异常，可能会导致整个进程崩溃，从而影响其他线程的执行。而在多进程编程中，各个进程之间相互隔离，一个进程的异常只会导致该进程终止，其他进程可以继续正常工作，从而提高了程序的整体稳定性。

3. 数据安全性高

每个进程都有自己独立的内存空间，进程之间的数据是相互隔离的。这意味着在一个进程中对数据的修改不会影响其他进程中的数据，避免了多线程编程中常见的数据竞争和并发访问问题，提高了数据的安全性。当需要对数据进行并发处理时，只需将数据复制到各个进程中进行处理，处理完成后再进行汇总即可。

4. 适合处理复杂任务

multiprocessing 模块提供了丰富的进程管理和通信机制，如 Process 类用于创建和管理进程，Queue、Pipe 用于进程间通信，Value、Array 和 Manager 用于进程间数据共享等。这些功能使得 multiprocessing 非常适合处理复杂的任务，例如分布式计算、大规模数据处理等。可以将一个复杂的任务分解为多个子任务，每个子任务由一个独立的进程来处理，通过进程间的通信和协作完成整个任务。

5. 易于使用和集成

multiprocessing 模块的 API 设计简洁明了，易于学习和使用。它与 Python 的其他标准库和第三方库兼容性良好，可以方便地集成到现有的 Python 项目中。无论是小型脚本还是大型应用程序，都可以很容易地使用 multiprocessing 模块来实现多进程编程，提高程序的性能和并发处理能力。

五、多进程(multiprocessing)的最佳用途

multiprocessing 是 Python 标准库中用于实现多进程编程的模块，它在以下几种场景中能发挥最佳作用：

1. CPU 密集型任务

由于 Python 的全局解释器锁（GIL），多线程在处理 CPU 密集型任务时无法充分利用多核 CPU 的优势。而 multiprocessing 可以创建多个独立的进程，每个进程都有自己独立的 Python 解释器实例，能并行运行在不同的 CPU 核心上，显著提升计算效率。

适用场景举例

科学计算：如进行大规模的矩阵运算、数值模拟等。以矩阵乘法为例，对于大规模矩阵，计算量巨大，使用多进程可以将矩阵分割成多个子矩阵，每个进程负责计算一部分子矩阵的乘积，最后再合并结果。
图像和视频处理：像图像的滤镜处理、视频的编码解码等操作。例如在图像的卷积操作中，可以将图像分成多个区域，每个进程处理一个区域的卷积计算。

代码示例

import multiprocessing

def cpu_intensive_task(num):
    result = 0
    for i in range(1000000):
        result += i
    return result

if __name__ == '__main__':
    pool = multiprocessing.Pool(processes=multiprocessing.cpu_count())
    tasks = [i for i in range(10)]
    results = pool.map(cpu_intensive_task, tasks)
    pool.close()
    pool.join()
    print("All CPU - intensive tasks are done.")

2. 并行处理大量独立任务

当有大量相互独立的任务需要处理时，使用 multiprocessing 可以并行执行这些任务，从而大大缩短整体处理时间。

适用场景举例

数据批量处理：例如对大量文件进行数据分析、转换或清洗。可以将文件列表分成多个部分，每个进程负责处理一部分文件。
网页爬虫：在爬取多个网站或大量网页时，每个网页的爬取任务可以看作是独立的，使用多进程可以同时发起多个爬取请求，提高爬取效率。

代码示例

import multiprocessing

def process_file(file_path):
    # 模拟文件处理操作
    print(f"Processing {file_path}")
    return file_path

if __name__ == '__main__':
    file_paths = [f"file_{i}.txt" for i in range(20)]
    pool = multiprocessing.Pool(processes=4)
    results = pool.map(process_file, file_paths)
    pool.close()
    pool.join()
    print("All file processing tasks are done.")

3. 提高程序的稳定性和可靠性

由于每个进程都是相互独立的，一个进程的崩溃不会影响其他进程的正常运行。因此，在对程序稳定性要求较高的场景中，multiprocessing 是一个很好的选择。

适用场景举例

服务器端应用：例如 Web 服务器、数据库服务器等。当处理多个客户端请求时，每个请求可以由一个独立的进程来处理，这样即使某个请求处理过程中出现异常，也不会影响其他请求的处理。
长时间运行的后台任务：如监控系统、定时任务等。使用多进程可以确保某个任务的失败不会导致整个系统崩溃。

4. 复杂任务的并行分解

对于一些复杂的任务，可以将其分解为多个子任务，每个子任务由一个独立的进程来处理，通过进程间的通信和协作完成整个任务。

适用场景举例

分布式计算：在分布式系统中，将一个大的计算任务分解成多个小任务，分配给不同的进程或节点进行计算，最后汇总结果。
人工智能训练：在深度学习模型训练中，可以将数据分割成多个批次，每个进程负责训练一个批次的数据，加速训练过程。

代码示例（简单的任务分解）

import multiprocessing

def subtask(task_id, result_queue):
    # 模拟子任务处理
    result = task_id * 2
    result_queue.put(result)

if __name__ == '__main__':
    result_queue = multiprocessing.Queue()
    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=subtask, args=(i, result_queue))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

    final_results = []
    while not result_queue.empty():
        final_results.append(result_queue.get())
    print("Final results:", final_results)

综上所述，multiprocessing 在 CPU 密集型任务、并行处理大量独立任务、提高程序稳定性以及复杂任务的并行分解等方面具有显著优势，是 Python 中实现高效并发编程的重要工具。

六、多进程(multiprocessing)最不适宜的用途

multiprocessing 模块虽然在很多场景下非常有用，但也存在一些不太适宜使用的情况，以下是具体介绍：

1. 简单的 I/O 密集型任务

对于简单的 I/O 密集型任务，如少量的文件读写、简单的网络请求等，使用 multiprocessing 并不是一个好的选择，原因如下：

进程创建和销毁开销大：创建新进程需要分配系统资源，包括内存和 CPU 时间等。在简单的 I/O 密集型任务中，进程创建和销毁的开销可能会远远超过任务本身的执行时间，导致性能下降。
上下文切换开销：进程之间的上下文切换也需要消耗系统资源。对于简单的 I/O 操作，频繁的进程切换会增加额外的开销，降低程序的整体效率。

示例场景：一个脚本需要依次读取几个小文件的内容，使用单线程或多线程通常会比多进程更高效。

代码示例（不适合用多进程的情况）：

import multiprocessing

def read_file(file_path):
    with open(file_path, 'r') as f:
        content = f.read()
    return content

if __name__ == '__main__':
    file_paths = ['file1.txt', 'file2.txt', 'file3.txt']
    # 这里使用多进程处理简单文件读取，效率不高
    pool = multiprocessing.Pool(processes=len(file_paths))
    results = pool.map(read_file, file_paths)
    pool.close()
    pool.join()
    print(results)

更好的做法是使用单线程：

def read_file(file_path):
    with open(file_path, 'r') as f:
        content = f.read()
    return content

file_paths = ['file1.txt', 'file2.txt', 'file3.txt']
results = []
for file_path in file_paths:
    results.append(read_file(file_path))
print(results)

2. 资源受限的环境

在资源受限的环境中，如内存有限的嵌入式设备或运行在资源紧张的服务器上，使用 multiprocessing 可能会导致系统资源耗尽，出现以下问题：

内存占用高：每个进程都有自己独立的内存空间，创建多个进程会占用大量的内存。如果系统内存不足，可能会导致程序崩溃或系统性能急剧下降。
CPU 资源竞争：过多的进程会竞争 CPU 资源，导致系统负载过高，影响其他程序的正常运行。

3. 任务间高度依赖和频繁通信的场景

当任务之间存在高度依赖关系，需要频繁进行数据交换和同步时，multiprocessing 可能不是最佳选择，因为：

进程间通信成本高：进程间通信（IPC）需要通过特定的机制，如队列、管道等，这些机制的实现会带来一定的开销。频繁的 IPC 操作会降低程序的性能。
同步难度大：为了保证数据的一致性和正确性，需要进行复杂的同步操作，如加锁等。这会增加代码的复杂度，并且可能引入死锁等问题。

示例场景：一个任务需要等待另一个任务的中间结果才能继续执行，并且这种交互非常频繁，使用多线程或异步编程可能更合适。

4. 代码复杂度要求低的简单脚本

对于一些简单的脚本，开发者可能更注重代码的简洁性和易维护性。使用 multiprocessing 会引入进程管理、进程间通信等复杂的概念，增加代码的复杂度。在这种情况下，单线程或简单的多线程实现可能更符合需求。

示例：一个简单的脚本用于计算一组数字的总和，使用单线程代码会更简洁易懂：

numbers = [1, 2, 3, 4, 5]
total = sum(numbers)
print(total)

而使用多进程来实现会使代码变得复杂，且没有明显的性能提升。

七、笔者（老司机）的告诫

1、资源管理方面

合理分配进程数：别盲目多开进程，依任务类型和系统核心数设置，CPU 密集型接近物理核心数，I/O 密集型可多些，否则会因创建、切换开销大而拖慢性能。
关注内存占用：每个进程有独立内存空间，多进程会大量占内存，资源受限环境易致系统崩溃，要做好内存规划。

2、代码编写方面

遵守启动方法规则：不同操作系统启动进程方法有别，Windows 和 macOS 默认 spawn，Linux 默认 fork，确保代码在不同系统兼容。
小心全局变量：各进程有独立内存，全局变量不共享，修改全局变量不会影响其他进程，别依赖全局变量通信。

3、进程间协作方面

通信要高效：进程通信靠队列、管道等，频繁通信开销大，尽量减少通信次数和数据量。
同步要谨慎：涉及共享资源访问，用锁机制同步，操作不当会引发死锁，加锁范围要最小化（能不用，就不用）。

4、调试和维护方面

调试有难度：多进程调试复杂，一个进程崩溃不影响其他，可多打日志，用单进程先调试逻辑。
代码可维护性：多进程增加代码复杂度，合理划分功能模块，写好注释，提高代码可读性和可维护性。

你可能感兴趣的:(Python,网络爬虫,python,开发语言,前端)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
vue element 封装表单影子信息 vue vue.js javascript 前端
背景：在前端系统开发中，系统页面涉及到的表单组件比较多，所以进行了简单的封装。封装的包括一些Form表单组件，如下：input输入框、select下拉框、等实现效果：理论知识：表单组件官方链接：点击跳转封装组件：封装组件的思路：不封装element组件，每一个input组件绑定一个form对象，例如官网。简单封装element组件，利用for循环生成form表单的每一项el-form-item。进
前端面试每日 3+1 —— 第39天浪子神剑
今天的面试题(2019.05.25)——第39天[html]title与h1、b与strong、i与em的区别分别是什么？[css]写出你知道的CSS水平和垂直居中的方法[js]说说你对模块化的理解[软技能]公钥加密和私钥加密是什么？《论语》，曾子曰：“吾日三省吾身”（我每天多次反省自己）。前端面试每日3+1题，以面试题来驱动学习，每天进步一点！让努力成为一种习惯，让奋斗成为一种享受！欢迎在Iss
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
【Java Web实战】从零到一打造企业级网上购书网站系统 | 完整开发实录（三）笙囧同学 java 前端状态模式
核心功能设计用户管理系统用户管理是整个系统的基础，我设计了完整的用户生命周期管理：用户注册流程验证失败验证通过验证失败验证通过用户名已存在用户名可用失败成功用户访问注册页面填写注册信息前端表单验证显示错误提示提交到后端后端数据验证返回错误信息用户名唯一性检查提示用户名重复密码加密处理保存用户信息保存成功?显示系统错误注册成功跳转登录页面登录认证机制深度解析我实现了一套企业级的多层次安全认证机制：认
从零到一：打造基于GigaChat AI的艺术创作平台 | 笙囧同学的全栈开发实战
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯前言在AI技术飞速发展的今天，如何将前沿的大模型技术与实际应用相结合，一直是我们开发者关注的焦点。今天，笙囧同学将带大家从零开始，构建一个基于GigaChatAI的艺术创作平台，实现React前端+Django后端的完整全栈解决方案。这不仅仅是
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

Python并发多进程编程

一、多进程（Multiprocessing）

优点

缺点

二、充分利用CPU

如何全面使用 16 核 CPU？

三、多进程之间的通讯和数据共享

1. Queue（队列）

2. Pipe（管道）

3. Value 和 Array

4. Manager

四、Python多进程方式的独特优势

1. 充分利用多核 CPU

2. 提高程序的稳定性

3. 数据安全性高

4. 适合处理复杂任务

5. 易于使用和集成

五、多进程(multiprocessing)的最佳用途

1. CPU 密集型任务

2. 并行处理大量独立任务

3. 提高程序的稳定性和可靠性

4. 复杂任务的并行分解

六、多进程(multiprocessing)最不适宜的用途

1. 简单的 I/O 密集型任务

2. 资源受限的环境

3. 任务间高度依赖和频繁通信的场景

4. 代码复杂度要求低的简单脚本

七、笔者（老司机）的告诫

1、资源管理方面

2、代码编写方面

3、进程间协作方面

4、调试和维护方面

你可能感兴趣的:(Python,网络爬虫,python,开发语言,前端)

1. `Queue`（队列）

2. `Pipe`（管道）

3. `Value` 和 `Array`

4. `Manager`