SEEONTIME

python-20-理解多进程多线程，进程池，线程池，进程间通信最详细整理！

python-20-多进程多线程详解

一.说明

在python中的基础系列我们终于来到了多进程和多线程的知识点了，在学习这个知识点前，我想问问都是用来进行并发处理的，为啥要区分多进程多线程？或者说什么是多进程什么是多线程？

多进程：

1.多进程是通过创建多个独立的进程来并行执行任务

举个例子：你电脑是8核心的，那么可以创建超过8个进程，但是超过8个进程会导致上下文切换开销增加，从而导致降低性能！

说句人话，当进程数小于cpu核心数，每个进程都能分配到自己的核心进行运行，不必进行进程切换，从而没有切换上下文的开销！！

所以，多进程并不是越多越好！！

多线程：

线程是程序中执行流的最小单元，一个进程可以包含多个线程;
多线程是通过在同一进程中创建多个线程来并发执行任务，如果任务是 I/O 密集型的（例如网络请求、文件操作），由于 GIL 释放给了 I/O 操作，其他线程可以在 GIL 被释放时执行，因此多线程仍然能够在 I/O 密集型任务中提高并发性能。
多个线程共享同一进程的内存空间和资源，线程之间的创建和切换比进程更加轻量级；
对于 CPU 密集型任务，Python 的 全局解释器锁（GIL） 会限制线程的并行执行，这就使得多线程在 CPU 密集型任务上无法提供预期的性能提升;
Python 的 全局解释器锁（GIL）:

在 Python 中，全局解释器锁（GIL） 会影响多线程的并发执行。GIL 只允许一个线程在任何时刻执行 Python 字节码，这意味着对于 CPU 密集型任务，Python 的多线程不能利用多核 CPU 的计算能力，只能在单个核心上执行。

线程池的大小不可随便确定

CPU 核心数：对于 CPU 密集型任务，线程池的大小通常不会超过 CPU 核心数，因为超出核心数的线程会增加上下文切换的开销，反而降低性能。

I/O 密集型任务：对于 I/O 密集型任务，线程池的大小可以更大，因为线程在等待 I/O 操作完成时不会占用 CPU 资源，操作系统会将 CPU 分配给其他线程。

内存和系统资源：每个线程都需要一定的内存和系统资源，过多的线程会导致内存消耗过大，甚至会导致系统资源耗尽。
线程可以跨多个 CPU 核心运行，操作系统会管理线程在核心之间的调度。

二.多进程

1. os.fork() 函数（不推荐，不能跨平台，只能Linux、Unix ）

它在当前进程的上下文中创建一个子进程。子进程是当前进程（称为父进程）的副本，但拥有自己的进程ID（PID）

`fork()` 的基本原理

返回值：
- 在父进程中，fork() 返回新创建的子进程的进程 ID。
- 在子进程中，fork() 返回 0。
- 如果创建子进程失败，fork() 返回 -1，并抛出OSError。
复制进程：子进程会复制父进程的内存空间，但实际上是采用写时复制（copy-on-write）机制，只有在需要写入时才会真正复制内存，从而节省资源。

示例

import os
import time

def main():
    pid = os.fork()  # 创建子进程

    if pid < 0:
        # fork() 失败
        print("Fork failed")
    elif pid == 0:
        # 子进程执行的代码
        print(f"Child process: My PID is {os.getpid()}")
        time.sleep(2)  # 模拟子进程工作
        print("Child process: Work done!")
    else:
        # 父进程执行的代码
        print(f"Parent process: My PID is {os.getpid()} and my child's PID is {pid}")
        os.wait()  # 等待子进程结束
        print("Parent process: Child has terminated.")

if __name__ == "__main__":
    main()

2.multiprocessing.Process()函数

multiprocessing模块提供Process类实现新建进程

import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')

if __name__ == '__main__':
    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(i,))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()
        
'''
Worker 0 starting
Worker 1 starting
Worker 2 starting
Worker 3 starting
Worker 4 starting
Worker 0 finished
Worker 1 finished
Worker 2 finished
Worker 3 finished
Worker 4 finished
'''

pool = multiprocessing.Pool(processes=5) # 创建进程池实现多进程

pool.apply() 和 pool.apply_async()：

apply()：类似于顺序调用函数，它会阻塞，直到任务执行完成。
apply_async()：异步执行任务，不会阻塞主程序。

pool.map() 和 pool.map_async()：

map()：将函数 func 应用到 iterable 中的每一个元素，返回结果列表，并且是同步执行的。
map_async()：map() 的异步版本，返回一个 AsyncResult 对象，允许你在执行期间继续做其他工作。

pool.close() 和 pool.join()：

close()：# 关闭进程池，表示不能在往进程池中添加进程
join()：# 等待进程池中的所有进程执行完毕，必须在close()之后调用

import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')

if __name__ == '__main__':
    # 创建一个进程池，最多同时运行 5 个进程
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 map 方法将任务分配给进程池，map 会阻塞，直到所有任务完成
        pool.map(worker, range(5))
        
        
        
###########利用.get()方法来阻塞和等待结果
import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    return num * 2

if __name__ == '__main__':
    # 使用进程池
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 apply_async 异步执行任务
        async_result = pool.apply_async(worker, (1,))
        print(f'Result of apply_async: {async_result.get()}')  # 阻塞等待结果

        # 使用 map_async 异步执行任务
        async_results = pool.map_async(worker, range(5))
        print(f'Result of map_async: {async_results.get()}')  # 阻塞等待所有结果
        
        
####################利用 pool.close()和pool.join()
import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    return num

if __name__ == '__main__':
    # 创建进程池，最多同时运行 5 个进程
    resList = []
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 apply_async 异步提交任务
        results = []
        for i in range(5):
            result = pool.apply_async(worker, (i,))
            results.append(result)  # 存储每个任务的 AsyncResult 对象
        
        # 关闭进程池，不再接受新任务
        pool.close()

        # 等待所有任务完成并获取结果
        for result in results:
            resList.append(result.get())  # 阻塞，等待每个任务的完成

        # 等待所有子进程结束
        pool.join()
    print(resList)
    
    '''
    Worker 0 starting
    Worker 1 starting
    Worker 2 starting
    Worker 3 starting
    Worker 4 starting
    Worker 2 finished
    Worker 0 finished
    Worker 1 finished
    Worker 3 finished
    Worker 4 finished
    [0, 1, 2, 3, 4]
    '''

多进程获取进程返回结果

multiprocessing.Process 本身并不能直接返回值，我们需要Queue (队列)来实现收集结果

import multiprocessing
import time

def worker(num, queue):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    queue.put(num * 2)  # 将计算结果放入队列中

if __name__ == '__main__':
    processes = []
    queue = multiprocessing.Queue()  # 创建一个队列用于进程间通信
    
    # 创建并启动 5 个进程
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(i, queue))
        processes.append(p)
        p.start()

    # 等待所有进程完成
    for p in processes:
        p.join()

    # 获取并打印每个进程的返回值
    while not queue.empty():  # 确保队列中所有结果都已获取
        result = queue.get()
        print(f'Result from worker: {result}')

进程池获取返回结果

Pool.map()：是并行计算并按顺序返回结果，适合任务较简单且结果需要按顺序返回的场景；

Pool.apply_async()：是异步调用任务，适合任务较复杂或需要更灵活控制的场景。需要使用 get() 来获取任务结果。

Pool.map_async()：是 map() 的异步版本，返回一个 AsyncResult 对象。

#利用map
import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    return num * 2  # 返回任务的结果

if __name__ == '__main__':
    # 创建一个进程池，最多同时运行 5 个进程
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 map 并行地执行任务
        results = pool.map(worker, range(5))  # 返回每个进程的返回值列表
    
    # 打印所有结果
    print("Results:", results)
    
    
    
######利用get方法
import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    return num * 2

if __name__ == '__main__':
    # 创建进程池
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 apply_async 异步提交任务
        results = [pool.apply_async(worker, (i,)) for i in range(5)]

        # 获取每个任务的返回值
        output = [result.get() for result in results]  # 使用 get() 等待任务完成并获取结果

    print("Results:", output)
    '''
    Worker 0 starting
    Worker 1 starting
    Worker 2 starting
    Worker 3 starting
    Worker 4 starting
    Worker 0 finished
    Worker 2 finished
    Worker 1 finished
    Worker 3 finished
    Worker 4 finished
    Results: [0, 2, 4, 6, 8]
    '''
    
################错误map_async用法
import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    return num * 2

if __name__ == '__main__':
    # 创建进程池
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 map_async 异步提交任务
        results = [pool.map_async(worker, (i,)) for i in range(5)]

        # 获取每个任务的返回值
        output = [result.get() for result in results]  # 使用 get() 等待任务完成并获取结果

    print("Results:", output)
    
    '''
    Worker 0 starting
    Worker 2 starting
    Worker 1 starting
    Worker 3 starting
    Worker 4 starting
    Worker 2 finished
    Worker 0 finished
    Worker 1 finished
    Worker 3 finished
    Worker 4 finished
    Results: [[0], [2], [4], [6], [8]]
    '''

#########正确map_async用法
import multiprocessing
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    return num * 2

if __name__ == '__main__':
    # 创建进程池
    with multiprocessing.Pool(processes=5) as pool:
        # 使用 map_async 异步提交任务
        result = pool.map_async(worker, range(5)) 
        # 获取每个任务的返回值
        output = result.get()   # 使用 get() 等待任务完成并获取结果

    print("Results:", output)
    '''
        Worker 0 starting
        Worker 1 starting
        Worker 2 starting
        Worker 3 starting
        Worker 4 starting
        Worker 0 finished
        Worker 2 finished
        Worker 1 finished
        Worker 3 finished
        Worker 4 finished
        Results: [0, 2, 4, 6, 8]
    '''

注意：

上面的例子是同样的写法，但结果却不一样：

apply_async获取的结果是[0, 2, 4, 6, 8]

map_async获取的结果是[[0], [2], [4], [6], [8]]

为什么2个代码基本结构一样，但是执行的结构却不一样？

因为apply_async是异步产生5个独立的任务，每个任务都在独立的进程中运行，并且 apply_async() 返回的是 AsyncResult 对象；

map_async() 提供了一个 包含单个元素的元组 (i,)，这意味着它会按顺序执行 5 次 map_async()，每次提交 单个任务，这与 apply_async() 的行为不同，实际上是将任务映射到整个可迭代对象的所有元素，它会在内部处理多个任务，而返回的是一个包含所有结果的 AsyncResult 对象，因此输出和任务提交的方式不一样；

通过这个例子能更好的理解apply_async 和map_async()的区别

进程间通讯方式

进程间通信（IPC, Inter-Process Communication） 是指多个进程之间交换数据和信息的机制。python中进程间通信方式，主要包括以下几种；

Queue（队列）：允许多个进程之间以生产者-消费者模式进行数据交换。

Pipe（管道）：通过管道的两端进行数据交换。

Manager（共享内存）：提供进程间共享对象（如共享字典、列表等）。

Value 和 Array（共享内存）：允许多个进程共享单一的变量或数组。

Lock（锁）：确保多个进程对共享资源的同步访问

Queue（队列）

import multiprocessing
import time

def worker(num, queue):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')
    queue.put(num * 2)  # 将计算结果放入队列中

if __name__ == '__main__':
    processes = []
    queue = multiprocessing.Queue()  # 创建一个队列用于进程间通信
    
    # 创建并启动 5 个进程
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(i, queue))
        processes.append(p)
        p.start()

    # 等待所有进程完成
    for p in processes:
        p.join()

    # 获取并打印每个进程的返回值
    while not queue.empty():  # 确保队列中所有结果都已获取
        result = queue.get()
        print(f'Result from worker: {result}')

Pipe（管道）

Pipe 是 multiprocessing 模块提供的另一种进程间通信方式，它通过管道的两端进行通信。管道有两个端口，一个用于发送数据（send），一个用于接收数据（recv）。

import multiprocessing
import time

def sender(conn):
    for i in range(5):
        print(f"Sender sending {i}")
        conn.send(i)  # 发送数据
        time.sleep(1)

def receiver(conn):
    while True:
        data = conn.recv()  # 接收数据
        if data == "DONE":
            break
        print(f"Receiver received {data}")

if __name__ == "__main__":
    # 创建管道，返回两个连接对象
    parent_conn, child_conn = multiprocessing.Pipe()

    # 创建进程
    p1 = multiprocessing.Process(target=sender, args=(parent_conn,))
    p2 = multiprocessing.Process(target=receiver, args=(child_conn,))

    p1.start()
    p2.start()

    p1.join()
    parent_conn.send("DONE")  # 结束信号
    p2.join()
'''
Sender sending 0
Receiver received 0
Sender sending 1
Receiver received 1
Sender sending 2
Receiver received 2
Sender sending 3
Receiver received 3
Sender sending 4
Receiver received 4
'''

Manager（共享内存）

Manager 是 multiprocessing 模块中提供的一个特殊对象，它允许不同进程共享数据。Manager 可以创建共享对象，比如共享的列表、字典等，这些对象会在进程间同步。

import multiprocessing
import time

def worker(shared_dict):
    for i in range(5):
        shared_dict[i] = f"Task {i}"
        print(f"Worker added: {shared_dict[i]}")
        time.sleep(1)

if __name__ == "__main__":
    with multiprocessing.Manager() as manager:
        shared_dict = manager.dict()  # 创建一个共享字典

        p = multiprocessing.Process(target=worker, args=(shared_dict,))
        p.start()
        p.join()

        print(f"Shared dict: {shared_dict}")
'''
Worker added: Task 0
Worker added: Task 1
Worker added: Task 2
Worker added: Task 3
Worker added: Task 4
Shared dict: {0: 'Task 0', 1: 'Task 1', 2: 'Task 2', 3: 'Task 3', 4: 'Task 4'}
'''

Value 和 Array（共享内存）

Value 和 Array 是 multiprocessing 模块中的两种共享内存对象，可以用于在多个进程之间共享数据。Value 用于存储单一数据类型的值，而 Array 用于存储数组（类似于列表）。

import multiprocessing
import time

def worker(shared_value):
    for i in range(5):
        shared_value.value += 1  # 修改共享变量
        print(f"Worker incremented: {shared_value.value}")
        time.sleep(1)

if __name__ == "__main__":
    # 创建一个共享变量
    shared_value = multiprocessing.Value('i', 0)  # 'i' 表示整型

    p = multiprocessing.Process(target=worker, args=(shared_value,))
    p.start()
    p.join()

    print(f"Final shared value: {shared_value.value}")
    '''
    Worker incremented: 1
    Worker incremented: 2
    Worker incremented: 3
    Worker incremented: 4
    Worker incremented: 5
    Final shared value: 5
    '''

Lock（锁）

在多个进程共享数据时，往往需要确保数据的一致性和线程安全。Lock 是 Python 提供的一种同步原语，它用于确保同一时刻只有一个进程能够访问某个共享资源。

import multiprocessing
import time

def worker(lock, shared_value):
    for _ in range(5):
        with lock:# 使用锁来保证线程安全
            shared_value.value += 1
            print(f"Worker incremented: {shared_value.value}")
        time.sleep(1)

if __name__ == "__main__":
    shared_value = multiprocessing.Value('i', 0)  # 创建一个共享变量
    lock = multiprocessing.Lock()  # 创建一个锁

    processes = [multiprocessing.Process(target=worker, args=(lock, shared_value)) for _ in range(3)]
    
    for p in processes:
        p.start()
    for p in processes:
        p.join()

    print(f"Final shared value: {shared_value.value}")

三.多线程

多线程是通过在同一进程中创建多个线程来并发执行任务。线程共享进程的内存空间，因此它们之间可以更容易地共享数据，但也容易引发线程安全问题。由于 GIL 的存在，Python 的多线程在 CPU 密集型任务上通常不能提高性能，但在 I/O 密集型任务上表现良好。

基本用法

Python 中可以使用 threading 模块来实现多线程。以下是一个简单的示例：

import threading
import time

def worker(num):
    print(f'Worker {num} starting')
    time.sleep(2)
    print(f'Worker {num} finished')

threads = []
for i in range(5):
    t = threading.Thread(target=worker, args=(i,))
    threads.append(t)
    t.start()

for t in threads:
    t.join()

线程池

线程池是一种设计模式，用于管理一定数量的线程来处理多个任务。线程池的目的是避免频繁地创建和销毁线程带来的开销，同时通过复用线程来提高程序的效率。

在 Python 中，concurrent.futures.ThreadPoolExecutor 提供了线程池的功能，它会管理一定数量的线程，并按需调度这些线程来执行任务。

import concurrent.futures
import time

def worker(num):
    print(f"Worker {num} starting")
    time.sleep(2)
    print(f"Worker {num} finished")
    return num * 2  # 返回结果

# 使用线程池执行任务
with concurrent.futures.ThreadPoolExecutor(max_workers=3) as executor:
    results = [executor.submit(worker, i) for i in range(5)]

    # 获取每个任务的结果
    output = [result.result() for result in results]
    print("Results:", output)
    
    '''
    Worker 0 starting
    Worker 1 starting
    Worker 2 starting
    Worker 2 finished
    Worker 0 finished
    Worker 3 starting
    Worker 4 starting
    Worker 1 finished
    Worker 4 finished
    Worker 3 finished
    Results: [0, 2, 4, 6, 8]
    '''

线程锁

import threading
import time

# 共享资源（全局变量）
shared_value = 0

# 创建一个锁对象
lock = threading.Lock()

# 线程工作函数
def increment():
    global shared_value
    # 获取锁，防止其他线程访问共享资源
    lock.acquire()  # 获取锁
    try:
        print(f"Thread {threading.current_thread().name} is incrementing shared_value")
        current_value = shared_value
        time.sleep(0.5)  # 模拟一些工作
        shared_value = current_value + 1
        print(f"Thread {threading.current_thread().name} updated shared_value to {shared_value}")
    finally:
        # 无论是否发生异常，都要释放锁
        lock.release()  # 释放锁

if __name__ == "__main__":
    # 创建多个线程
    threads = [threading.Thread(target=increment, name=f"Thread-{i}") for i in range(5)]

    # 启动线程
    for t in threads:
        t.start()

    # 等待所有线程完成
    for t in threads:
        t.join()

    print(f"Final shared_value: {shared_value}")

五.总结

Python 多线程、多进程初学编程的人可能觉得很复杂其实静下来，理解他就知道原来就这么回事，没啥！重点是要理解什么是进程什么是线程！！理解了根据真实项目照着写就行！切记学编程不是死记硬背！如果你采用死记硬背的方式来学编程，那么你完蛋了！！！你永远背不完！！chatgpt也有错误。。何况人。。人与chatgpt的区别是理解，是思想。。

创作整理不易，请大家多多关注多多点赞，有写的不对的地方欢迎大家补充，我来整理，再次感谢！

你可能感兴趣的:(python基础,python,linux)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
包含日志获取webshell 陈望_ning
日志文件关闭：Apache目录下的httpd.conf文件#ErrorLog"logs/error.log"#CustomLog"logs/access.log"common加#号为注释不产生日志文件如果去掉#将会在Apache/logs/目录下产生日志文件linux:access_logerror_logwindows:access.logerror.logaccess_log每一行记录了一次网
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
在Windows11上安装Linux操作系统的几种技术方案 yuanpan linux 运维服务器
在Windows11上安装Linux主要有以下几种技术方案，每种方案适用于不同的需求场景：1.WindowsSubsystemforLinux(WSL)适用场景：开发、命令行工具、轻量级Linux环境支持发行版：Ubuntu、Debian、KaliLinux、Fedora等优点：轻量级：无需虚拟机，直接在Windows上运行Linux命令行环境。无缝集成：可访问Windows文件系统，支持VSCo
Claude Code 超详细完整指南（2025最新版）笙囧同学 python
终端AI编程助手|高频使用点+生态工具+完整命令参考+最新MCP配置目录快速开始（5分钟上手）详细安装指南系统要求Windows安装（WSL方案）macOS安装Linux安装安装验证配置与认证首次认证环境变量配置代理配置⚡基础命令详解启动命令会话管理文件操作Think模式完全指南MCP服务器配置详解MCP基础概念添加MCP服务器10个必备MCP服务器MCP故障排除记忆系统详解高级使用技巧成本控制策
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro