宅男很神经

【Python】算法基础知识

卷一：基础理论与核心数据结构

第一章：算法的度量衡 —— 时空复杂度分析与Python性能陷阱

在踏上算法探索的征途之前，我们必须先锻造好我们的度量工具。没有度量，就无法比较；没有比较，就无法选择；没有选择，就无法优化。在算法的世界里，这个度量衡就是“时空复杂度”。

1.1 为何需要复杂度分析？—— “跑一下代码看看”的局限性

一个初学者在比较两个算法（例如，两种不同的排序方法）的优劣时，最直观的想法可能是：“我把这两个算法都实现出来，然后用同一个大列表去跑一下，看看哪个花的时间短。”

这是一种基于经验的测试方法，它在某些情况下有用，但作为一种严格的评判标准，它存在着致命的缺陷：

环境依赖性太强:
- 硬件差异: 同样的代码，在Intel i9处理器上和在树莓派上运行，其绝对时间天差地别。我们无法得出一个脱离硬件的普适性结论。
- 软件环境差异: 操作系统、Python解释器的版本、后台运行的其他程序，都会干扰计时的准确性。你这次测量的结果，下次可能就无法复现。
数据规模的迷惑性:
- 假设算法A在处理100个元素时耗时0.01秒，算法B耗时0.05秒。我们能说算法A一定优于算法B吗？未必。
- 可能算法A的复杂度是二次方级别（O(n²)），而算法B是线性对数级别（O(n log n)）。当数据规模扩大到100万个元素时，算法A可能需要几个小时，而算法B可能只需要几秒钟。在小数据规模下的“优势”，在大数据面前会变成灾难性的“劣势”。
数据状态的偶然性:
- 某些算法的性能与其处理的数据的初始状态密切相关。例如，一个简单的“快速排序”算法，在处理一个已经几乎排好序的列表时，其性能会急剧恶化。如果你碰巧用了一个这样的测试用例，你可能会错误地认为快速排序是一个很差的VBA算法。

因此，我们需要一种与具体硬件、环境无关，能够描述算法效率与数据规模之间增长关系的理论工具。这个工具，就是复杂度分析。它不关心算法执行的绝对时间（例如“跑了0.2秒”），而是关心算法执行时间（或占用空间）的增长趋势。

1.2 时间复杂度：代码执行时间的增长趋势

时间复杂度，全称为“渐进时间复杂度”（Asymptotic Time Complexity），它描述的是当输入数据规模n趋向于无穷大时，算法执行所需时间步数的增长级别。我们用**大O表示法（Big O Notation）**来表示。

让我们从一个最简单的例子开始，理解大O是如何推导出来的。

代码示例：计算列表中所有元素的和

def sum_list(data_list):
    """计算一个列表中所有数字的和。"""
    total = 0                      # 执行1次：赋值操作
    for num in data_list:          # 执行n次：其中n是data_list的长度
        total += num               # 执行n次：加法和赋值操作
    return total                   # 执行1次：返回操作

推导过程:

数出基本操作次数:
- total = 0 执行了1次。
- for循环本身，连同其内部的total += num，对于一个长度为n的列表，总共会执行n次。我们粗略地将循环的每次迭代记为2个操作步（一次迭代判断，一次加法赋值）。
- return total 执行了1次。
- 所以，总的操作步数 T(n) = 1 + 2*n + 1 = 2n + 2。T(n)代表了代码执行的总时间步数与输入规模n的函数关系。
关注增长趋势，忽略常数、低阶项和系数:
- 忽略加法常数: 当n变得非常大时（比如10亿），2n + 2中的那个+2变得微不足道，完全可以忽略。公式简化为 T(n) ≈ 2n。
- 忽略乘法系数: 我们关心的是执行时间的增长“级别”，而不是精确的倍数关系。2n的增长趋势和n的增长趋势是同一种类型——线性增长。当n翻倍时，执行时间也大致翻倍。因此，我们把这个系数2也忽略掉。
- 最终，我们得到这个算法时间复杂度的增长级别是 O(n)。

大O表示法的核心：它抓住了一个函数中“最主要”的部分，也就是当n趋于无穷时，增长最快的那个项，并忽略掉所有“修饰性”的常数和系数。

1.2.1 常见的时间复杂度量级（从优到劣）

理解并能识别出这些常见的复杂度量级，是算法学习的第一步。

1. O(1) - 常数时间复杂度 (Constant Time)

这代表算法的执行时间不随输入数据规模n的变化而变化。无论n是10还是10亿，执行时间都保持在一个常数水平。

def get_first_element(data_list):
    """获取列表的第一个元素。"""
    if not data_list:                           # 执行1次：检查列表是否为空
        return None                             # 在列表为空时执行1次：返回None
    return data_list[0]                         # 在列表不为空时执行1次：通过索引获取元素

解释: 无论列表data_list有多长，这个函数都只执行一次索引操作data_list[0]。它的执行时间是一个固定的、与n无关的常数。Python中字典（dict）和集合（set）的查找、插入、删除操作，在平均情况下的时间复杂度也是O(1)，这是哈希表数据结构的威力所在。

2. O(log n) - 对数时间复杂度 (Logarithmic Time)

这是非常优秀的一种复杂度。当n增大时，执行时间步数增长得非常缓慢。典型的O(log n)算法，每一步处理都会将待解决问题的规模缩减一个量级（例如，减半）。

经典案例：二分查找

def binary_search(sorted_list, target):
    """在一个排好序的列表中使用二分查找来寻找目标值。"""
    low = 0                                     # 执行1次：初始化low指针
    high = len(sorted_list) - 1                 # 执行1次：初始化high指针

    while low <= high:                          # 循环的次数是关键，我们称之为k次
        mid = (low + high) // 2                 # 执行k次：计算中间位置
        guess = sorted_list[mid]                # 执行k次：获取中间值

        if guess == target:                     # 执行k次：比较操作
            return mid                          # 最多执行1次：找到目标，返回索引
        if guess > target:                      # 执行k次：比较操作
            high = mid - 1                      # 执行k次：缩小查找范围的上界
        else:                                   # 执行k次：比较操作
            low = mid + 1                       # 执行k次：缩小查找范围的下界
    
    return None                                 # 最多执行1次：未找到目标，返回None

解释: 为什么是O(log n)？假设列表长度为n。
- 第1次查找后，剩余的查找范围是 n/2。
- 第2次查找后，剩余的查找范围是 n/4。
- 第k次查找后，剩余的查找范围是 n / 2^k。
- 当查找结束时，剩余范围是1，即 n / 2^k = 1。
- 通过数学变换，得到 n = 2^k，进而得到 k = log₂(n)。
- 因此，循环的执行次数k与n的对数成正比。底数是2还是10在Big O表示法中被忽略，统一记为O(log n)。

3. O(n) - 线性时间复杂度 (Linear Time)

这是非常常见的一种复杂度，意味着算法的执行时间与输入规模n成正比。我们最开始的sum_list例子就是O(n)。

代码示例：线性查找

def linear_search(data_list, target):
    """在列表中进行线性查找。"""
    for i in range(len(data_list)):             # 循环会执行n次
        if data_list[i] == target:              # 比较操作会执行n次（最坏情况下）
            return i                            # 如果找到，则提前返回
    return None                                 # 如果循环结束仍未找到，返回None

解释: 在最坏的情况下（目标元素在列表末尾或根本不存在），这个算法需要完整地遍历整个列表，检查n个元素。

4. O(n log n) - 线性对数时间复杂度 (Log-Linear Time)

这是算法领域的一个“黄金标准”，尤其是在排序领域。许多最高效的、基于比较的排序算法（如归并排序、快速排序的平均情况）都具有这个复杂度。它比O(n^2)快得多，但比O(n)慢。

直观理解: 想象一下，你有一个任务，需要对n个元素中的每一个都执行一次O(log n)的操作。那么总的复杂度就是 n * O(log n)，即 O(n log n)。
归并排序的例子: 归并排序会递归地将列表分成两半（这个过程的深度是log n层），在每一层，它都需要对总共n个元素进行合并操作。因此，总复杂度是 O(n log n)。我们将在排序章节详细实现它。

5. O(n²) - 平方时间复杂度 (Quadratic Time)

当n较大时，这种复杂度的算法会变得非常慢。它通常涉及到对数据集的嵌套循环。

代码示例：找出列表中的重复元素（朴素方法）

def find_duplicates_naive(data_list):
    """使用嵌套循环来查找列表中的重复元素。"""
    duplicates = []                             # 执行1次：初始化结果列表
    n = len(data_list)                          # 执行1次：获取列表长度
    for i in range(n):                          # 外层循环执行n次
        for j in range(i + 1, n):               # 内层循环执行的次数与i相关
            # 当i=0时，内层循环n-1次
            # 当i=1时，内层循环n-2次
            # ...
            # 总次数约等于 (n-1)+(n-2)+...+1 = n*(n-1)/2 = 0.5n² - 0.5n
            if data_list[i] == data_list[j]:    # 比较操作
                if data_list[i] not in duplicates: # 检查是否已记录
                    duplicates.append(data_list[i]) # 添加到结果列表
    return duplicates                           # 返回结果

解释: 内层循环的执行总次数约为 n²/2。根据大O表示法，我们忽略系数1/2和低阶项-0.5n，得到时间复杂度为O(n²)。

6. O(2ⁿ) - 指数时间复杂度 (Exponential Time)

这是一种非常糟糕的复杂度，算法的执行时间会随着n的增加而爆炸式增长。这类算法通常涉及到对问题所有可能子集的蛮力搜索。

经典案例：斐波那契数列的朴素递归实现

def fibonacci_recursive(n):
    """使用朴素递归计算斐波那契数列的第n项。"""
    if n <= 1:                                  # 递归的基线条件
        return n
    # 关键问题在这里：每次调用都会产生两个新的递归调用
    return fibonacci_recursive(n - 1) + fibonacci_recursive(n - 2)

解释: 调用fibonacci_recursive(5)会触发fib(4)和fib(3)。fib(4)又会触发fib(3)和fib(2)。你会发现fib(3)被重复计算了。这种递归调用的总次数大致是2^n的量级，形成一个巨大的、充满重复计算的递归树。

7. O(n!) - 阶乘时间复杂度 (Factorial Time)

这是最差的一类复杂度，只在n非常非常小的情况下才可用。它通常出现在需要计算所有排列组合的问题中。

经典案例：旅行商问题（TSP）的蛮力解法

问题描述: 一个商人要访问n个城市，每个城市只访问一次，最后回到出发城市。如何找到最短的路线？
蛮力解法: 列出所有可能的访问顺序（排列），计算每条路线的总长度，然后找出最短的。
复杂度: n个城市的排列组合有 (n-1)! 种。这是一个O(n!)级别的算法。当城市数量达到20个时，计算量就已经是天文数字了。

1.3 空间复杂度：算法占用的额外内存

空间复杂度（Space Complexity）衡量的是算法在运行过程中，除了存储输入数据本身所占用的空间之外，还需要额外占用的内存空间与输入规模n之间的增长关系。

1. O(1) - 常数空间复杂度

算法所需的额外空间是一个固定的常数，不随n的变化而变化。

def reverse_list_in_place(data_list):
    """原地反转一个列表。"""
    left = 0                                # 需要1个变量空间
    right = len(data_list) - 1              # 需要1个变量空间
    while left < right:
        # 下面的交换操作只在已有的列表空间内进行，没有创建新列表
        temp = data_list[left]              # 需要1个临时变量空间
        data_list[left] = data_list[right]
        data_list[right] = temp
        left += 1
        right -= 1

解释: 无论data_list有多长，我们都只需要left, right, temp这几个固定数量的变量。因此，额外空间是O(1)。这种不产生额外数据副本的算法被称为“原地算法”（In-place Algorithm）。

2. O(n) - 线性空间复杂度

算法所需的额外空间与输入规模n成正比。

def create_copy_and_reverse(data_list):
    """创建一个新的反转后的列表。"""
    new_list = [None] * len(data_list)      # 创建了一个和输入规模n一样大的新列表
    n = len(data_list)
    for i in range(n):
        new_list[i] = data_list[n - 1 - i]
    return new_list

解释: 我们创建了一个new_list，它的大小与data_list完全相同。如果data_list的长度是n，那么额外空间就是O(n)。

3. O(n²) - 平方空间复杂度

算法所需的额外空间与n的平方成正比。

代码示例：创建一个邻接矩阵来表示图

def create_adjacency_matrix(n, edges):
    """为n个顶点的图创建邻接矩阵。"""
    # 创建一个 n x n 的二维列表，所有元素初始化为0
    matrix = [[0] * n for _ in range(n)]        # 这里分配了 n*n 的空间
    for u, v in edges:
        matrix[u][v] = 1
        matrix[v][u] = 1 # 假设是无向图
    return matrix

解释: 对于一个有n个顶点的图，邻接矩阵需要n x n的空间来存储任意两个顶点之间是否存在边。因此，空间复杂度是O(n²)。

1.4 最好、最坏与平均情况复杂度

同一个算法，在处理不同状态的输入数据时，其性能表现可能大相径庭。

最坏情况时间复杂度 (Worst-case): 算法在任何输入规模为n的数据上，运行时间步数的上界。这是我们最关心、最常讨论的，因为它提供了一个性能保证。无论输入数据多么“不友好”，算法的性能都不会比这个更差。
最好情况时间复杂度 (Best-case): 算法在最“理想”的输入数据上运行的时间复杂度。这个指标通常用处不大，因为它不具有代表性。
平均情况时间复杂度 (Average-case): 假设所有可能的输入数据以等概率出现，算法运行的期望时间复杂度。这个指标能很好地反映算法在现实中的平均表现，但其数学分析通常比最坏情况复杂得多。

以线性查找为例:

最坏情况: O(n)。目标元素在列表的最后一个位置，或者根本不存在。
最好情况: O(1)。目标元素恰好是列表的第一个。
平均情况: O(n)。平均来说，需要查找 n/2 次。根据大O表示法，忽略系数1/2，仍然是O(n)。

以快速排序为例:

最坏情况: O(n²)。当每次选择的“基准元”都是当前子数组的最大或最小值时发生，这常见于处理一个已排序的列表。
最好情况: O(n log n)。
平均情况: O(n log n)。实践证明，通过随机选择基准元等方法，可以极大概率地避免最坏情况的发生，使得快速排序在平均情况下表现极为出色。

1.5 必须警惕的Python性能陷阱

Python的语法简洁优美，但这种简洁有时会掩盖底层操作的真实成本。不了解这些，很容易写出表面优雅但性能低下的代码。

陷阱一：列表的 + 拼接与 append

# list_concatenation_vs_append.py
import time

n = 100000

# 使用 + 拼接
start_time = time.time()
result_plus = []
for i in range(n):
    result_plus = result_plus + [i] # 每次拼接都会创建一个新的列表
end_time = time.time()
print(f"使用 '+' 拼接 {
     
     n} 次耗时: {
     
     end_time - start_time:.4f} 秒")

# 使用 append
start_time = time.time()
result_append = []
for i in range(n):
    result_append.append(i) # append是原地修改，效率高得多
end_time = time.time()
print(f"使用 'append' {
     
     n} 次耗时: {
     
     end_time - start_time:.4f} 秒")

分析:
- result = result + [i]: 看起来简单，但+操作符在Python列表中意味着创建一个全新的列表，将result的所有元素复制到新列表中，然后再把[i]的元素也复制过去。这个操作的成本与result的当前长度成正比。在循环中，这个操作的复杂度近似于 1 + 2 + 3 + ... + n，这是一个O(n²)的过程！
- result.append(i): append方法是原地修改。Python的列表是动态数组，它会预分配一些额外空间。大多数情况下，append只是在末尾填入一个值，是O(1)操作。即使偶尔空间不足需要重新分配和复制整个数组，其“均摊时间复杂度”依然是O(1)。整个循环是O(n)。

陷阱二：in 操作符在列表和字典/集合中的天壤之别

# in_list_vs_in_dict.py
import time

n = 100000
data_list = list(range(n))
data_dict = {
   
   i: True for i in range(n)} # 创建一个字典，键是0到n-1
target = n - 1 # 要查找的目标

# 在列表中查找
start_time = time.time()
is_in_list = target in data_list # 'in' 对于列表是线性扫描
end_time = time.time()
print(f"在 {
     
     n} 个元素的列表中查找: {
     
     '找到' if is_in_list else '未找到'}, 耗时: {
     
     end_time - start_time:.6f} 秒")

# 在字典中查找
start_time = time.time()
is_in_dict = target in data_dict # 'in' 对于字典是哈希查找
end_time = time.time()
print(f"在 {
     
     n} 个元素的字典中查找: {
     
     '找到' if is_in_dict else '未找到'}, 耗时: {
     
     end_time - start_time:.6f} 秒")

分析:
- target in data_list: 为了判断target是否在列表中，Python必须从头到尾逐个检查元素，直到找到匹配项或遍历完整个列表。这是一个O(n)的线性查找。
- target in data_dict: 字典的in操作利用了哈希表。它会直接计算target的哈希值，通过哈希值几乎可以立即定位到target应该在的位置，然后进行一次比较即可。这是一个平均O(1)的操作。
- 结论: 当你需要频繁地进行成员资格检查时，使用集合（set）或字典（dict）的键，其性能远超列表。

陷阱三：字符串的拼接

这与列表的+拼接陷阱非常相似。Python的字符串是**不可变（immutable）**的。

# string_concatenation.py

# 坏方法：使用 + 在循环中拼接
def bad_string_join(words):
    result = ""
    for word in words:
        result += word + " " # 每次都会创建新字符串，O(n²)
    return result

# 好方法：使用 join 方法
def good_string_join(words):
    return " ".join(words) # join方法会先计算总长度，一次性构建字符串，O(n)

分析:
- result += word: 因为字符串不可变，所以这行代码的背后是：创建一个新的、足够大的字符串，将result的旧内容复制过去，再将word的内容复制过去，然后让result变量指向这个全新的字符串。在循环中，这是一个O(n²)的灾难。
- " ".join(words): join方法是专门为此优化的。它会先遍历一次words列表，计算出最终字符串所需的总长度，然后只分配一次内存，最后将所有单词复制到这个新空间中。这是一个高效的O(n)操作，其中n是所有单词的总长度。

第二章：线性数据结构 —— 序列、链条与栈队的艺术

在构建了坚固的复杂度分析基石之后，我们开始搭建算法大厦的第一层——线性数据结构。所谓“线性”，指的是数据元素之间存在着一对一的、线性的前后关系，就像一串珍珠项链，每个珍珠后面只跟着另一颗珍珠。这种结构虽然简单，却是构建更复杂数据结构和算法的基础。

2.1 数组与Python列表：看似简单，内有乾坤

数组（Array）是几乎所有编程语言都内置的最基本的数据结构。它是一块连续的内存空间，用于存储一系列相同类型的元素。

数组的核心特性:

连续内存: 这是数组最本质、最重要的特征。a[0], a[1], a[2]等元素在物理内存中是紧挨着存放的。
随机访问 (Random Access): 正因为内存连续，计算机可以通过一个简单的数学公式 address(a[i]) = base_address + i * element_size，在O(1)的常数时间内直接计算出任何一个索引i的元素的内存地址，并立即访问它。这是数组最大的优势。

Python中的list：动态数组的实现

Python的list类型，虽然用法上像一个可以存储任何类型、长度可变的“超级数组”，但其底层实现是一个动态数组（Dynamic Array）。它保留了传统数组“连续内存”和“随机访问”的核心优势，同时又巧妙地解决了传统数组长度固定的问题。

动态数组的内部机制:

预留空间: 当你创建一个list时，Python解释器并不会只分配你当前需要的空间。它会额外预留一些空间，以备未来的append操作。这被称为“超额分配”（Over-allocation）。
append操作: 当你append一个新元素时，如果预留空间足够，Python会直接在末尾的空闲位置放入新元素。这是一个O(1)的操作。
扩容 (Resizing): 如果预留空间用完了，append操作会触发一次“扩容”。这个过程包括：
a. 申请一块更大的新内存空间（通常是当前大小的1.5倍或2倍）。
b. 将旧数组中的所有元素，逐个复制到新的内存空间中。
c. 释放旧的内存空间。
d. 在新空间的末尾放入新元素。

这次扩容操作本身是O(n)的，其中n是列表的当前大小。但由于它不是每次append都发生，而是随着列表长度的增长，其发生的频率越来越低，因此，经过均摊（Amortized）分析，append操作的均摊时间复杂度依然是O(1)。

2.1.1 列表的基本操作复杂度分析

理解Python列表的底层实现，对于分析其各种操作的性能至关重要。

操作	例子	平均时间复杂度	最坏时间复杂度	解释
索引访问	`L[i]`	`O(1)`	`O(1)`	基于连续内存的地址计算，始终是常数时间。
索引赋值	`L[i] = v`	`O(1)`	`O(1)`	同上，直接定位并修改。
末尾追加	`L.append(v)`	`O(1)`	`O(n)`	均摊为O(1)。最坏情况发生在需要扩容时。
末尾弹出	`L.pop()`	`O(1)`	`O(1)`	只是移动内部的“size”指针，通常不涉及缩容，极快。
插入元素	`L.insert(i,v)`	`O(n)`	`O(n)`	在索引`i`处插入，需要将`i`之后的所有元素向右移动一位。
删除元素	`del L[i]`, `L.pop(i)`	`O(n)`	`O(n)`	删除索引`i`的元素，需要将`i`之后的所有元素向左移动一位。
成员检查	`v in L`	`O(n)`	`O(n)`	线性扫描，从头到尾逐个比较。
切片 (读取)	`L[i:j]`	`O(k)`	`O(k)`	`k=j-i`。需要创建新列表并复制`k`个元素。
切片 (删除)	`del L[i:j]`	`O(n-j)`	`O(n-j)`	需要将被删除部分之后的所有元素向左移动。
列表拼接	`L1 + L2`	`O(m+n)`	`O(m+n)`	创建新列表，并复制`L1`和`L2`的所有元素。`m, n`为长度。

代码示例：insert 和 del 的成本演示

# list_insertion_deletion_cost.py
import time

n = 100000

# 在列表头部插入
start_time = time.time()
l_head = []
for i in range(n):
    l_head.insert(0, i) # 每次都在索引0处插入，每次都移动所有已有元素
end_time = time.time()
print(f"在列表头部插入 {
     
     n} 个元素耗时: {
     
     end_time - start_time:.4f} 秒") # 这是一个O(n²)的操作

# 在列表尾部插入 (使用 append)
start_time = time.time()
l_tail = []
for i in range(n):
    l_tail.append(i) # 均摊 O(1)
end_time = time.time()
print(f"在列表尾部追加 {
     
     n} 个元素耗时: {
     
     end_time - start_time:.4f} 秒") # 这是一个O(n)的操作

# 从列表头部删除
l_to_delete = list(range(n))
start_time = time.time()
for _ in range(n):
    l_to_delete.pop(0) # 每次都从索引0处删除，每次都移动所有剩余元素
end_time = time.time()
print(f"从列表头部删除 {
     
     n} 个元素耗时: {
     
     end_time - start_time:.4f} 秒") # 这是一个O(n²)的操作

这个实验的结果会非常清晰地告诉你：对Python列表的头部进行频繁的插入和删除，是极其低效的行为！ 这也是为什么我们需要队列（Queue）这种专门为头尾操作优化的数据结构。

2.2 链表：非连续内存的自由舞者

与数组将所有元素紧凑地存放在一块连续内存中不同，链表（Linked List）采取了一种完全不同的、更“自由”的存储策略。

链表的核心思想:

节点 (Node): 链表的基本组成单位是节点。每个节点至少包含两部分信息：
1. 数据域 (Data): 存储元素本身的数据。
2. 指针域 (Pointer/Next): 存储下一个节点的内存地址。
非连续存储: 链表的各个节点在内存中可以是任意分布的，它们不需要物理上相邻。
链接关系: 节点之间的逻辑顺序是通过指针域串联起来的。第一个节点被称为“头节点”（Head），它的指针指向第二个节点；第二个节点的指针指向第三个，以此类推。最后一个节点的指针通常指向一个特殊值None（或NULL），表示链表的结束。

2.2.1 从零开始构建一个单向链表

为了深刻理解链表的运作机制，我们必须亲手实现它。

# linked_list_implementation.py

class Node:
    """定义链表的节点类。"""
    def __init__(self, data, next_node=None):
        self.data = data          # 数据域，存储节点的值
        self.next = next_node     # 指针域，存储下一个节点的引用

class SinglyLinkedList:
    """定义一个单向链表类，并实现其核心操作。"""
    def __init__(self):
        """初始化一个空链表。"""
        self._head = None         # 初始化头节点为None，表示链表为空

    def is_empty(self):
        """检查链表是否为空。"""
        return self._head is None # 如果头节点是None，则链表为空

    def prepend(self, data):
        """在链表头部添加一个新节点 (头插法)。O(1)操作。"""
        # 创建一个包含新数据的新节点
        # 这个新节点的 next 指针指向当前的头节点
        new_node = Node(data, self._head) # 新节点的next指向旧的头节点
        # 将链表的头节点更新为这个新创建的节点
        self._head = new_node             # 将链表的头指针更新为新节点
        
    def append(self, data):
        """在链表尾部添加一个新节点 (尾插法)。O(n)操作。"""
        new_node = Node(data) # 创建一个新节点，其next默认为None
        
        if self.is_empty(): # 如果链表是空的
            self._head = new_node # 新节点就是头节点
            return
            
        # 如果链表不为空，需要遍历到最后一个节点
        last_node = self._head # 从头节点开始
        while last_node.next: # 只要当前节点的next不为None，就继续向后移动
            last_node = last_node.next
        
        # 循环结束后，last_node就是最后一个节点
        last_node.next = new_node # 将原来的最后一个节点的next指针指向新节点

    def traverse(self):
        """遍历链表并打印所有节点的数据。"""
        print("遍历链表: ", end="") # 打印前缀
        current = self._head # 从头节点开始
        while current: # 只要当前节点不为None
            print(f"{
     
     current.data} -> ", end="") # 打印当前节点的数据
            current = current.next # 移动到下一个节点
        print("None") # 链表末尾打印None

    def find(self, target):
        """在链表中查找一个值，如果找到则返回True。O(n)操作。"""
        current = self._head # 从头节点开始
        while current: # 遍历
            if current.data == target: # 如果找到了目标值
                return True # 返回True
            current = current.next # 移动到下一个节点
        return False # 如果遍历完都没找到，返回False

    def remove(self, target):
        """从链表中删除第一个匹配目标值的节点。O(n)操作。"""
        if self.is_empty(): # 如果链表为空，直接返回
            return

        # Case 1: 要删除的是头节点
        if self._head.data == target: # 如果头节点就是要删除的目标
            self._head = self._head.next # 直接将头指针指向第二个节点即可
            return
            
        # Case 2: 要删除的是中间或尾部的节点
        prev_node = self._head # prev_node 指向当前节点的前一个节点
        current_node = self._head.next # current_node 指向当前要检查的节点
        
        while current_node: # 遍历
            if current_node.data == target: # 如果找到了要删除的节点
                # “跳过”这个节点
                # 将前一个节点的next指针，直接指向当前节点的下一个节点
                prev_node.next = current_node.next # 实现删除
                return
            
            # 如果没找到，两个指针都向后移动一位
            prev_node = current_node
            current_node = current_node.next

# --- 使用我们自己实现的链表 ---
my_list = SinglyLinkedList() # 创建一个空链表实例
print(f"链表是否为空? {
     
     my_list.is_empty()}") # 检查是否为空

print("\n在头部添加 10, 20, 30...") # 打印操作描述
my_list.prepend(10) # 链表: 10 -> None
my_list.prepend(20) # 链表: 20 -> 10 -> None
my_list.prepend(30) # 链表: 30 -> 20 -> 10 -> None
my_list.traverse() # 遍历并打印
print(f"链表是否为空? {
     
     my_list.is_empty()}") # 再次检查

print("\n在尾部添加 5...") # 打印操作描述
my_list.append(5) # 链表: 30 -> 20 -> 10 -> 5 -> None
my_list.traverse() # 遍历并打印

print(f"\n查找值 20: {
     
     my_list.find(20)}") # 查找存在的值
print(f"查找值 100: {
     
     my_list.find(100)}") # 查找不存在的值

print("\n删除值 20...") # 打印操作描述
my_list.remove(20) # 删除中间节点
my_list.traverse() # 遍历并打印

print("\n删除值 30 (头节点)...") # 打印操作描述
my_list.remove(30) # 删除头节点
my_list.traverse() # 遍历并打印

print("\n删除值 5 (尾节点)...") # 打印操作描述
my_list.remove(5) # 删除尾节点
my_list.traverse() # 遍历并打印

这个实现过程，能让你深刻理解链表的插入和删除操作是如何通过改变节点的next指针来完成的。尤其是删除操作，需要一个prev_node来“记住”前一个节点，这是链表操作中的一个经典模式。

2.2.2 数组 vs. 链表：世纪对决

现在，我们可以对这两种核心的线性结构进行一次全面的性能对比。

特性	数组 (Python `list`)	链表 (我们实现的)	优胜者 & 原因
内存布局	连续	分散	数组: 内存连续性带来了缓存友好性，CPU在访问一个元素后，很可能已经把它的邻居也加载到了高速缓存中，后续访问更快。
随机访问	`O(1)`	`O(n)`	数组: 绝对优势。链表要访问第`i`个元素，必须从头节点开始，一步一步地跳`i`次。
头部插入/删除	`O(n)`	`O(1)`	链表: 绝对优势。链表的头插/头删只需要修改头指针，是常数时间操作。数组需要移动所有元素。
尾部插入	`O(1)` (均摊)	`O(n)` (朴素实现)	数组: `append`是O(1)的。我们实现的链表尾插需要遍历到末尾，是O(n)。
中间插入/删除	`O(n)`	`O(n)`	平手: 两者都需要`O(n)`。数组慢在移动元素，链表慢在查找要操作的位置。
空间开销	较小	较大	数组: 只需要存储数据本身。链表每个节点都需要额外的空间来存储`next`指针。

优化链表的尾部插入:
我们上面实现的链表，尾部插入是O(n)，这是一个痛点。我们可以通过在链表类中额外维护一个_tail指针，始终指向最后一个节点，来将尾部插入的复杂度优化到O(1)。

代码示例：带尾指针的优化链表

class OptimizedSinglyLinkedList:
    """一个带有头尾指针的单向链表，优化了尾部操作。"""
    def __init__(self):
        self._head = None # 头指针
        self._tail = None # 尾指针
        self._size = 0    # 维护一个size属性，获取长度是O(1)

    def __len__(self):
        """让链表支持len()函数。"""
        return self._size

    def append(self, data):
        """优化的尾部插入方法。O(1)操作。"""
        new_node = Node(data) # 创建新节点
        if self._tail: # 如果链表不为空 (即尾指针存在)
            self._tail.next = new_node # 将当前的尾节点的next指向新节点
            self._tail = new_node      # 更新尾指针为这个新节点
        else: # 如果链表为空
            self._head = new_node # 新节点既是头也是尾
            self._tail = new_node
        self._size += 1 # 尺寸加一
    
    # prepend, traverse, find, remove 等方法也需要相应地更新_tail和_size
    # (此处为简化省略，但这是实现完整功能所必需的)

结论与应用场景:

选择数组 (Python list):
- 当你需要频繁地通过索引随机访问元素时。
- 当你的主要操作是在列表尾部进行添加和删除时。
- 当对内存占用比较敏感时。
- 绝大多数情况下，Python的list都是一个足够好、足够快的选择。
选择链表:
- 当你的主要需求是频繁地在数据结构的头部进行插入和删除时。这是链表最核心的优势场景。
- 当你需要实现一个**真正的队列（Queue）**时（我们下一节会讲）。
- 当你处理的数据量极大，无法在内存中开辟一块巨大的连续空间时，链表的非连续存储特性会成为优势。
- 当插入和删除操作的频率远高于访问操作时。

2.2.3 链表的变体：双向链表与循环链表

双向链表 (Doubly Linked List):

结构: 每个节点除了有next指针指向下一个节点，还有一个prev指针指向上一个节点。
优势:
1. 可以双向遍历。
2. 删除一个节点变得更容易。如果给你一个节点的引用node_to_delete，你不需要像单向链表那样从头遍历来找到它的前一个节点。你可以直接通过node_to_delete.prev来找到前驱，然后执行 node_to_delete.prev.next = node_to_delete.next 和 node_to_delete.next.prev = node_to_delete.prev 来完成删除。这使得在给定节点引用下的删除操作是O(1)的。
劣势: 每个节点需要额外存储一个prev指针，空间开销更大。插入和删除操作需要同时维护next和prev两个指针，逻辑稍微复杂一点。

代码片段：双向链表节点定义

class DoublyNode:
    def __init__(self, data, prev_node=None, next_node=None):
        self.data = data
        self.prev = prev_node # 指向前一个节点的指针
        self.next = next_node # 指向后一个节点的指针

循环链表 (Circular Linked List):

结构: 链表的最后一个节点的next指针不再指向None，而是指向头节点，形成一个环。
优势:
1. 从任何一个节点出发，都可以遍历到整个链表。
2. 在某些特定算法（如约瑟夫环问题）中非常有用。
3. 可以用来实现某些循环缓冲区。
劣势: 遍历时需要小心处理终止条件，否则会陷入无限循环。通常需要让遍历指针回到起点来判断循环结束。

2.3 栈：后进先出 (LIFO) 的哲学

栈（Stack）是一种特殊的线性数据结构，它遵循**后进先出（Last-In, First-Out, LIFO）**的原则。你可以把它想象成一摞盘子：你最后放上去的盘子，总是第一个被拿走。

栈的核心操作:

push(item): 将一个元素压入栈顶。
pop(): 从栈顶弹出一个元素，并返回它。
peek() (或 top()): 查看栈顶元素，但不弹出。
is_empty(): 检查栈是否为空。

所有这些核心操作的时间复杂度都应该是O(1)。

2.3.1 Python中的栈实现

在Python中，有多种方式可以实现一个栈。

方式一：使用Python list
Python的list类型提供了append()和pop()方法，它们都作用于列表的尾部，并且都是O(1)（均摊）的。这完美地契合了栈的LIFO特性。因此，使用list来模拟栈是最简单、最直接、也最常见的方式。

# stack_using_list.py
stack = [] # 用一个空列表来代表栈

# Push 操作
stack.append('A') # 'A'入栈
stack.append('B') # 'B'入栈
stack.append('C') # 'C'入栈

print(f"当前栈 (列表表示): {
     
     stack}") # 打印栈内容

# Peek 操作 (查看栈顶)
# 列表的最后一个元素就是栈顶
top_element = stack[-1] # 获取列表的最后一个元素
print(f"栈顶元素是: {
     
     top_element}") # 打印栈顶元素

# Pop 操作
popped_item = stack.pop() # 从列表尾部弹出一个元素
print(f"弹出的元素是: {
     
     popped_item}") # 打印弹出的元素
print(f"Pop操作后的栈: {
     
     stack}") # 打印操作后的栈

popped_item = stack.pop() # 再次弹出
print(f"弹出的元素是: {
     
     popped_item}")
print(f"Pop操作后的栈: {
     
     stack}")

# is_empty 操作
is_empty = not stack # 一个空列表在布尔上下文中是False，取反即为True
print(f"栈现在是否为空? {
     
     is_empty}") # 打印是否为空

方式二：使用collections.deque
collections.deque（双端队列，Double-ended Queue）是一个专门为在两端进行快速添加和删除操作而设计的序列类型。它的append()（右端添加）和pop()（右端弹出）操作都是严格的O(1)，没有list扩容时那种最坏情况的性能波动。

对于一个严格要求性能稳定性的栈实现，或者当栈的规模可能非常巨大，deque是比list更好的选择。

# stack_using_deque.py
from collections import deque

stack = deque() # 使用deque创建一个栈

# Push 操作 (使用 append)
stack.append('X')
stack.append('Y')
stack.append('Z')

print(f"当前栈 (deque表示): {
     
     stack}")

# Peek 操作
top_element = stack[-1] # deque也支持索引访问最后一个元素
print(f"栈顶元素是: {
     
     top_element}")

# Pop 操作
popped_item = stack.pop()
print(f"弹出的元素是: {
     
     popped_item}")
print(f"Pop操作后的栈: {
     
     stack}")

方式三：使用queue.LifoQueue
queue模块提供的是线程安全的数据结构，用于在多线程编程中安全地传递数据。LifoQueue就是一个后进先出的队列，也就是一个线程安全的栈。如果你是在单线程环境中使用，它会比list或deque慢，因为有额外的锁开销。但如果你在多线程程序中需要一个共享的栈，这应该是你的首选。

2.3.2 栈的经典应用场景

栈的LIFO特性，使得它在计算机科学中无处不在。

应用一：函数调用栈
这是栈最底层、最核心的应用。当你调用一个函数时，操作系统会把这个函数的返回地址、参数、局部变量等信息打包成一个“栈帧（Stack Frame）”，然后压入一个叫做“调用栈”的内存区域。当函数返回时，再从栈顶弹出它的栈帧，恢复到调用前的状态。递归函数之所以能工作，就是依赖于调用栈。如果递归深度太深，会导致调用栈溢出（Stack Overflow）。

应用二：括号匹配
这是一个经典的面试题。如何检查一个字符串中的括号（如(), [], {}）是否是成对且正确嵌套的？

# balanced_parentheses.py
def is_balanced(s: str) -> bool:
    """使用栈来检查括号是否平衡。"""
    stack = [] # 使用列表作为栈
    # 创建一个映射，将闭括号映射到其对应的开括号
    mapping = {
   
   ")": "(", "]": "[", "}": "{"}
    
    for char in s: # 遍历字符串中的每个字符
        if char in mapping: # 如果当前字符是一个闭括号
            # 1. 尝试从栈顶弹出一个元素。如果栈为空，说明没有对应的开括号，用一个虚拟值'#'代替。
            top_element = stack.pop() if stack else '#'
            
            # 2. 检查弹出的开括号是否与当前闭括号匹配
            if mapping[char] != top_element: # 如果不匹配
                return False # 括号不平衡，立即返回False
        else: # 如果当前字符是一个开括号
            stack.append(char) # 将其压入栈中
            
    # 循环结束后，如果栈是空的，说明所有开括号都被正确匹配了
    # 如果栈不为空，说明有未被匹配的开括号
    return not stack # 返回栈是否为空的布尔值

# 测试用例
print(f"'()[]{
    
    {}}' 是否平衡? {is_balanced('()[]{}')}") # True
print(f"'([)]' 是否平衡? {
     
     is_balanced('([)]')}")       # False
print(f"'{
    
    {[]}}' 是否平衡? {is_balanced('{
    
    {[]}}')}")   # True
print(f"'(' 是否平衡? {
     
     is_balanced('(')}")           # False

算法思路: 遍历字符串。遇到开括号，就压入栈中。遇到闭括号，就从栈顶弹出一个开括号进行匹配。如果匹配成功，继续；如果栈为空或匹配失败，则字符串不平衡。遍历结束后，如果栈为空，则字符串平衡，否则不平衡。

应用三：逆波兰表达式求值 (后缀表达式)
逆波兰表达式（Reverse Polish Notation, RPN）是一种将运算符写在操作数后面的数学表达式。例如，3 4 + 等价于 3 + 4。求值RPN表达式是栈的完美应用场景。

# evaluate_rpn.py
def eval_rpn(tokens: list[str]) -> int:
    """使用栈来计算逆波兰表达式的值。"""
    stack = [] # 使用列表作为栈
    
    for token in tokens: # 遍历表达式中的每个标记
        if token in "+-*/": # 如果标记是运算符
            # 从栈顶弹出两个操作数
            # 注意顺序：先弹出的是右操作数
            right_operand = stack.pop() # 弹出右操作数
            left_operand = stack.pop()  # 弹出左操作数
            
            # 根据运算符进行计算
            if token == "+":
                result = left_operand + right_operand
            elif token == "-":
                result = left_operand - right_operand
            elif token == "*":
                result = left_operand * right_operand
            else: # token == "/"
                # 注意Python中除法的结果是浮点数，题目通常要求向零取整
                result = int(left_operand / right_operand)
                
            stack.append(result) # 将计算结果压回栈中
        else: # 如果标记是数字
            stack.append(int(token)) # 将其转换为整数并压入栈中
            
    # 遍历结束后，栈中应该只剩下一个元素，即最终结果
    return stack.pop() # 弹出并返回最终结果

# 测试用例
expression1 = ["2", "1", "+", "3", "*"] # (2 + 1) * 3 = 9
expression2 = ["4", "13", "5", "/", "+"] # 4 + (13 / 5) = 4 + 2 = 6
print(f"表达式 {
     
     expression1} 的值是: {
     
     eval_rpn(expression1)}")
print(f"表达式 {
     
     expression2} 的值是: {
     
     eval_rpn(expression2)}")

算法思路: 遍历表达式。遇到数字，就压入栈。遇到运算符，就从栈顶弹出两个数字进行运算，然后将结果再压回栈中。遍历结束后，栈中剩下的唯一一个数字就是最终结果。

2.4 队列：先进先出 (FIFO) 的公平之道

与栈的LIFO原则相对，队列（Queue）遵循的是**先进先出（First-In, First-Out, FIFO）**的原则。这就像在超市排队结账，最先来排队的人，总是第一个结账离开。

队列的核心操作:

enqueue(item): 将一个元素加入队尾（入队）。
dequeue(): 从队头移除一个元素，并返回它（出队）。
peek() (或 front()): 查看队头元素，但不移除。
is_empty(): 检查队列是否为空。

同样，所有这些核心操作的时间复杂度都应该是O(1)。

2.4.1 Python中的队列实现：为何不能用list？

如果我们尝试用Python的list来模拟队列：

入队 (enqueue): 我们可以用list.append(item)，这是一个O(1)的操作，很好。
出队 (dequeue): 我们需要从队列的头部移除元素，对应到列表就是索引0的位置。这个操作需要调用list.pop(0)。
陷阱: 我们在2.1.1节已经知道，list.pop(0)是一个**O(n)**的操作，因为它需要将所有后续元素向左移动一位。当队列很长时，这会变得极其低效。

结论：永远不要用list来实现一个真正的队列！

正确的实现方式：collections.deque
collections.deque（双端队列）是专门为此而生的。

它支持从**右端（尾部）**快速添加：deque.append(item) (对应 enqueue)
它支持从**左端（头部）**快速移除：deque.popleft() (对应 dequeue)

这两个操作都是严格的O(1)时间复杂度，因为deque底层是用双向链表实现的，对两端的操作都只需要修改头尾指针。

# queue_using_deque.py
from collections import deque

queue = deque() # 使用deque创建一个队列

# Enqueue 操作
queue.append('任务1') # "任务1" 入队
queue.append('任务2') # "任务2" 入队
queue.append('任务3') # "任务3" 入队

print(f"当前队列 (deque表示): {
     
     queue}") # 打印队列内容

# Peek 操作 (查看队头)
# deque的第一个元素就是队头
front_element = queue[0] # 获取deque的第一个元素
print(f"队头元素是: {
     
     front_element}") # 打印队头元素

# Dequeue 操作
dequeued_item = queue.popleft() # 从队列左端（头部）弹出一个元素
print(f"出队的元素是: {
     
     dequeu

你可能感兴趣的:(python,开发语言)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found