xumistore

Java八股文——数据结构「数据结构篇」

了解哪些数据结构？

面试官您好，我了解并使用过多种数据结构。在我的理解中，数据结构可以分为几个大的类别，每一类都有其独特的优势和适用场景。

1. 线性结构 (Linear Structures)

这类结构的特点是数据元素之间存在一对一的线性关系，像一条线一样。

数组 (Array)：
- 特点：它是一块连续的内存空间，通过索引来访问元素，所以随机访问速度极快，时间复杂度是 O(1)。
- 缺点：插入和删除元素比较慢，因为需要移动后续所有元素，平均时间复杂度是 O(n)。
- Java实现：java.util.ArrayList 的底层就是动态数组。
- 应用场景：适合读多写少，并且需要频繁按索引查找元素的场景。
链表 (Linked List)：
- 特点：由一系列节点组成，内存空间不要求连续。每个节点除了存储数据，还存有指向下一个（或上一个）节点的指针。
- 优点：插入和删除元素非常快，只需要修改相邻节点的指针即可，时间复杂度是 O(1)。
- 缺点：随机访问很慢，必须从头节点开始遍历，时间复杂度是 O(n)。
- Java实现：java.util.LinkedList。它同时实现了 List 和 Deque 接口，既可以当列表用，也可以当栈或队列用。
- 应用场景：适合写多读少，需要频繁进行插入和删除操作的场景。
栈 (Stack)：
- 特点：一种后进先出 (LIFO) 的数据结构。所有操作都在栈顶进行。
- Java实现：java.util.Stack（线程安全但已不推荐），现在更推荐使用 java.util.Deque 接口，其实现类如 ArrayDeque 效率更高。
- 应用场景：函数调用栈、表达式求值、括号匹配、撤销/重做（Undo/Redo）功能。
队列 (Queue)：
- 特点：一种先进先出 (FIFO) 的数据结构。在队尾入队，在队头出队。
- Java实现：java.util.Queue 接口，常用实现有基于链表的 LinkedList 和基于数组的 ArrayDeque。
- 应用场景：任务调度（如线程池的任务队列）、广度优先搜索（BFS）、消息队列。

2. 哈希结构 (Hash-based Structures)

哈希表 (Hash Table)：
- 特点：通过一个哈希函数，将键（Key）直接映射到内存中的一个位置，从而实现快速访问。它以键值对（Key-Value）的形式存储数据。
- 优点：在没有哈希冲突的理想情况下，插入、删除、查找的平均时间复杂度都是 O(1)，性能极高。
- 缺点：哈希冲突是需要解决的核心问题（通常用链地址法或开放地址法解决）。数据是无序的。
- Java实现：java.util.HashMap、Hashtable (线程安全但已不推荐)、ConcurrentHashMap（分段锁/CAS实现的高效线程安全哈希表）。
- 应用场景：几乎无处不在，如缓存系统、配置信息存储、需要快速通过Key查找Value的任何场景。

3. 树形结构 (Tree Structures)

这类结构是分层的，元素之间是一对多的关系。

二叉搜索树 (Binary Search Tree, BST)：
- 特点：左子节点的值小于父节点，右子节点的值大于父节点。
- 优点：使得查找、插入、删除的平均时间复杂度都为 O(log n)。
- 缺点：在极端情况下可能退化成链表，时间复杂度降为 O(n)。
平衡二叉搜索树 (Balanced BST)：
- 特点：为了解决BST的退化问题，通过自平衡操作（如旋转），确保树的高度大致保持在 log n 级别。
- Java实现：java.util.TreeMap 和 java.util.TreeSet 的底层就是一种自平衡的红黑树 (Red-Black Tree)。
- 应用场景：当需要存储有序数据，并且要进行高效的增删改查时，比如数据库索引、排行榜。
堆 (Heap)：
- 特点：一种特殊的完全二叉树，分为大顶堆（父节点大于等于子节点）和小顶堆（父节点小于等于子节点）。
- 优点：可以以 O(1) 的时间复杂度获取到最大值或最小值，插入和删除的复杂度是 O(log n)。
- Java实现：java.util.PriorityQueue（优先队列），其底层就是用堆实现的。
- 应用场景：实现优先队列、求“Top K”问题、堆排序。
字典树 (Trie / Prefix Tree)：
- 特点：一种专门用于高效存储和检索字符串的多叉树。
- 应用场景：搜索引擎的自动补全/联想提示、IP路由表、拼写检查。

4. 图结构 (Graph Structures)

图 (Graph)：
- 特点：由顶点（Vertex）和边（Edge）组成，用于表示多对多的关系，比树形结构更复杂。
- Java实现：Java标准库中没有直接的图实现，通常需要我们自己根据场景，使用邻接矩阵或邻接表来构建。
- 应用场景：社交网络的好友关系、地图软件的路径规划、依赖关系分析。

总结对比

数据结构	主要优点	主要缺点	Java中的实现
ArrayList	O(1) 随机访问	O(n) 插入/删除	动态数组
LinkedList	O(1) 插入/删除	O(n) 随机访问	双向链表
HashMap	O(1) 平均增删查	无序，哈希冲突影响性能	哈希表
TreeMap	O(log n) 增删查，且有序	性能略低于HashMap	红黑树
PriorityQueue	O(1) 查最值，O(log n) 增删	只能访问最值	堆

数组和链表区别是什么？

面试官您好，数组和链表是两种最基础也是最重要的线性数据结构。它们的核心区别主要体现在内存存储方式上，这个根本区别导致了它们在访问效率、插入删除效率、内存使用和缓存友好度上表现出截然不同的特性。

1. 内存存储方式（根本区别）

数组 (Array)：在内存中是一块连续的存储空间。它在创建时就需要指定大小（或在动态数组中有一个初始容量），所有元素都紧密地挨在一起。
链表 (Linked List)：在内存中是非连续的、离散的存储空间。它由一系列独立的节点组成，每个节点除了存放数据外，还必须包含一个或多个指针，用来指向下一个（或上一个）节点，通过指针将这些离散的节点串联起来。

2. 访问效率（读操作）

数组：极高。因为内存是连续的，我们可以通过一个简单的数学公式 address = base_address + index * element_size 直接计算出任何一个元素的内存地址，从而实现O(1)时间复杂度的随机访问。
链表：较低。由于内存不连续，我们无法直接定位到某个元素，必须从头节点（head）开始，沿着指针一个一个地向后遍历，直到找到目标元素。因此，它的随机访问时间复杂度为O(n)。

3. 插入和删除效率（写操作）

数组：较低。
- 插入：在一个非末尾的位置插入元素，需要将该位置之后的所有元素都向后移动一位，以腾出空间。
- 删除：删除一个非末尾位置的元素后，需要将该位置之后的所有元素都向前移动一位，以填补空缺。
- 这两种操作的平均时间复杂度都是O(n)。
链表：极高。
- 插入/删除：只需要找到目标位置的前驱和后继节点，然后修改它们的指针指向即可，无需移动任何其他数据。
- 在已经定位到目标位置的前提下，这个操作的时间复杂度是O(1)。（需要注意，如果算上查找目标位置的时间，总复杂度仍然是O(n)）

4. 内存使用与CPU缓存友好度

数组：
- 内存使用：可能会造成一定的空间浪费。比如，一个动态数组为了减少扩容次数，可能会预分配比实际需要更多的空间。
- 缓存友好度：非常高。由于数据在内存中是连续存放的，当CPU访问一个数组元素时，根据空间局部性原理，它会把该元素周围的数据也一起加载到高速缓存（CPU Cache）中。这样，当程序接下来访问相邻元素时，就可以直接从缓存中快速读取，大大提升了遍历速度。
链表：
- 内存使用：除了数据本身，每个节点都需要额外的空间来存储指针，所以总的内存开销会比数组大。
- 缓存友好度：非常低。因为链表的节点在内存中是随机分布的，访问一个节点后，下一个节点很可能不在CPU缓存中，导致缓存频繁失效（Cache Miss），需要从主内存中重新加载，这会严重影响性能。

总结对比表

特性/维度	数组 (Array)	链表 (Linked List)
内存结构	连续存储	离散存储
随机访问 (读)	O(1)，极快	O(n)，慢
插入/删除 (写)	O(n)，慢	O(1) (定位后)，快
内存开销	可能有预分配浪费，但无指针开销	有额外的指针开销
缓存友好度	高，遍历速度快	低，遍历时缓存命中率低
适用场景	读多写少，需要频繁按索引访问的场景	写多读少，需要频繁插入删除的场景
Java实现	`ArrayList`	`LinkedList`

在实际开发中，由于现代CPU的缓存机制对性能影响巨大，ArrayList 在绝大多数情况下的综合性能都优于 LinkedList，即使是在涉及部分插入/删除的场景。只有在需要对列表的头部和尾部进行大量操作时，LinkedList 作为队列（Deque）的优势才能真正体现出来。

说一下队列和栈的区别

面试官您好，队列和栈都是非常重要的线性数据结构，它们最核心的区别在于数据进出的规则不同，这导致了它们的应用场景也截然不同。

可以把它们想象成两种不同的通道：

队列 (Queue) 就像一个 “单向隧道”或者“排队买票”。先进去的人先出来，遵循先进先出 (First-In, First-Out, FIFO) 的原则。
栈 (Stack) 就像一个 “死胡同”或者“一摞盘子”。最后放进去的盘子最先被拿出来，遵循后进先出 (Last-In, First-Out, LIFO) 的原则。

我从以下几个方面来详细对比它们：

1. 操作规则（核心区别）

队列：
- 它有两个开口：一个队尾（Rear/Tail）用于入队（Enqueue），一个队头（Front/Head）用于出队（Dequeue）。
- 数据只能从队尾进，从队头出。
栈：
- 它只有一个开口，就是栈顶（Top）。
- 所有的入栈（Push） 和出栈（Pop） 操作都在栈顶进行。

2. 元素访问顺序

队列：元素的处理顺序和它们被添加的顺序是完全一致的。先添加的任务会被先处理，保证了公平性。
栈：元素的处理顺序和它们被添加的顺序是完全相反的。最后添加的元素会被最先处理，这体现了一种“后来者居上”或者“逆序”的特性。

3. 应用场景

正是因为它们操作规则的不同，导致了它们在解决问题时扮演的角色完全不同。

队列的应用场景（强调“公平”和“顺序”）：
- 任务调度/缓冲：比如操作系统的进程调度、线程池的任务队列。新来的任务排在队尾，工作线程从队头取任务执行，保证了先来先服务。
- 广度优先搜索 (BFS)：在图或树的遍历中，BFS利用队列来保证一层一层地按顺序访问节点。
- 消息队列 (Message Queue)：在分布式系统中，用作生产者和消费者之间的解耦和异步通信，实现削峰填谷。
栈的应用场景（强调“逆序”、“配对”和“现场保存”）：
- 函数调用栈：这是最经典的应用。每当一个函数被调用，它的上下文信息（参数、局部变量、返回地址）就被压入栈中；函数返回时，再从栈顶弹出，恢复调用者的现场。
- 表达式求值/语法解析：比如中缀表达式转后缀表达式，以及计算后缀表达式的值。
- 括号匹配：用栈来检查代码或表达式中的括号是否成对出现。
- 撤销/重做 (Undo/Redo) 功能：将用户的操作依次压入“操作栈”，撤销就是出栈，重做就是反向操作。
- 深度优先搜索 (DFS)：无论是显式使用栈，还是通过递归（递归本身就是利用函数调用栈），DFS都体现了栈的后进先出思想。

4. Java中的实现

队列：由 java.util.Queue 接口定义，常用实现类有 LinkedList 和 ArrayDeque。
栈：虽然有 java.util.Stack 类，但它基于 Vector 实现，性能较差，已不推荐使用。现在官方推荐使用 java.util.Deque (双端队列) 接口及其实现类（如 ArrayDeque）来模拟栈的行为，因为它提供了更丰富的 push/pop API，且性能更好。

总结对比表

特性	队列 (Queue)	栈 (Stack)
规则	先进先出 (FIFO)	后进先出 (LIFO)
操作端	队尾入队，队头出队 (两个口)	栈顶入栈，栈顶出栈 (一个口)
核心思想	公平排队、顺序处理	逆序处理、现场保存与恢复
典型应用	任务队列、BFS、消息中间件	函数调用、括号匹配、Undo功能、DFS
Java实现	`Queue` 接口 (`LinkedList`, `ArrayDeque`)	`Deque` 接口 (`ArrayDeque`)

介绍一下数据结构中的栈？怎么用Java实现？

面试官您好，栈（Stack）是一种非常重要的、遵循后进先出（Last-In, First-Out, LIFO） 原则的线性数据结构。

1. 什么是栈？

您可以把栈想象成一个一摞盘子或者一个死胡同。所有的操作都只能在一端进行，这一端我们称之为栈顶（Top）。

入栈 (Push)：就像往这摞盘子最上面放一个新盘子。
出栈 (Pop)：就像从最上面拿走一个盘子。

这个“后进先出”的特性，决定了最后放进去的元素，总是最先被取出来。

核心操作包括：

push(item): 将一个元素压入栈顶。
pop(): 移除并返回栈顶的元素。
peek(): 查看栈顶的元素，但不移除它。
isEmpty(): 检查栈是否为空。
size(): 返回栈中元素的数量。

2. 栈的应用场景

栈的LIFO特性使它在计算机科学中应用极为广泛，特别是在需要保存和恢复现场或者处理逆序关系的场景：

函数调用栈：这是最经典的应用。每当一个函数被调用，它的上下文信息（参数、局部变量、返回地址）就被压入一个系统栈中；当函数返回时，再从栈顶弹出，恢复调用者的现场。
表达式求值：如中缀表达式转后缀表达式，以及后缀表达式的计算。
括号匹配：用栈来检查代码或表达式中的各种括号是否成对出现。
浏览器的“后退”功能：将访问过的页面URL依次压入栈中，点击后退就是一次出栈操作。
深度优先搜索 (DFS)：在图或树的遍历中，可以使用栈来保存待访问的节点。

3. 如何用 Java 实现栈？

在Java中，实现栈主要有以下几种方式：

方式一：官方推荐方式 — 使用 `Deque` 接口

在现代Java开发中，官方不再推荐使用古老的 java.util.Stack 类（因为它继承自 Vector，有不必要的同步开销）。而是强烈推荐使用 Deque（双端队列）接口及其实现类 ArrayDeque 来模拟栈的行为。

ArrayDeque 提供了标准的 push, pop, peek 方法，并且性能比 Stack 更好。

import java.util.Deque;
import java.util.ArrayDeque;

public class StackExample {
    public static void main(String[] args) {
        // 使用ArrayDeque实现栈
        Deque<String> stack = new ArrayDeque<>();

        // 入栈
        stack.push("Apple");
        stack.push("Banana");
        stack.push("Cherry");

        System.out.println("栈顶元素: " + stack.peek()); // 输出: Cherry

        // 出栈
        while (!stack.isEmpty()) {
            System.out.println("出栈: " + stack.pop());
        }
        // 输出顺序: Cherry, Banana, Apple
    }
}

方式二：手动实现 — 基于数组

这是一种常见的面试题，用于考察对数据结构基本原理的理解。

public class ArrayStack<E> {
    private Object[] stack;
    private int top; // 指向栈顶元素的索引
    private int capacity;

    public ArrayStack(int capacity) {
        this.capacity = capacity;
        this.stack = new Object[capacity];
        this.top = -1; // 初始化栈顶指针，-1表示栈为空
    }

    public boolean push(E item) {
        if (isFull()) {
            System.out.println("栈已满，无法入栈！");
            return false;
        }
        stack[++top] = item;
        return true;
    }

    @SuppressWarnings("unchecked")
    public E pop() {
        if (isEmpty()) {
            throw new IllegalStateException("栈为空，无法出栈！");
        }
        return (E) stack[top--];
    }

    @SuppressWarnings("unchecked")
    public E peek() {
        if (isEmpty()) {
            throw new IllegalStateException("栈为空！");
        }
        return (E) stack[top];
    }

    public boolean isEmpty() {
        return top == -1;
    }

    public boolean isFull() {
        return top == capacity - 1;
    }

    public int size() {
        return top + 1;
    }
}

优缺点分析：

优点：实现简单，由于内存连续，缓存命中率高，访问速度快。
缺点：容量固定，需要预先指定大小。如果空间用尽，可能会发生“栈溢出”；如果分配空间过大，则会造成浪费。

方式三：手动实现 — 基于链表

这种方式可以实现一个动态扩容的栈。

public class LinkedStack<E> {
    // 内部节点类
    private static class Node<E> {
        E item;
        Node<E> next;

        Node(E item, Node<E> next) {
            this.item = item;
            this.next = next;
        }
    }

    private Node<E> top; // 指向栈顶节点
    private int size;

    public LinkedStack() {
        this.top = null;
        this.size = 0;
    }

    public void push(E item) {
        // 新节点成为新的栈顶，其next指向旧的栈顶
        Node<E> newNode = new Node<>(item, this.top);
        this.top = newNode;
        size++;
    }

    public E pop() {
        if (isEmpty()) {
            throw new IllegalStateException("栈为空，无法出栈！");
        }
        E item = top.item;
        top = top.next; // 将栈顶指针移到下一个节点
        size--;
        return item;
    }

    public E peek() {
        if (isEmpty()) {
            throw new IllegalStateException("栈为空！");
        }
        return top.item;
    }

    public boolean isEmpty() {
        return top == null;
    }



    public int size() {
        return size;
    }
}

优缺点分析：

优点：容量是动态的，按需分配，不会有溢出问题。
缺点：每个元素都需要额外的空间来存储指针，有一定的内存开销。由于内存不连续，缓存友好度不如数组。

如何使用两个栈实现队列？

面试官您好，用两个栈来实现一个队列是一个非常经典的算法题，它的核心思想是利用栈的 “后进先出”（LIFO） 特性，通过两次“反转”，来巧妙地模拟出队列的 “先进先出”（FIFO） 特性。

实现思路

我们需要准备两个栈：

一个输入栈 (inStack)：专门负责处理所有入队 (enqueue) 的操作。
一个输出栈 (outStack)：专门负责处理所有出队 (dequeue) 和查看队头 (peek) 的操作。

核心规则：

入队 add(element)：非常简单，直接将元素 push 到 inStack 中。
出队 poll()：这是最关键的一步。
1. 首先，检查 outStack 是否为空。
2. 如果 outStack 不为空，说明里面还有之前“倒腾”过来的、顺序正确的元素，直接 pop 出栈顶元素即可。
3. 如果 outStack 为空，就必须进行一次 “倒水” 操作：将 inStack 中的所有元素，一个一个地 pop 出来，然后 push 到 outStack 中。这个过程完成后，inStack 会变空，而 outStack 中的元素顺序就和它们最初入队的顺序完全一致了（先进的元素现在位于栈顶）。然后再从 outStack 中 pop 出栈顶元素。
4. 如果两个栈都为空，说明队列为空，返回 null。
查看队头 peek()：逻辑和出队完全一样，只是最后一步不是 pop，而是 peek 查看 outStack 的栈顶元素。

Java 代码实现

下面是一个具体的Java代码实现，遵循了队列的接口规范：

import java.util.ArrayDeque;
import java.util.Deque;
import java.util.NoSuchElementException;

public class QueueWithTwoStacks<E> {

    private final Deque<E> inStack = new ArrayDeque<>();
    private final Deque<E> outStack = new ArrayDeque<>();

    /**
     * 入队操作
     */
    public void add(E element) {
        // 直接压入输入栈
        inStack.push(element);
    }

    /**
     * 出队操作
     */
    public E poll() {
        // 如果输出栈为空，则尝试从输入栈“倒水”
        if (outStack.isEmpty()) {
            transferInToOut();
        }
        // 如果输出栈仍然为空（说明整个队列都为空），返回null
        if (outStack.isEmpty()) {
            return null;
        }
        // 从输出栈弹出元素
        return outStack.pop();
    }
    
    /**
     * 查看队头元素
     */
    public E peek() {
        if (outStack.isEmpty()) {
            transferInToOut();
        }
        if (outStack.isEmpty()) {
            return null;
        }
        return outStack.peek();
    }
    
    /**
     * 检查队列是否为空
     */
    public boolean isEmpty() {
        return inStack.isEmpty() && outStack.isEmpty();
    }

    /**
     * 核心的“倒水”操作：将输入栈的元素转移到输出栈
     */
    private void transferInToOut() {
        while (!inStack.isEmpty()) {
            outStack.push(inStack.pop());
        }
    }
}

复杂度分析

这个实现最巧妙的地方在于它的摊还时间复杂度（Amortized Time Complexity）。

入队 add()：时间复杂度永远是 O(1)。
出队 poll() 和查看队头 peek()：
- 最坏情况：当 outStack 为空时，需要将 inStack 中的 n 个元素全部转移，此时的单次操作复杂度是 O(n)。
- 最好情况：当 outStack 不为空时，直接操作，复杂度是 O(1)。
- 摊还分析：我们可以看到，每个元素一生中最多只会被 push 进 inStack 一次，pop 出 inStack 一次，push 进 outStack 一次，pop 出 outStack 一次。总共最多4次操作。所以，对于一系列连续的操作来说，平均到每一次出队操作上的时间复杂度是摊还 O(1)。

这个设计用一种巧妙的方式平衡了操作的开销，使得在宏观上，队列的性能依然非常高效。

常见的队列有哪些及应用场景？

面试官您好，队列（Queue）作为一种核心数据结构，在不同的应用场景下演化出了多种形态。我将它们分为单体应用内队列和分布式系统队列两大类来介绍。

一、单体应用内队列 (In-Process Queues)

这类队列运行在单个应用程序的内存中，主要用于解决线程间的协作和数据传递问题。

1. 普通队列 (FIFO Queues)

特点：最基础的队列，严格遵循先进先出（FIFO） 原则。
Java实现：由 java.util.Queue 接口定义。
- LinkedList：基于链表实现，在队头和队尾进行增删操作的效率很高。
- ArrayDeque：基于动态数组实现，由于其优秀的缓存局部性，在大多数情况下性能优于 LinkedList。
应用场景：
- 广度优先搜索（BFS）：在图或树的遍历中，利用队列来保证一层一层地按顺序访问节点。
- 任务缓冲：比如打印机任务队列，用户提交的打印任务按顺序排队等待处理。

2. 阻塞队列 (Blocking Queues)

特点：这是Java并发编程的利器。它是一种线程安全的队列，并且带有阻塞特性：
- 当队列满时，尝试入队的生产者线程会被阻塞，直到队列有空位。
- 当队列空时，尝试出队的消费者线程会被阻塞，直到队列有新元素。
Java实现：由 java.util.concurrent.BlockingQueue 接口定义。
- ArrayBlockingQueue：基于数组的有界阻塞队列，创建时必须指定容量，支持公平/非公平策略。
- LinkedBlockingQueue：基于链表的阻塞队列，可以是有界的（容量默认为Integer.MAX_VALUE），吞吐量通常高于ArrayBlockingQueue。
- SynchronousQueue：一个不存储元素的“接头”队列，每个put操作必须等待一个take操作，反之亦然。非常适合传递性场景。
应用场景：
- 线程池的任务队列：这是最经典的应用。ThreadPoolExecutor 使用 BlockingQueue 来存放等待执行的任务，完美地协调了任务提交者和工作线程。
- 生产者-消费者模型：任何需要解耦生产者和消费者、实现异步处理的场景，比如日志系统，业务线程是生产者，写日志的线程是消费者。

3. 优先队列 (Priority Queues)

特点：队列中的元素不再遵循FIFO，而是根据其优先级进行排序。每次出队的都是当前队列中优先级最高的元素。
Java实现：java.util.PriorityQueue，其底层是基于二叉堆（Heap） 实现的。
应用场景：
- 任务调度：操作系统根据任务的优先级来决定先执行哪个任务。
- “Top K” 问题：在海量数据中找出最大或最小的K个元素。例如，用一个大小为K的小顶堆，就可以高效地找到Top K大的元素。
- 网络协议中的优先级处理：比如QoS（服务质量）应用中，需要优先处理高优先级的网络包。

4. 双端队列 (Deques)

特点：队列的两端（队头和队尾）都既可以入队也可以出队，是一种更灵活的队列。
Java实现：由 java.util.Deque 接口定义，ArrayDeque 是其首选实现。
应用场景：
- 实现栈（Stack）：由于 java.util.Stack 类性能不佳，Deque 已成为官方推荐的实现栈的方式（push 对应 addFirst，pop 对应 removeFirst）。
- 工作窃取（Work-Stealing）算法：在Java的 Fork/Join 框架中，每个线程都维护一个双端队列。线程从自己队列的头部获取任务，当自己队列为空时，可以从其他线程队列的尾部“窃取”一个任务来执行，以减少线程竞争，提高效率。

二、分布式系统队列 (Distributed Queues)

这类队列通常作为独立的消息中间件（Message Queue, MQ）存在，用于解决跨进程、跨服务器的通信问题。

特点：独立于应用的服务，提供高可用、高可靠的消息传递，是分布式系统架构的核心组件。
代表产品：Kafka, RabbitMQ, RocketMQ。
应用场景：
- 系统解耦：服务的调用方（生产者）和被调用方（消费者）通过消息队列间接通信，任何一方的变更或宕机都不会直接影响对方。
- 异步通信：对于一些耗时的操作，如发送邮件、生成报表等，用户请求可以先写入消息队列并立即返回，由后台服务异步地消费处理，极大提升了用户体验。
- 流量削峰（削峰填谷）：在秒杀、大促等场景下，瞬间的巨大流量可以先被积压在消息队列中，后端系统再按照自己的最大处理能力平稳地进行消费，防止系统被冲垮。

总结对比

队列类型	核心特性	典型应用场景
普通队列	先进先出 (FIFO)	BFS、任务缓冲
阻塞队列	线程安全、生产者/消费者阻塞	线程池、生产者-消费者模型
优先队列	按优先级出队	任务调度、Top K 问题
双端队列	两端均可入队/出队	实现栈、工作窃取算法
分布式队列(MQ)	跨进程/跨服务器，高可用、高可靠	系统解耦、异步通信、流量削峰

平衡二叉树结构是怎么样的？

面试官您好，要理解平衡二叉树，我们首先需要知道它解决了什么问题。

1. 为什么需要平衡二叉树？—— 普通二叉搜索树的缺陷

我们知道，普通二叉搜索树 (Binary Search Tree, BST) 的定义是：对于任意节点，其左子树上所有节点的值都小于它，右子树上所有节点的值都大于它。这个特性使得查找、插入、删除操作的平均时间复杂度可以达到 O(log n)，效率很高。

但是，BST 有一个致命的缺陷：它的性能严重依赖于树的形态。

理想情况：如果插入的数据是随机的，BST 可能会形成一棵比较“匀称”的树，其高度约等于 log n，此时性能最好。
最坏情况：如果我们插入的是一个有序序列（比如 1, 2, 3, 4, 5），BST 就会退化成一条链表。在这种情况下，树的高度等于节点数 n，所有操作的时间复杂度都会恶化到 O(n)，失去了树形结构应有的优势。

平衡二叉树的诞生，就是为了解决普通二叉搜索树的这种“退化”问题。

2. 什么是平衡二叉树 (Balanced Binary Tree)？

平衡二叉树的本质，仍然是一棵二叉搜索树，它完全继承了BST的性质。但在此基础上，它增加了一个严格的“平衡”约束，以确保树永远不会变得“头重脚轻”或“一条腿长一条腿短”。

核心定义与特性：

它首先必须是一棵二叉搜索树。
对于树中的任意一个节点，其左子树的高度和右子树的高度之差的绝对值不能超过1。这个高度差，我们通常称之为“平衡因子”。
它的任意一个节点的左右子树也必须是一棵平衡二叉树。

这个定义是递归的，它保证了整棵树从上到下都是平衡的。通过维持这个平衡，平衡二叉树可以确保其高度始终保持在 O(log n) 的量级，从而保证了所有操作的性能始终稳定在 O(log n)。

3. 如何维持平衡？—— 自平衡操作

平衡二叉树的神奇之处在于，它有一套自平衡（Self-Balancing） 的机制。当进行插入或删除操作，导致某个节点的平衡因子大于1（即树失衡）时，它会自动进行调整来恢复平衡。

这个调整的核心操作就是——旋转（Rotation）。

旋转：是一种通过修改节点之间父子关系的局部操作，它可以在不破坏二叉搜索树性质的前提下，改变树的结构，降低树的高度。

旋转主要分为两种基本类型：

左旋 (Left Rotation)：将一个节点的右孩子“提拔”为新的父节点，原来的父节点“降级”为新父节点的左孩子。
右旋 (Right Rotation)：与左旋相反，将一个节点的左孩子“提拔”为新的父节点。

根据失衡的不同情况（比如，是插入到左子树的左边，还是左子树的右边），需要进行的旋转组合也不同，主要分为四种失衡类型：LL（左左）、RR（右右）、LR（左右）、RL（右左）。通过一次或两次旋转，就可以使失衡的子树重新恢复平衡。

4. 常见的平衡二叉树实现

AVL树：这是最严格的平衡二叉树，它严格要求任何节点的平衡因子绝对值不能超过1。因此它的查找效率最高，但插入和删除时为了维持平衡，可能需要进行更多的旋转操作，维护成本较高。
红黑树 (Red-Black Tree)：这是一种非严格的平衡二叉树。它通过引入“颜色”（红或黑）和五条简单的着色规则，来近似地维持树的平衡。它不追求绝对的平衡，只保证从根到最远叶子节点的路径长度，不超过到最近叶子节点路径长度的两倍。
- 优点：相比AVL树，红黑树在插入和删除时需要进行的调整操作（旋转和变色）更少，因此写操作的性能更好。
- 应用：正因为这种在查找和写入性能上的良好平衡，红黑树在工程实践中应用得更为广泛。比如，Java的 TreeMap 和 TreeSet，以及Linux内核中的多种数据结构，都是用红黑树实现的。

总结一下：平衡二叉树通过引入严格的平衡约束和自平衡的旋转机制，确保了树的高度始终在 O(log n) 级别，从而解决了普通二叉搜索树可能退化成链表的性能问题，为高效的动态查找提供了可靠的性能保障。

红黑树是什么，跳表是什么？

面试官您好，红黑树和跳表都是非常优秀的数据结构，它们都实现了有序集合的高效动态操作，提供了 O(log n) 时间复杂度的增、删、查性能。但它们实现这一目标的思路和底层结构完全不同，这导致了它们在实现复杂度、并发性能和适用场景上各有千秋。

红黑树 (Red-Black Tree)

1. 它是什么？

红黑树是一种近似平衡的二叉搜索树。它并不是追求像AVL树那样“绝对的平衡”（左右子树高度差不超过1），而是通过一套相对宽松的规则，来确保树不会过度倾斜。

2. 它是如何工作的？—— 五条核心规则

它在普通二叉搜索树的基础上，为每个节点增加了一个“颜色”（红色或黑色）属性，并强制要求整棵树必须始终满足以下五条规则：

每个节点要么是红色，要么是黑色。
根节点必须是黑色的。
所有叶子节点（NIL节点，即空节点）都是黑色的。
关键规则1：红色节点的子节点必须是黑色的。（杜绝了连续的红色节点）
关键规则2：从任意一个节点出发，到其所有后代叶子节点的路径上，黑色节点的数量必须相同。

通过这五条规则，特别是后两条，红黑树巧妙地保证了最长路径（红黑相间的路径）不会超过最短路径（全是黑节点的路径）的两倍。这就确保了树的高度始终保持在 O(log n) 级别，从而保证了性能。

当插入或删除节点破坏了这些规则时，红黑树会通过变色和旋转（左旋、右旋）等局部操作，来重新恢复平衡。

3. 优缺点与应用

优点：
- 性能稳定且高效，所有操作的最坏时间复杂度都是 O(log n)。
- 是一种非常经典、经过充分验证的平衡树结构。
缺点：
- 实现复杂：规则多，旋转和变色的逻辑判断比较复杂，手写和调试都很有挑战性。
- 并发性能差：在多线程环境下，写操作（插入/删除）的调整范围可能很大（从叶子到根），导致锁的粒度很大，难以实现高效的并发控制。
应用：
- Java：TreeMap, TreeSet, ConcurrentSkipListMap (在JDK 8之前)。
- C++ STL：map, set。
- Linux内核：用它来管理内存区域、调度进程等。

跳表 (Skip List)

1. 它是什么？

跳表是一种基于有序链表的、通过增加多级“快速通道”（索引） 来实现高效查找的数据结构。它的思想非常巧妙，有点像“空间换时间”。

2. 它是如何工作的？—— “给链表建高速公路”

底层 (Level 0)：首先，它有一个完整的、有序的普通链表，包含了所有的数据。
建立索引层：在底层链表的基础上，它会随机地从一些节点中“提拔”出一部分，形成上一层的“快速通道”（索引层）。然后，再从这个索引层中，再提拔一部分形成更上一层的索引… 以此类推，直到最顶层只有少数几个节点。
查找过程：查找一个元素时，我们从最高层的索引开始，向右遍历。
- 如果下一个节点的值比目标值大，或者到了这层的末尾，就通过一个“向下”的指针，降到下一层继续向右查找。
- 这个过程就像坐火车，先坐最快的高铁（高层索引）到离目标最近的大站，然后换乘动车（中层索引），最后换乘地铁（底层链表），最终精准地找到目标。

由于每一层都是通过随机的方式构建的（通常是抛硬币，决定一个节点是否要被提升到上一层），所以跳表在统计学上能保证其平均高度为 O(log n)，从而实现了 O(log n) 的平均查找复杂度。插入和删除操作也类似，先找到位置，再更新各层的指针。

3. 优缺点与应用

优点：
- 实现简单：相比红黑树，跳表的插入、删除、查找等逻辑都更直观、更容易理解和实现。代码量通常也更少。
- 并发性能好：插入或删除一个节点，通常只需要修改其前后的局部指针，锁的粒度可以做得很小，因此更容易实现高效的并发跳表。
缺点：
- 空间换时间：需要额外的内存来存储各级索引的指针，空间复杂度比红黑树要高一些。
应用：
- Redis：它的有序集合（Sorted Set） 就是用跳表（结合哈希表）来实现的，充分利用了跳表的高效范围查询和简单实现。
- LevelDB/RocksDB：这些存储引擎内部使用跳表作为内存中的数据结构（MemTable），因为它写操作快，并且天然有序，便于后续合并到磁盘。
- Java：ConcurrentSkipListMap 和 ConcurrentSkipListSet，它们是JDK中用于替代 TreeMap/Set 的高效线程安全实现。

总结对比

特性	红黑树 (Red-Black Tree)	跳表 (Skip List)
底层结构	树形结构	链表 + 多级索引
性能保证	严格的规则保证 (确定性)	随机化保证 (概率性)
实现复杂度	高，逻辑复杂，调试困难	低，逻辑清晰，易于实现
并发支持	差，写操作锁粒度大	好，写操作影响范围小，易于实现高并发
空间占用	相对较低	相对较高 (需要存储多层索引指针)
典型代表	C++ STL `map`, Java `TreeMap`	Redis `ZSET`, Java `ConcurrentSkipListMap`

总的来说，红黑树是一种经典的、确定性的平衡数据结构，在单线程环境下非常优秀。而跳表则以其简单、高效、易于并发的特点，在现代多核、高并发的系统中，越来越受到青天睐。

红黑树和AVL树相比查询性能好还是插入性能好一些？

面试官您好，AVL树和红黑树都是非常优秀的自平衡二叉搜索树，它们都保证了操作的时间复杂度在 O(log n) 级别。但它们在平衡策略上的“严格”与“宽松”之别，导致了它们在查询性能和插入/删除性能上各有侧重。

简单来说，结论是：

查询性能：AVL树 略优于红黑树。
插入/删除性能：红黑树 明显优于 AVL树。

下面我来详细解释一下原因：

1. 查询性能对比：AVL树胜在“极致平衡”

AVL树：它是一种高度平衡的树。它严格要求任何节点的左右子树高度差的绝对值不能超过1。这个苛刻的条件使得AVL树在结构上尽可能地“矮”和“胖”，其高度无限接近于理论最小值 log n。
- 结果：更低的树高意味着更短的平均查找路径。因此，在纯粹的查询场景下，AVL树的性能是最优的。
红黑树：它是一种弱平衡或者说“大致平衡”的树。它不直接关心高度差，而是通过一套颜色规则来保证最长路径（从根到最远叶子）的长度不超过最短路径的两倍。
- 结果：这导致红黑树的高度可能比同样节点数的AVL树要高一些。更高的树高自然意味着平均查找路径会稍长，所以查询性能会略逊于AVL树。

结论：在查询性能上，AVL树 > 红黑树。

2. 插入/删除性能对比：红黑树胜在“调整成本低”

插入和删除操作都包含两个阶段：查找和调整。它们的查找性能差异如上所述，关键在于调整阶段的开销。

AVL树：
- 调整方式：只通过旋转来恢复平衡。
- 调整成本：由于其严格的平衡要求，一次插入或删除很可能导致从插入点到根节点的路径上多个节点的平衡因子被破坏。因此，可能需要进行多次旋转，甚至是一路旋转到根节点，调整的成本相对较高。
红黑树：
- 调整方式：通过变色和旋转两种手段来恢复平衡。
- 调整成本：红黑树的调整过程非常高效。大部分情况下，它可以通过少量的变色操作就恢复平衡，因为变色不会改变树的结构。只有在少数情况下才需要进行旋转，并且最多只需要两次旋转就可以解决失衡问题。
- 结果：相比AVL树，红黑树在插入和删除时需要进行的调整操作更少、更局部化，因此整体的写入性能要好得多。

结论：在插入/删除性能上，红黑树 >> AVL树。

总结与应用场景

特性/维度	AVL树 (高度平衡)	红黑树 (弱平衡)
平衡策略	严格：高度差 ≤ 1	宽松：最长路径 ≤ 2 * 最短路径
查询性能	更优 (树高更低)	较优 (树高可能稍高)
写入性能	较差 (调整开销大，可能多次旋转)	更优 (调整开销小，变色为主，最多2次旋转)
适用场景	读多写少的场景，如数据库索引	读写频繁的场景，需要兼顾查询和写入性能

正因为红黑树在查询和写入性能上取得了更好的平衡，使得它在工程实践中的应用远比AVL树广泛。例如，Java的 TreeMap 和 TreeSet，C++ STL的 map 和 set，以及Linux内核都选择了红黑树作为其核心的有序数据结构实现。而AVL树更多地出现在教科书和理论研究中。

B+树的特点是什么？

面试官您好，B+树是一种为磁盘等外部存储设备量身定制的多路平衡查找树。它的所有设计，最终都指向一个核心目标：尽可能地减少磁盘I/O次数，从而极大地提升在大数据量下的查询效率。

B+树的特点，可以从它的结构设计和操作优势两个层面来理解。

1. 结构设计上的三大特点

a. 所有数据都只存在于叶子节点

非叶子节点（索引节点）：它们只存储键（Key）的索引信息，不存储任何实际的数据（Value）。这些节点的作用就像一本书的“目录”，它们的唯一任务就是引导查询，告诉我们应该去哪个子树继续查找。
叶子节点（数据节点）：它们包含了所有的键以及与之对应的实际数据。所有的查询，最终都必须“落到”叶子节点才能找到数据。
带来的好处：由于非叶子节点不存数据，所以它们非常“瘦小”。这意味着在同样大小的一个磁盘块（比如一页4KB）中，可以存放更多的键和指针。这使得B+树的 “扇出”（fan-out）非常高，树也就变得更加“矮胖”。更矮的树高，直接意味着从根节点到叶子节点的查询路径更短，需要进行的磁盘I/O次数就更少。

b. 所有叶子节点构成一个有序链表

所有的叶子节点，除了存储数据外，还会包含一个指向下一个叶子节点的指针。
这样，所有的叶子节点就串联成了一个有序的双向链表（通常是双向的，便于正序和逆序遍历）。
带来的好处：这个设计对于范围查询（Range Query）和全表遍历是颠覆性的优化。
- 比如要查询 ID between 100 and 500 的所有数据，我们只需要先定位到 ID=100 所在的叶子节点，然后就可以沿着这个有序链表，一直向后遍历，直到 ID > 500 为止。这个过程完全是顺序的磁盘I/O，效率极高，避免了传统B树需要反复从中序遍历返回上层节点再下来的低效操作。

c. 多路平衡（M-way Tree）

B+树不再是二叉树，而是多叉树。每个非叶子节点可以拥有多个子节点（从几十到上千个）。
它通过一系列的分裂和合并操作，来保证从根节点到任意一个叶子节点的路径长度都是相同的。
带来的好处：再次强调，多路是为了提高扇出，而平衡是为了保证查询性能的稳定，确保任何查询的路径长度都一样短。

2. 操作上的优势

基于以上结构特点，B+树在数据库等场景中展现出巨大优势：

单点查询效率稳定且高：由于树的高度极低（通常3-4层就能支持上亿条数据），任何一次单点查询，只需要进行极少数（3-4次）的磁盘I/O即可完成。
范围查询和排序效率极高：得益于叶子节点的有序链表结构，范围查询和ORDER BY操作变得非常高效。
插入和删除效率稳定：通过节点的分裂和合并，B+树能动态地维持平衡，使得增删操作的时间复杂度也稳定在 O(log n) 级别。
更适合磁盘存储：它的设计充分利用了磁盘预读的空间局部性原理。当一个节点（通常对应一个磁盘页）被加载到内存时，它包含了大量的键和指针，这些数据很可能在接下来的查询中被用到，从而减少了后续的I/O请求。

总结：

B+树通过非叶子节点只存索引、数据全在叶子节点、叶子节点形成有序链表以及多路平衡这几大核心设计，完美地适应了磁盘的读写特性。它以极矮的树高和高效的范围查询能力，成为了关系型数据库（如MySQL的InnoDB）和文件系统索引实现的不二之选。

红黑树、B树和B+树发区别

面试官您好，红黑树、B树和B+树都是高效的自平衡查找树，但它们的设计目标和应用场景截然不同，这导致了它们在结构、性能和适用领域上存在巨大差异。

简单来说：

红黑树 是为内存中的动态数据设计的“瑞士军刀”。
B树和 B+树 则是为磁盘等慢速I/O设备量身定制的“文件柜”。

下面我从几个核心维度来详细对比它们：

1. 应用场景与设计目标 (最根本的区别)

红黑树：
- 场景：主要用于内存中的数据结构，比如Java的 TreeMap、C++ STL的 map、以及Linux内核中的多种数据管理。
- 目标：在内存中进行频繁的、动态的插入、删除和查找操作。因为内存访问速度极快，所以它的优化目标是减少CPU的计算和调整次数。
B树 / B+树：
- 场景：主要用于磁盘存储系统，如数据库索引（MySQL InnoDB）和文件系统。
- 目标：磁盘的I/O速度比内存慢几个数量级，是最大的性能瓶颈。因此，它们的核心设计目标是尽可能地减少磁盘I/O的次数。

2. 结构类型与高度 (叉数)

红黑树：是严格的二叉树，每个节点最多只有两个子节点。其高度约为 O(log₂n)，在内存中这已经足够高效。
B树 / B+树：是多路查找树（M-way Tree），也叫“M叉树”。每个节点可以拥有成百上千个子节点。
- 优势：这种“矮胖”的结构，使得树的高度被极大地压缩。一棵高度为3-4层的B+树，就可以存储上亿条数据。极低的树高意味着从根节点到叶子节点，只需要进行极少数次（3-4次）的磁盘I/O。

3. 数据存放位置

这是 B树和 B+树 之间最核心的区别。

红黑树：每个节点都同时存储键（Key）和数据（Value/Data）。
B树：每个节点也都是同时存储键（Key）和数据（Value/Data）。这意味着，一次查询有可能在到达叶子节点之前，就在一个非叶子节点上找到了数据并返回。
B+树：做了一个重要的区分：
- 非叶子节点（索引节点）：只存储键（Key），不存储任何数据。它们纯粹作为索引存在。
- 叶子节点（数据节点）：存储了所有的键以及与之对应的数据。
- 优势：由于非叶子节点不存数据，它们变得非常“小”。一个磁盘页（如16KB）就可以容纳更多的键，使得树的 “扇出”（fan-out）更大，进一步降低了树的高度。

4. 查询性能 (单点查询 vs. 范围查询)

单点查询：
- 对于这三者，单点查询的时间复杂度都是 O(log n)。
- 但B树/B+树的 n 是以磁盘I/O次数来衡量的，其底数远大于2，所以实际性能远超红黑树。
- B树的查询可能在非叶子节点就结束，而B+树必须查到叶子节点，所以在最好情况下，B树可能稍快一点。但在大多数情况下，由于B+树更矮，这点差异可以忽略不计。
范围查询与遍历：这是 B+树的杀手锏。
- 红黑树和B树：要做范围查询，都需要进行复杂的中序遍历，可能需要在树的各层之间来回跳转，导致大量的随机磁盘I/O，性能很差。
- B+树：它的所有叶子节点之间通过指针形成了一个有序的双向链表。当进行范围查询时，只需要先定位到范围的起始点，然后就可以沿着这个链表进行顺序遍历，这对应到磁盘上就是顺序I/O，效率极高。

总结对比表

特性/维度	红黑树 (Red-Black Tree)	B树 (B-Tree)	B+树 (B+ Tree)
应用场景	内存数据结构 (如 `TreeMap`)	数据库/文件系统 (较少用)	数据库索引 (如 `MySQL InnoDB`)
性能目标	减少CPU计算/调整次数	减少磁盘I/O次数	减少磁盘I/O次数 + 优化范围查询
结构类型	二叉树	多路查找树 (M叉)	多路查找树 (M叉)
数据存储	所有节点存 Key + Data	所有节点存 Key + Data	非叶子节点只存Key，叶子节点存Key+Data
范围查询	差 (需中序遍历，随机I/O)	差 (需中序遍历，随机I/O)	极佳 (叶子节点构成有序链表，顺序I/O)
查询稳定性	稳定O(log n)	稳定O(log n)，但查询可能在不同深度结束	最稳定，所有查询都必须到达叶子层，路径长度一致

简单总结：

如果你在内存中需要一个有序的动态集合，用红黑树。
如果你在为磁盘设计一个索引系统，并且需要极高的范围查询性能，B+树是毋庸置疑的最佳选择。这就是为什么它能成为关系型数据库索引的标准实现。

堆是什么？

面试官您好，堆（Heap）是一种基于完全二叉树的、非常高效的数据结构。它的核心价值在于能够以 O(1) 的时间复杂度快速获取到集合中的最大值或最小值。

我可以从两大核心属性、底层实现、核心操作和典型应用场景这几个方面来详细阐述。

1. 堆的两大核心属性

一个合法的堆必须同时满足以下两个条件：

结构属性：它必须是一棵完全二叉树（Complete Binary Tree）。
- 这意味着树的每一层都是从左到右填满的，只有最后一层可能不满，并且最后一层的节点也都集中在左侧。这个结构属性非常重要，因为它使得我们可以用一个数组来高效地表示堆，而无需使用指针。
堆序属性（Heap Property）：
- 对于树中的任意一个节点，其值都必须大于或等于其所有子节点的值。我们称之为大顶堆（Max-Heap）。此时，堆顶元素永远是整个集合中的最大值。
- 或者，其值都必须小于或等于其所有子节点的值。我们称之为小顶堆（Min-Heap）。此时，堆顶元素永远是整个集合中的最小值。

2. 底层实现：数组

堆最巧妙的实现方式就是使用数组。由于它是完全二叉树，我们可以通过简单的数学计算来找到任意节点的父节点和子节点，无需任何指针：

假设一个节点的索引是 i（从0开始）。
它的父节点索引是 (i - 1) / 2。
它的左子节点索引是 2 * i + 1。
它的右子节点索引是 2 * i + 2。

这种实现方式不仅节省了存储指针的额外空间，还因为内存是连续的，所以CPU缓存友好度非常高。

3. 核心操作与时间复杂度

堆的核心操作在于，当插入或删除元素破坏了堆序属性后，它能通过高效的调整操作来恢复。

获取最值 peek()：直接返回数组的第一个元素（索引0），时间复杂度为 O(1)。
插入元素 add() / push()：
1. 将新元素添加到数组的末尾（即完全二叉树的下一个空位）。
2. 然后，让这个新元素不断地和它的父节点比较，如果它比父节点更“优先”（比如在大顶堆中它比父节点大），就和父节点交换位置。
3. 这个过程一直持续到它不再比父节点更优先，或者它到达了堆顶。这个自下而上的调整过程我们称为 “上浮”（Sift-up / Bubble-up）。
- 由于树的高度是 O(log n)，所以插入操作的时间复杂度为 O(log n)。
删除最值 poll() / pop()：
1. 将堆顶元素（数组第一个元素）与数组的最后一个元素交换位置。
2. 移除数组的最后一个元素（即原来的堆顶）。
3. 现在新的堆顶元素是原来树的最后一个节点，它很可能不满足堆序属性。
4. 让这个新的堆顶元素不断地和它的子节点中更“优先”的那个进行比较和交换，直到它不再违反堆序属性，或者它成为了叶子节点。这个自上而下的调整过程我们称为 “下沉”（Sift-down / Bubble-down）。
- 这个操作的时间复杂度同样是 O(log n)。

4. 典型应用场景

堆的这些特性，使它成为解决很多问题的利器。

实现优先队列（Priority Queue）：这是堆最直接、最经典的应用。java.util.PriorityQueue 的底层就是用堆实现的。无论是任务调度、事件处理，只要涉及到需要根据优先级处理元素的场景，优先队列都是首选。
求“Top K”问题：这是一个非常常见的面试题。比如，要在海量数据中找出最大的K个元素。
- 解决方案：我们可以维护一个大小为K的小顶堆。遍历数据，如果当前元素比堆顶元素大，就把堆顶元素替换掉，然后对堆进行调整。遍历完成后，堆里剩下的K个元素就是最大的K个。整个过程的时间复杂度是 O(n log k)。
堆排序（Heap Sort）：一种原地排序算法，时间复杂度稳定在 O(n log n)。

总结

特性/操作	描述	时间复杂度
底层实现	数组 (利用完全二叉树特性)	-
获取最值	直接访问堆顶 (数组索引0)	O(1)
插入元素	在末尾添加，然后“上浮”调整	O(log n)
删除最值	将末尾元素换到堆顶，然后“下沉”调整	O(log n)
核心应用	优先队列、Top K 问题、堆排序	-

总的来说，堆是一种看似简单，但功能强大且高效的数据结构，特别是在需要动态地、快速地找出集合中最值元素的场景下，它几乎是无可替代的选择。

前缀树是什么？有什么应用？

面试官您好，前缀树，也常被称为字典树或Trie树，是一种非常特殊的树形数据结构。它不是用来存储任意类型数据的通用树，而是专门为高效地存储和检索字符串集合而设计的。

1. 什么是前缀树？—— 空间换时间

它的核心思想是：利用字符串的公共前缀来节约存储空间和减少不必要的字符串比较，从而极大地提升查询效率。

您可以把它想象成一本 “按前缀组织的英文字典”：

字典的根节点是空的，代表一切的开始。
从根节点出发的每一条路径，都代表一个单词。
路径上共享的节点，就代表这些单词共享的公共前缀。

它的结构有几个鲜明特点：

根节点是空的，不代表任何字符。
从根节点到任意一个节点的路径，拼接起来就是该节点所代表的一个字符串前缀。
如果一个节点被标记为“结束节点”（通常用一个布尔标志 isEnd），那么从根到该节点的路径就构成了一个完整的单词。
一个节点的所有子节点所代表的字符都是不同的。

举个例子，我们要存储 tea, ten, inn 这三个单词：

       (root)
       /    \
      t      i
     /        \
    e          n
   / \          \
  a   n          n (isEnd=true)
 (isEnd=true) (isEnd=true)

tea 和 ten 共享了前缀 te，所以它们在前两层共享了路径 root -> t -> e。
inn 与它们没有公共前缀，所以走了另一条分支 root -> i。

2. 前缀树的核心操作

插入 (Insert)：从根节点开始，沿着字符串的字符逐层向下走。如果路径上的某个节点不存在，就创建一个。当字符串的所有字符都处理完毕后，将最后一个节点标记为“结束节点”。
查找 (Search)：和插入类似，从根节点开始沿着字符串的字符向下查找。如果中途路径断了，说明该字符串不存在。如果路径走完了，还要检查最后一个节点是否被标记为“结束节点”，才能确定它是一个完整的单词，而不仅仅是一个前缀。
前缀查询 (StartsWith)：逻辑和查找几乎一样，但只要路径能完整地走完，无论最后一个节点是否是“结束节点”，都返回 true。

3. 前缀树的优缺点

优点：
- 查询效率极高：插入和查询一个字符串的时间复杂度是 O(L)，其中 L 是字符串的长度。这个效率与字典中总共有多少个单词是无关的，这是它相比哈希表等结构在特定场景下的巨大优势。
- 天然支持前缀相关的操作：如前缀匹配、自动补全等。
缺点：
- 空间消耗大：如果字符串集合中没有很多公共前缀，或者字符集很大（比如存储中文），前缀树会消耗大量的内存，因为每个节点都需要维护一个指向所有可能子节点的指针数组（或哈希表）。

4. 前缀树的应用场景

前缀树的应用场景都和它的核心特性——“高效处理字符串前缀”——密切相关。

搜索引擎的自动补全/输入提示：
- 这是前缀树最经典、最广泛的应用。当用户在搜索框输入一个前缀（比如 “jav”）时，系统可以迅速在前缀树中定位到代表 “jav” 的那个节点，然后深度优先遍历该节点下的所有子树，就能找出所有以 “jav” 开头的搜索词（如 “java”, “javascript” 等），并推荐给用户。
IP路由表的最长前缀匹配：
- 在网络路由器中，需要根据数据包的目标IP地址，快速地在路由表中找到与之匹配的、前缀最长的路由规则。前缀树是实现这个功能非常高效的数据结构。
拼写检查与词频统计：
- 可以快速判断一个单词是否存在于词典中。
- 可以在每个“结束节点”上存储该单词的词频信息，从而高效地进行词频统计。
敏感词过滤：
- 可以将所有敏感词构建成一棵前缀树。当要检查一段文本时，可以在树上进行匹配，高效地发现其中是否包含敏感词。

总的来说，当你的问题域涉及到大量的字符串，并且需要进行频繁的、与前缀相关的查询时，前缀树就是你应该首先考虑的高效解决方案。

LRU是什么？如何实现？

面试官您好，LRU（Least Recently Used）是一种非常经典的缓存淘汰策略。它的核心思想是：当缓存空间不足时，优先淘汰掉那些最长时间没有被访问过的数据。

这个策略基于一个普遍的假设，即局部性原理：如果一个数据最近被访问了，那么它在将来也很有可能被再次访问。反之，如果一个数据已经很久没被访问了，那么它在未来被访问的概率也很低。

1. LRU缓存需要满足的核心要求

一个高效的LRU缓存实现，必须能够快速地完成以下三个操作：

查找 (Get)：能够快速地根据键（Key）查到值（Value）。
更新/插入 (Put)：当一个数据被访问（无论是命中还是新增），都能快速地将其标记为“最近使用的”。
淘汰 (Evict)：当缓存满了需要淘汰数据时，能够快速地找到并删除那个“最久未使用的”数据。

如果我们只用单一的数据结构，很难同时满足这三个要求。比如：

用哈希表：查找是 O(1)，但无法得知哪个数据最久未使用。
用链表：可以把最近使用的放头部，最久未使用的放尾部，淘汰是 O(1)，但查找是 O(n)。

因此，LRU的经典实现方案是——哈希表 + 双向链表。

2. 实现原理：哈希表 + 双向链表

这个组合非常巧妙，它们各司其职，完美地满足了LRU的所有要求：

哈希表 (HashMap)：
- 作用：负责快速查找。
- 存储内容：Key 是缓存的键，Value 则是指向双向链表中对应节点的引用（指针）。
- 效果：通过哈希表，我们可以在 O(1) 的时间复杂度内，迅速判断一个数据是否存在于缓存中，并直接定位到它在链表中的位置。
双向链表 (Doubly Linked List)：
- 作用：负责维护所有缓存数据的访问顺序。
- 存储内容：链表的每个节点中，除了存储 Key 和 Value，还必须有指向前一个节点（prev）和后一个节点（next）的指针。
- 约定：我们约定链表头部（Head）的节点是最近刚被使用的，而链表尾部（Tail）的节点则是最久没有被使用的。
- 效果：
  - 由于是双向链表，我们可以在拿到一个节点的引用后，以 O(1) 的时间复杂度将它从链表的任意位置删除。
  - 我们也可以在 O(1) 的时间复杂度内，将一个节点添加到链表的头部。

3. 操作流程

假设我们有一个固定容量为 capacity 的LRU缓存。

a. 访问数据 (Get 操作)

通过 HashMap 查找 Key。
如果 Key 不存在，返回 null。
如果 Key 存在，说明缓存命中。此时：
- 从 HashMap 中获取到该 Key 对应的链表节点。
- 将这个节点从它当前的位置移动到链表的头部（先删除，再头插）。
- 返回节点中存储的 Value。
- 这个过程保证了“被访问的数据”成为了“最近使用的”。

b. 插入/更新数据 (Put 操作)

通过 HashMap 查找 Key。
如果 Key 已存在：
- 更新该 Key 对应的 Value。
- 将该节点移动到链表的头部。
如果 Key 不存在（新增数据）：
- 检查缓存是否已满 (size == capacity)：
  - 如果已满，就需要淘汰数据：
    - 找到链表的尾部节点（它就是最久未使用的）。
    - 从 HashMap 中移除尾部节点的 Key。
    - 从链表中删除该尾部节点。
  - 如果未满，则不需要淘汰。
- 创建一个新的节点，包含新的 Key 和 Value。
- 将新节点插入到链表的头部。
- 将新的 Key 和新节点的引用存入 HashMap。

4. Java 中的现成实现

在Java中，我们不需要手动去实现这么复杂的逻辑。java.util.LinkedHashMap 这个类，通过一个构造函数，就可以非常方便地实现一个LRU缓存。

import java.util.LinkedHashMap;
import java.util.Map;

public class LRUCache<K, V> extends LinkedHashMap<K, V> {
    private final int capacity;

    // 关键构造函数：
    // initialCapacity: 初始容量
    // loadFactor: 负载因子
    // accessOrder=true: 开启访问顺序模式，这正是LRU的关键！
    public LRUCache(int capacity) {
        super(capacity, 0.75f, true);
        this.capacity = capacity;
    }

    // 重写这个方法，当put新元素导致map的size超过capacity时，
    // LinkedHashMap会自动移除最老的元素。
    @Override
    protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
        return size() > capacity;
    }
}

LinkedHashMap 内部正是通过哈希表和双向链表实现的，当 accessOrder 设置为 true 时，每次 get 或 put 操作都会将被访问的元素移动到链表的尾部（这里是尾部代表最近使用），从而实现了LRU的语义。

布隆过滤器怎么设计？时间复杂度？

面试官您好，布隆过滤器（Bloom Filter）是一种非常巧妙的、基于概率的数据结构。它的核心价值在于，能够用极小的内存空间和极高的效率来判断一个元素 “是否可能存在” 于一个巨大的集合中。

1. 为什么需要布隆过滤器？—— 解决海量数据去重问题

如IP黑名单场景，当数据集非常庞大（比如上亿条），如果使用传统的 HashSet 或 HashMap，会面临两个问题：

内存爆炸：存储1亿个IP地址，即使每个IP只占15个字节，也需要约1.5GB的内存，成本非常高。
性能瓶颈：当哈希表变得巨大时，哈希冲突会增加，性能可能会下降。

布隆过滤器就是为了解决这类问题而设计的。它不存储元素本身，只存储元素的“指纹”，从而极大地压缩了内存。

2. 布隆过滤器的设计原理

它的设计主要包含两个核心部分：

a. 一个很长的二进制位数组 (Bit Array)

这是一个非常大的、所有位都初始化为 0 的数组。比如，我们创建一个长度为 m 的位数组。

b. k 个独立的哈希函数 (Hash Functions)

这些哈希函数需要满足独立性和均匀分布的特性，即它们能将任意输入均匀地散列到 0 到 m-1 的范围内。常见的哈希函数有 MurmurHash, FNV Hash等。

3. 工作流程

i. 添加元素 (Add)

当我们要向布隆过滤器中添加一个元素时（比如一个恶意IP 1.2.3.4）：

将这个元素分别输入到 k 个不同的哈希函数中。
我们会得到 k 个不同的哈希值。
将这 k 个哈希值作为位数组的索引，把这些索引位置上的二进制位全部置为 1。
这就完成了元素的“登记”，我们只留下了它的 k 个“指纹”，而没有存储IP本身。

ii. 查询元素 (Query / Might-Contain)

当我们需要判断一个新元素（比如IP 5.6.7.8）是否存在时：

同样地，将这个新元素输入到那 k 个哈希函数中，得到 k 个哈希值（索引）。
然后，去检查位数组中这 k 个索引位置上的值。
判断逻辑：
- 如果发现这 k 个位置中，有任何一个位置的值是 0，那么我们就可以 100% 确定，这个元素绝对不存在于集合中。因为如果它存在过，这 k 个位置必然都已经被置为 1 了。
- 如果发现这 k 个位置的值全部都是 1，我们只能推断，这个元素 “可能存在”。

4. 误判率（False Positive）与它的权衡

为什么是“可能存在”？因为一个位置被置为 1，可能是由多个不同元素的哈希碰撞导致的。当我们要查询的元素的所有哈希位恰好都被其他元素“踩过”了，就会发生误判——即，元素明明不在集合里，但布隆过滤器却说它在。

这种“假阳性”是布隆过滤器唯一的缺陷，但它永远不会有“假阴性”（即，把存在的元素误判为不存在）。
误判率（fpp）是可以通过调整位数组大小 m 和 哈希函数个数 k 来控制的。在给定预期元素数量 n 和期望的误判率 fpp 后，我们可以通过公式计算出最优的 m 和 k。
- 位数组 m 越大，误判率越低。
- 哈希函数 k 的选择有一个最优值，太多或太少都会增加误判率。

5. 时间与空间复杂度

空间复杂度：非常低，由位数组大小 m 决定。与存储的元素数量 n 没有直接的线性关系，而是对数关系。这就是它节省内存的关键。
时间复杂度：极高。
- 插入操作：需要进行 k 次哈希计算和 k 次内存写操作，时间复杂度为 O(k)。
- 查询操作：需要进行 k 次哈希计算和 k 次内存读操作，时间复杂度也是 O(k)。
- 由于 k 通常是一个很小的常数（比如10-20），所以我们可以认为其时间复杂度近似为 O(1)。

6. 缺点与应用

缺点：
1. 存在误判率。
2. 无法删除元素。因为删除一个元素的哈希位，可能会影响到其他共享该位的元素。虽然有变体（如Counting Bloom Filter）支持删除，但实现更复杂，空间占用也更大。
应用场景：
- 缓存穿透的防护：在Redis等缓存系统前置一个布隆过滤器。当一个请求查询一个不存在的数据时，布隆过滤器可以直接拦截掉绝大多数这类请求，避免它们穿透到后端数据库。
- 海量数据去重：如爬虫系统对URL的去重，邮件系统的垃圾邮件地址过滤。
- 推荐系统：过滤掉那些已经给用户推荐过的物品。
- Google Chrome 用它来识别恶意网址。

总的来说，布隆过滤器是一种典型的 用“一定的误判率”换取“极高的空间和时间效率” 的数据结构，非常适合那些可以容忍少量误判，但对内存和性能要求极高的“存在性判断”场景。

参考小林 coding

你可能感兴趣的:(Java八股文,java,数据结构,八股文,面试)

移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
第二十二天（数据结构，无头节点的单项链表）肉夹馍不加青椒 c语言数据结构
线性表：一个线性表里面可以是任意的数据元素，但是同一个线性表里面数据应该是同类型的1存在一个/唯一被称为第一个节点的节点2存在一个/唯一被称为最后一个节点的节点3除了第一个以外，每一个元素都有一个前驱节点4除了最后一个，每一个元素都有一个后继节点满足以上性质，这个表就被称为线性表数组就是一个线性表想实现线性表的保存，我们需要考虑下面的事情1元素要保存2元素与元素之间的序偶关系谁是前面的谁是后面的我
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
微信公众号回调java_处理微信公众号消息回调 weixin_39607620 微信公众号回调java
1、背景在上一节中，咱们知道如何接入微信公众号，可是以后公众号会与咱们进行交互，那么微信公众号如何通知到咱们本身的服务器呢？咱们知道咱们接入的时候提供的url是GET/mp/entry，那么公众号以后产生的事件将会以POST/mp/entry发送到咱们本身的服务器上。html2、代码实现，此处仍是使用weixin-java-mp这个框架实现一、引入weixin-java-mpcom.github.
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
面试必考题：Android Binder 机制详解大模型大数据攻城狮 android binder 面试 react native kotlin dalvik retrofit
目录第一章：Binder的基本概念什么是Binder？多角度解读Binder第二章：Binder的工作机制Binder的整体流程服务注册：从零到有的第一步服务查询：找到目标的“地图”服务调用：请求与响应的旅程Binder驱动的幕后功劳为什么Binder这么快？第三章：Binder在系统架构中的角色Activity：界面背后的通信枢纽Binder的角色实例分析Service：后台任务的跨进程支柱Bi
Java8 Stream流的sorted()的排序【正序、倒序、多字段排序】 Tony666688888 java windows 开发语言
针对集合排序，java8可以用Stream流的sorted()进行排序。示例Bean以下我们会使用这个Bean来做示例。publicclassOrder{privateStringweight;privateDoubleprice;privateStringdateStr;//忽略getter、setter、构造方法、toString}字段排序首先是比较器Comparator，形式如下：Compa
用代码生成艺术字：设计个性化海报的秘密
本文围绕“用代码生成艺术字：设计个性化海报的秘密”展开，先概述代码生成艺术字在海报设计中的独特价值，接着介绍常用的代码工具（如HTML、CSS、JavaScript等），详细阐述从构思到实现的完整流程，包括字体样式设计、动态效果添加等，还分享了提升艺术字质感的技巧及实际案例。最后总结代码生成艺术字的优势，为设计师提供打造个性化海报的实用指南，助力提升海报设计的独特性与吸引力，符合搜索引擎SEO标准
java实习生40多天有感别拿爱情当饭吃
从5月15日开始，我开始第一步步入社会，我今年大三，在一家上市互联网公司做一名实习生，主要做java后端开发。开始的时候，觉得公司的环境挺不错的，不过因为公司在CBD，所以隔壁的午饭和晚饭都要20+RMB，而且还吃不饱，这让我感觉挺郁闷的。一到下午，我就会犯困（因为饿）。因此，我又不得不买一些干粮在公司屯着。关于技术，有一个比较大的项目在需求调研当中，我们做实习生，就是辅助项目经理，测试功能，并且
前端面试每日 3+1 —— 第39天浪子神剑
今天的面试题(2019.05.25)——第39天[html]title与h1、b与strong、i与em的区别分别是什么？[css]写出你知道的CSS水平和垂直居中的方法[js]说说你对模块化的理解[软技能]公钥加密和私钥加密是什么？《论语》，曾子曰：“吾日三省吾身”（我每天多次反省自己）。前端面试每日3+1题，以面试题来驱动学习，每天进步一点！让努力成为一种习惯，让奋斗成为一种享受！欢迎在Iss
大学生入门：初识方法及其易踩坑的点
在java学习过程中，我们不难发现有很多重复使用的功能代码块，每次使用如果都要重新写一遍，岂不是很麻烦，就算是“cv”大法，感觉也不是很方便，那么，有什么办法可以解决这个问题呢？方法！java中，一段可重用的，用于执行特定功能的代码块叫做方法，它可以接收参数、返回结果，并且可以被多次使用。一、方法的基本结构[修饰符]返回值类型方法名([参数列表])[throws异常类型]{//方法体}[throw
[Ljava.lang.Object; cannot be cast to [Ljava.lang.String; 这些不会的
解释：这个错误是很常见的错误，错误的提示已经很清楚了就是java的Object数组不能转换成为String[]数组，这就说明你要转换的数组它本身是Object类型的数组，但是你却非要把它转换为String类的数组，这当然是错误的。示例：[java]viewplaincopypackagecom.dada;importjava.util.ArrayList;importjava.util.List;
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
【免费下载】 Aspose for Java：解锁无水印、无限制的文档处理能力房征劲Kendall
AsposeforJava：解锁无水印、无限制的文档处理能力【下载地址】AsposeforJava-去除水印和数量限制AsposeforJava-去除水印和数量限制Aspose是一个著名的文档处理库，专为Java应用程序设计，支持多种文档格式的操作，如Word、Excel、PDF等项目地址:https://gitcode.com/open-source-toolkit/56c82项目介绍在现代企业
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

Java八股文——数据结构「数据结构篇」

了解哪些数据结构？

1. 线性结构 (Linear Structures)

2. 哈希结构 (Hash-based Structures)

3. 树形结构 (Tree Structures)

4. 图结构 (Graph Structures)

总结对比

数组和链表区别是什么？

总结对比表

说一下队列和栈的区别

总结对比表

介绍一下数据结构中的栈？怎么用Java实现？

1. 什么是栈？

2. 栈的应用场景

3. 如何用 Java 实现栈？

方式一：官方推荐方式 — 使用 Deque 接口

方式二：手动实现 — 基于数组

方式三：手动实现 — 基于链表

如何使用两个栈实现队列？

实现思路

Java 代码实现

复杂度分析

常见的队列有哪些及应用场景？

一、 单体应用内队列 (In-Process Queues)

1. 普通队列 (FIFO Queues)

2. 阻塞队列 (Blocking Queues)

3. 优先队列 (Priority Queues)

4. 双端队列 (Deques)

二、 分布式系统队列 (Distributed Queues)

总结对比

平衡二叉树结构是怎么样的？

1. 为什么需要平衡二叉树？—— 普通二叉搜索树的缺陷

2. 什么是平衡二叉树 (Balanced Binary Tree)？

3. 如何维持平衡？—— 自平衡操作

4. 常见的平衡二叉树实现

红黑树是什么，跳表是什么？

红黑树 (Red-Black Tree)

跳表 (Skip List)

总结对比

红黑树和AVL树相比查询性能好还是插入性能好一些？

1. 查询性能对比：AVL树胜在“极致平衡”

2. 插入/删除性能对比：红黑树胜在“调整成本低”

总结与应用场景

B+树的特点是什么？

1. 结构设计上的三大特点

2. 操作上的优势

红黑树、B树和B+树发区别

1. 应用场景与设计目标 (最根本的区别)

2. 结构类型与高度 (叉数)

3. 数据存放位置

4. 查询性能 (单点查询 vs. 范围查询)

总结对比表

堆是什么？

1. 堆的两大核心属性

2. 底层实现：数组

3. 核心操作与时间复杂度

4. 典型应用场景

总结

前缀树是什么？有什么应用？

1. 什么是前缀树？—— 空间换时间

2. 前缀树的核心操作

3. 前缀树的优缺点

4. 前缀树的应用场景

LRU是什么？如何实现？

1. LRU缓存需要满足的核心要求

2. 实现原理：哈希表 + 双向链表

3. 操作流程

4. Java 中的现成实现

布隆过滤器怎么设计？时间复杂度？

1. 为什么需要布隆过滤器？—— 解决海量数据去重问题

2. 布隆过滤器的设计原理

3. 工作流程

4. 误判率（False Positive）与它的权衡

5. 时间与空间复杂度

6. 缺点与应用

你可能感兴趣的:(Java八股文,java,数据结构,八股文,面试)

方式一：官方推荐方式 — 使用 `Deque` 接口

一、单体应用内队列 (In-Process Queues)

二、分布式系统队列 (Distributed Queues)