虾球xz

CppCon 2018 学习:Mini Dumps Efficient core dumps for FlashBlade

“Mini Dumps” 指的是一种精简的 core dump（核心转储）机制，目的是在 高性能系统（如 Pure Storage FlashBlade）中，在出错时收集足够的调试信息，同时避免完整 core dump 带来的性能开销或空间浪费。

什么是 Core Dump？

Core dump 是操作系统在程序崩溃时写出的一份进程内存快照，供开发者排查问题。但：

完整 core dump 文件可能数百 MB 到数 GB
写出耗时长，在高性能存储系统中容易影响正常运行
包含很多没用的数据（如空闲堆栈、未使用堆内存等）

Mini Dump 的目的

Mini dump ≈ core dump 的“精简版”

特性	描述
智能筛选	只保留调试必要的数据（如崩溃线程的栈帧、寄存器、特定对象）
体积小	几 MB 到几十 MB
快速写出	快速转储，最小影响运行时
足够排查	能满足多数故障诊断场景
安全合规	减少用户数据泄露风险

FlashBlade 场景中应用 Mini Dump 的原因

FlashBlade 是一个分布式、并发性极高的系统，特点：

I/O 密集，核心 dump 会拖慢服务
数百个并发线程/组件，不需要整个内存内容，只需崩溃上下文
保持运行可用性更重要 → 不希望因一个 core dump 影响系统可用性
因此：

FlashBlade 更倾向于使用 “Mini Dump” 方案，快速记录关键状态，并自动上报分析，而非阻塞性地写出完整 core 文件。

Mini Dump 的内容通常包括：

崩溃线程的寄存器状态
调用栈（stack trace）
局部变量、函数参数快照
关键静态全局变量
特定 allocator 状态（内存分配堆状态）
系统版本、构建号、时间戳等元数据

Mini Dump 的技术实现方式（一般思路）：

信号捕获（如 SIGSEGV、SIGABRT）
使用 lightweight dumper 工具
- 比如 Google 的 minidump 或 LLVM 的 llvm-symbolizer
只转储特定线程和内存区域
- 通过 /proc/self/maps 只采集 .text, .data, .stack
压缩、上传或保存本地小文件

开发者如何利用 Mini Dump？

本地使用 gdb 或 lldb + 符号文件调试：
```
gdb -c mini.dmp my_binary
```
也可借助 crash dump 分析框架（如 Breakpad、ABRT、Microsoft WinDbg mini dump loader）

总结一句话：

Mini Dump 是为大规模系统稳定运行设计的一种“轻量级核心转储”，能快速捕获崩溃关键信息，而不会拖垮系统性能或存储资源。

这段内容讲的是为什么需要 Mini Dumps（精简 core dump） ——它是从工程实用角度出发，为了改善传统 Linux core dump 的问题。

动机（Motivation）解析：

1. Core dumps 非常有用

当程序崩溃（如 segmentation fault），core dump 是排查根因最直接的手段。
gdb 可以用 core dump 查看崩溃现场（变量、堆栈、指令地址等）。

2. 传统 core dump 的问题

问题	描述
隐私泄露	dump 会包含整个内存，可能有客户数据、密码、私钥等敏感信息
非常慢	写出所有内容通常需要 30 秒或更久，影响正常服务
非常大	一个系统的 dump 可高达 50GB+，严重消耗磁盘空间或网络传输时间
无法控制内容	kernel 自动转储，无法选择性排除某些数据区域

3. 我们真正想要的东西：

目标	解释
更快的 dump	几秒内生成
更小的文件	只包含调试必要信息，几 MB 到几十 MB
有选择性地排除区域	比如跳过客户数据/缓存等无关区域
仍能用 gdb 分析	mini dump 不能是自定义格式，还得兼容 GDB 分析器

关键要点总结：

传统 core dump 优点	缺点
可用 gdb 调试	太大、太慢、太危险（含敏感数据）
完整崩溃现场信息	无法控制 dump 内容

因此，我们希望能生成一个“可被 GDB 分析的、但更小、更安全、更快的 dump”——这就是 Mini Dump。

Mini Dump 的设计目标

避免用户数据被泄露
快速生成，不阻塞服务运行
仅保留崩溃线程和关键全局对象
能用 GDB 排查问题

为什么不用 `MADV_DONTDUMP` 来排除内存区域？

什么是 `MADV_DONTDUMP`？

madvise(addr, length, MADV_DONTDUMP) 是一个 Linux 系统调用，用于标记指定的内存区域在程序崩溃时 不要写入 core dump。
听起来似乎正好符合“减少 dump 大小”的需求，但这段说明了 为什么它不适合用在实际大型系统中，尤其是 FlashBlade 这类性能敏感的环境中。

为什么不能仅靠 MADV_DONTDUMP？

原因	解释
调用开销大	这个系统调用在 dump 时是不安全的（不能临时调用），所以必须在程序运行期间反复调用它来设置区域 → 增加运行时负担。
需要加锁	内核在处理 `MADV_DONTDUMP` 时必须获取锁来保护数据结构（可能影响性能）。
和内存分配器有冲突	应用使用大页（2MB）批量分配 64MB 块，这些块会被频繁复用，所以哪些区域该 dump 是动态变化的，用 `MADV_DONTDUMP` 很难精确控制。
粒度太粗	`MADV_DONTDUMP` 是按页（≥4KB）生效，但有时候你一个页面里既有重要系统状态，也有客户数据 → 你不能全扔也不能全保。
最终仍然太大	即使用了 `MADV_DONTDUMP`，也可能还会有几 GB 的数据被 dump，而你可能只关心其中很少部分。

总结：

虽然 MADV_DONTDUMP 是内核提供的排除机制，但它：

对运行时性能有影响
控制太粗，粒度不够细
不适合频繁变动的内存结构
最终结果还是太大
因此，为了更高效、细粒度、应用感知的控制，团队更倾向于自己实现一套 精细选择区域的 mini dump 机制，而不是依赖 MADV_DONTDUMP。

core dump 文件（通常是 `core`）内部到底包含了什么？

什么是 Core Dump？

当程序崩溃时，系统可以将其内存状态、寄存器状态等保存到一个文件中，叫做 core file（core dump）。
这个文件可以被 gdb 等工具读取和分析，帮助你 重现崩溃时的上下文状态。

如何查看 core 文件内容？

你可以用这个命令查看 core 文件结构：

readelf -a core

Core 文件结构解析：

区域	内容
ELF header	Core 文件是 ELF 格式： `e_type = ET_CORE` 表示这是一个 core 文件 `e_machine = x86_64` 表示适用于哪种架构
Program headers (PHDRs)	描述内存映射等内容，每个 header 可能是： - `PT_NOTE`: 包含元信息（进程、线程、信号） - `PT_LOAD`: 真实内存数据段
Section headers	Core dump 通常没有 section headers（section hdr cnt = 0）因为这些对调试不是必须的
Notes 区域 (PT_NOTE)	这是最重要的元信息区域，类型为 `NT_*` 开头的结构：

Notes 区域内容详解

Note 类型	含义
`NT_PRPSINFO`	进程信息：uid, gid, pid 等
`NT_SIGINFO`	崩溃的信号信息：`signo`, `errno` 等（例如 SIGSEGV）
`NT_AUXV`	辅助向量（auxv_t），来自内核的启动参数
`NT_FILE`	映射的文件区域列表（类似 `/proc/self/maps`）包含：`start/end address`, `file offset`, 路径等
`NT_PRSTATUS`	每个线程的状态（`tid`, 当前寄存器值等）
`NT_FPREGSET`	浮点寄存器状态（x87）
`NT_X86_XSTATE`	扩展寄存器（例如 AVX、SSE、XSAVE）

PT_LOAD 段

每个 PT_LOAD 表示一段真实的内存映射区域
- 包括：
  - 权限（读写执行）
  - 虚拟地址（vaddr）
  - 实际大小（p_memsz）
  - 文件中大小（p_filesz）
  - 在 core 文件中的偏移量（p_offset）
    有些段的 p_filesz = 0 表示该内存段被“标记”了，但并没有保存具体内容（例如被裁剪了）。

总结图示：

Core File (ELF)
├── ELF Header
├── Program Headers
│   ├── PT_NOTE (metadata)
│   │   ├── NT_PRPSINFO
│   │   ├── NT_SIGINFO
│   │   ├── NT_AUXV
│   │   ├── NT_FILE
│   │   ├── NT_PRSTATUS (per thread)
│   │   └── ...
│   └── PT_LOAD (memory segment)
│       └── contains actual memory content (heap, stack, etc)
└── No section headers

你可以实际尝试：

ulimit -c unlimited
./your_app_crashing
readelf -a core

或者用 GDB 分析：

gdb your_app core

在信号处理函数（signal handler）里做什么 —— “轻量 mini core dump” 的关键技术点之一

信号处理函数是什么？

当程序出现严重错误时，操作系统会发送一个信号，比如：

信号	意义
`SIGSEGV`	段错误（非法内存访问）
`SIGABRT`	调用了 `abort()`
`SIGINT`	中断（比如 Ctrl+C）
`SIGILL`	非法指令执行
你可以注册一个信号处理器（handler）来在程序崩溃前做点事情，比如打印日志、生成 mini core dump 等。

在 signal handler 中能干什么？

参考：man 7 signal 文档，有一个非常重要的限制：

“Signal-safe functions”（异步信号安全函数）

这些函数是明确可以在信号处理器中调用的，包括：

类别	可用函数
文件操作	`open()`, `read()`, `write()`, `close()`, `fsync()`
进程信息	`getpid()`, `kill()`, `signal()`
字符串	`strlen()`, `strerror_r()`
内存	不能调用 `malloc()` 或 `new`，也不能使用 STL 容器
输出	可以 `write(2, ...)` 输出错误信息到 stderr
时间	`time()`、`gettimeofday()` 是安全的

不能做的事（常见坑）

禁止事项	原因
`malloc()` / `free()`	不是异步安全的，可能内部持有锁，会死锁
C++ 异常抛出	不合法，在 handler 里抛异常会直接终止
STL 容器使用	所有 `std::vector` / `std::string` 都依赖动态分配
`printf()` / `std::cout`	会触发缓冲区刷新和 `malloc`，不安全

这意味着什么？

在 signal handler 中你不能做复杂逻辑，但是：

你可以写出简化版 core 文件：

你知道 core dump 是 ELF 格式，文件结构是固定的（如前面分析）
你可以直接 open() 创建一个文件
然后用 write() 写入一些你需要的信息：
- 当前寄存器快照
- 部分用户态内存（stack / heap）
- 映射文件信息（用 /proc/self/maps 获取）
- 崩溃信号类型
最后 close() 退出即可

示例：注册一个最小 signal handler

#include 
#include 
#include 
#include 
void handler(int sig) {
    const char msg[] = "Fatal signal received, dumping...\n";
    write(STDERR_FILENO, msg, sizeof(msg) - 1);
    // 假设打开文件并写入关键内存块等
    int fd = open("/tmp/mini_dump.raw", O_CREAT | O_WRONLY, 0644);
    if (fd >= 0) {
        write(fd, "DUMP", 4);  // 模拟
        close(fd);
    }
    _exit(1);  // 直接退出，避免进入未知状态
}
int main() {
    signal(SIGSEGV, handler);
    signal(SIGABRT, handler);
    // 故意制造崩溃
    *(int*)0 = 42;
    return 0;
}

总结：信号处理器中能做的事情

可做	不可做
写文件（write、open）	malloc / new
输出错误信息	std::string、std::vector
保存寄存器快照	抛异常
写 mini core dump	std::cout / printf

改进这个 dump 文件内容，让它更像一个实用的 mini core dump，可参考以下几个扩展方向：

目标：写一个更实用的 mini dump 文件

下面是改进目标：

记录触发信号类型
记录当前进程 ID
记录栈顶地址和栈内部分数据（近似 backtrace）
写入 /proc/self/maps 映射信息（可用 gdb 分析）

改进后的 `handler` 示例代码

#include 
#include 
#include 
#include 
#include 
#include 
#include 
void handler(int sig) {
    const char msg[] = "Fatal signal received, dumping...\n";
    write(STDERR_FILENO, msg, sizeof(msg) - 1);
    int fd = open("/tmp/mini_dump.raw", O_CREAT | O_WRONLY | O_TRUNC, 0644);
    if (fd < 0) {
        _exit(1);
    }
    // 1. 写信号类型
    write(fd, "SIGNAL:\n", 8);
    dprintf(fd, "%d\n", sig);
    // 2. 写进程 ID
    write(fd, "PID:\n", 5);
    dprintf(fd, "%d\n", getpid());
    // 3. 写当前栈顶地址及内容（栈的“快照”）
    write(fd, "STACK (partial):\n", 18);
    void* sp = __builtin_frame_address(0);  // 栈帧指针
    write(fd, &sp, sizeof(sp));
    write(fd, "STACK DATA:\n", 12);
    write(fd, sp, 128);  // 写入栈顶附近128字节（注意可能非法）
    // 4. 写当前映射文件内容：/proc/self/maps
    write(fd, "\nMEMORY MAP:\n", 13);
    int maps_fd = open("/proc/self/maps", O_RDONLY);
    if (maps_fd >= 0) {
        char buf[256];
        ssize_t r;
        while ((r = read(maps_fd, buf, sizeof(buf))) > 0) {
            write(fd, buf, r);
        }
        close(maps_fd);
    }
    close(fd);
    _exit(1);
}

`main()` 保持不变：

int main() {
    signal(SIGSEGV, handler);
    signal(SIGABRT, handler);
    *(int*)0 = 42;  // 故意崩溃
    return 0;
}

编译和运行

g++ -g -o mini_dump mini_dump.cpp
./mini_dump

输出：

Fatal signal received, dumping...
Segmentation fault (core dumped)

你会看到文件 /tmp/mini_dump.raw 包含如下内容：

SIGNAL:
11
PID:
12345
STACK (partial):
[二进制数据]
MEMORY MAP:
00400000-00401000 r-xp ... main
...

每个线程的状态
- 崩溃时的寄存器状态（比如指令指针、栈指针等）
- 崩溃信号的信息（比如SIGSEGV相关信息）
“有趣”的内存内容
- 栈内容（要往回保存多少栈帧数据）
- 寄存器里看起来像指针的值附近的内存
- 栈里看起来像指针的值附近的内存
- 递归地追踪这些内存块中可能存在的指针，继续保存对应内存
- 每个“锚点”地址（anchor address）前后保存多少内存数据
流程大致是
- 由崩溃线程的信号处理器开始获取主线程信息
- 发送信号（如SIGUSR1）给其他线程，让它们收集自己的寄存器和栈信息
- 其中一个线程负责收集内存映射（/proc/self/maps）和实际内存数据，写入 dump 文件
  总结来说，就是通过信号处理和多线程协作，精确采集程序崩溃时必要且“有价值”的内存和寄存器状态，做一个更精简、高效的核心转储（mini dump）。

代码已经实现了基础的信号捕获与部分信息写入：

1. 写寄存器状态（而非只写栈帧指针）

当前只用 __builtin_frame_address(0) 得到栈帧指针，没抓寄存器。信号处理函数能拿到 ucontext_t，里面含寄存器完整信息。

void handler(int sig, siginfo_t *info, void *ucontext) {
    ucontext_t *uc = (ucontext_t *)ucontext;
    // 以 x86_64 为例，打印 RIP, RSP, RBP 寄存器
    uintptr_t rip = uc->uc_mcontext.gregs[REG_RIP];
    uintptr_t rsp = uc->uc_mcontext.gregs[REG_RSP];
    uintptr_t rbp = uc->uc_mcontext.gregs[REG_RBP];
    dprintf(fd, "RIP: %p\nRSP: %p\nRBP: %p\n", (void*)rip, (void*)rsp, (void*)rbp);
}

2. 信号处理函数注册用 `sigaction` 并使用 `SA_SIGINFO`

能拿到更多信息（如 siginfo_t 和 ucontext_t）：

struct sigaction sa;
sa.sa_sigaction = handler;
sigemptyset(&sa.sa_mask);
sa.sa_flags = SA_SIGINFO | SA_RESTART;
sigaction(SIGSEGV, &sa, NULL);
sigaction(SIGABRT, &sa, NULL);

3. 对栈内容和指针进行更安全的访问

你直接读栈指针附近的128字节，有非法地址风险会导致二次崩溃。改为：

用 /proc/self/maps 判断栈地址范围
或用 mincore()、mprotect()探测可读区域
只dump安全可读内存

4. 多线程处理

主线程信号处理器通过发送 SIGUSR1 给所有其他线程，让它们写寄存器和栈信息（可先写日志或预留共享内存区）
用 pthread_kill() 发送信号，避免崩溃时死锁
由一个线程负责写 /proc/self/maps 和内存内容到dump文件

5. 设计“锚点”机制

通过寄存器和栈里识别“可能是指针”的值，保存其附近内存（如寄存器指针附近1KB，栈指针附近128B等）
递归跟踪指针，扩大dump覆盖
这样能精准捕获对调试有用的内存片段，极大减少dump体积

6. 避免非信号安全函数

malloc、printf等不可在信号处理器调用，dprintf和write相对安全
可以在信号处理器写简单信息，更多复杂处理放到崩溃后重启时再做

7. 例子：改进后的注册与信号处理器

#include 
#include 
#include 
#include 
#include 
#include 
#include 
void handler(int sig, siginfo_t *info, void *ucontext) {
    int fd = open("/tmp/mini_dump.raw", O_CREAT | O_WRONLY | O_TRUNC, 0644);
    if (fd < 0) _exit(1);
    dprintf(fd, "SIGNAL:\n%d\n", sig);
    dprintf(fd, "PID:\n%d\n", getpid());
    ucontext_t *uc = (ucontext_t *)ucontext;
    dprintf(fd, "REGISTERS:\n");
    dprintf(fd, "RIP: %p\n", (void*)uc->uc_mcontext.gregs[REG_RIP]);
    dprintf(fd, "RSP: %p\n", (void*)uc->uc_mcontext.gregs[REG_RSP]);
    dprintf(fd, "RBP: %p\n", (void*)uc->uc_mcontext.gregs[REG_RBP]);
    // 其他寄存器...
    // 尝试写栈内容（假设128字节安全）
    void *rsp = (void*)uc->uc_mcontext.gregs[REG_RSP];
    dprintf(fd, "STACK DATA:\n");
    if (rsp != NULL) {
        // 小心访问，真实项目中需要判断可读范围
        write(fd, rsp, 128);
    }
    // 写内存映射
    dprintf(fd, "\nMEMORY MAP:\n");
    int maps_fd = open("/proc/self/maps", O_RDONLY);
    if (maps_fd >= 0) {
        char buf[256];
        ssize_t r;
        while ((r = read(maps_fd, buf, sizeof(buf))) > 0) {
            write(fd, buf, r);
        }
        close(maps_fd);
    }
    close(fd);
    _exit(1);
}
int main() {
    struct sigaction sa;
    sa.sa_sigaction = handler;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = SA_SIGINFO;
    sigaction(SIGSEGV, &sa, NULL);
    sigaction(SIGABRT, &sa, NULL);
    *(int*)0 = 42;  // 故意崩溃
    return 0;
}

总结

用 sigaction + SA_SIGINFO 获取完整寄存器和信号信息
多线程时，信号处理器通知其他线程收集寄存器栈信息
对栈和指针附近内存采用“锚点”追踪，精准采集调试必要内容
避免非信号安全操作，尽量写简单日志
读取 /proc/self/maps 记录进程内存映射，方便调试

想做一个非常完善的多线程mini dump工具，包含：

更完整的寄存器和栈遍历
锚点地址内存块递归追踪
多线程信号同步（无锁或条件变量）
线程启动时自动登记tid
清晰的dump文件格式（ELF core或自定义格式）
这个项目相当庞大，通常一个成熟的mini dump库几千行代码，甚至更多。这里我帮你设计一个分步骤分模块的实现方案，并提供部分示范代码片段，方便你分阶段完成，也方便集成或替换：

1. 线程启动自动登记tid

用线程局部存储(TLS)自动登记tid，且在pthread_create时hook登记。

#include 
#include 
#include 
#include 
static std::atomic<int> g_thread_count{0};
static pthread_t g_threads[MAX_THREADS];
static pid_t g_tids[MAX_THREADS];
// 线程局部存储变量
static __thread int g_my_index = -1;
void register_current_thread() {
    int idx = g_thread_count.fetch_add(1);
    if (idx < MAX_THREADS) {
        g_threads[idx] = pthread_self();
        g_tids[idx] = syscall(SYS_gettid);
        g_my_index = idx;
    }
}
void* thread_start_wrapper(void* (*start_routine)(void*), void* arg) {
    register_current_thread();
    return start_routine(arg);
}
int pthread_create_wrapped(pthread_t* thread, const pthread_attr_t* attr,
                           void* (*start_routine)(void*), void* arg) {
    // 包装线程入口函数，使其先登记线程信息
    struct WrapperArg {
        void* (*start_routine)(void*);
        void* arg;
    };
    WrapperArg* warg = new WrapperArg{start_routine, arg};
    auto wrapper = [](void* warg_void) -> void* {
        WrapperArg* w = (WrapperArg*)warg_void;
        register_current_thread();
        void* ret = w->start_routine(w->arg);
        delete w;
        return ret;
    };
    return pthread_create(thread, attr, wrapper, warg);
}

2. 更完整寄存器和栈遍历

不同架构寄存器数量不同，比如 x86_64 寄存器集：

RIP, RSP, RBP, RAX, RBX, RCX, RDX, RSI, RDI, R8-R15 等。
遍历栈：
通过栈指针(RSP)和栈底地址确定栈范围（比如取8KB）
逐字（8字节）扫描栈内容
检查栈内容是否可能是有效指针（位于已映射内存区域）
将这些指针加入锚点队列，递归追踪
示范遍历栈代码片段（x86_64）：

#include 
bool is_address_mapped(void* addr) {
    // 简单方法：用mincore探测页是否在内存中
    unsigned char vec;
    void* page = (void*)((uintptr_t)addr & ~(4095));
    if (mincore(page, 4096, &vec) == 0)
        return true;
    return false;
}
void scan_stack_for_pointers(void* stack_start, size_t stack_size,
                             std::vector<void*>& anchor_addrs) {
    uintptr_t* ptr = (uintptr_t*)stack_start;
    uintptr_t* end = (uintptr_t*)((uintptr_t)stack_start + stack_size);
    for (; ptr < end; ++ptr) {
        uintptr_t val = *ptr;
        if (val > 0x10000 && is_address_mapped((void*)val)) {
            anchor_addrs.push_back((void*)val);
        }
    }
}

3. 锚点内存块管理与递归追踪

使用一个无重复的std::set来存储所有锚点基地址
每发现一个新指针锚点，判断是否已存在，没存在则加入队列递归读内存
每次读的内存范围例如：锚点地址向前1KB，向后8KB
递归深度限制防止无限循环
示例：

#include 
#include 
std::set<uintptr_t> visited_anchors;
std::queue<uintptr_t> anchor_queue;
void add_anchor(uintptr_t addr) {
    // 对齐4K页
    addr &= ~(4095);
    if (visited_anchors.insert(addr).second) {
        anchor_queue.push(addr);
    }
}
void recursive_anchor_dump(int fd) {
    while (!anchor_queue.empty()) {
        uintptr_t base = anchor_queue.front();
        anchor_queue.pop();
        // Dump内存[base - 1k, base + 8k]
        uintptr_t dump_start = base > 1024 ? base - 1024 : base;
        size_t dump_size = 1024 + 8192;
        // 读取内存
        char buf[dump_size];
        memcpy(buf, (void*)dump_start, dump_size);
        // 写入dump文件（简略）
        write(fd, &dump_start, sizeof(dump_start));
        write(fd, buf, dump_size);
        // 递归扫描这段内存，找新指针加入anchor_queue
        uintptr_t* ptr = (uintptr_t*)buf;
        uintptr_t* end = (uintptr_t*)(buf + dump_size);
        for (; ptr < end; ++ptr) {
            uintptr_t val = *ptr;
            if (val > 0x10000 && is_address_mapped((void*)val)) {
                add_anchor(val);
            }
        }
    }
}

4. 多线程信号同步（无锁或条件变量）

信号处理函数里不能使用普通锁，常见做法：

主线程触发信号，其他线程在信号处理器中设置原子标志
主线程轮询等待所有线程确认完成
可以用std::atomic变量或信号量实现
示范同步变量：

std::atomic<int> threads_done_count{0};
void other_thread_handler(int sig, siginfo_t*, void* uc_void) {
    // 保存寄存器等
    // ...
    threads_done_count.fetch_add(1);
    // 等待主线程通知退出信号处理
    while (!g_crash_handling_done) {
        usleep(100000);
    }
    _exit(0);
}
void crash_handler(...) {
    threads_done_count = 0;
    signal_other_threads();
    // 等待其他线程完成
    while (threads_done_count.load() < g_thread_count.load() - 1) {
        usleep(100000);
    }
    // 继续写dump
    // ...
    g_crash_handling_done = true;
}

5. dump文件结构（建议）

自定义简单格式（JSON + 二进制块）
优点：灵活易读，集成容易
缺点：不够标准，工具支持差
ELF core dump格式
优点：系统工具（gdb）支持，格式标准
缺点：复杂度高，需完整ELF结构知识和代码实现
Google Breakpad mini dump格式
Google开源项目，可以参考或直接使用Breakpad库

简单示例：自定义格式写法（伪代码）

FILE HEADER
THREAD INFO BLOCK (tid, registers, stack range, stack data)
ANCHOR MEMORY BLOCKS (address, size, raw data)
PROCESS MAPS BLOCK (parsed /proc/self/maps)

你写入每个block前加长度和标识符，方便后续解析。

总结

这已经是非常大的系统工程，建议你：

分模块实现，先做线程登记和信号同步
实现寄存器和栈扫描
实现锚点追踪和内存保存
做简单文件格式
再逐步完善

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
// 最大线程数
#define MAX_THREADS 32
// 全局线程信息结构
struct ThreadDumpInfo {
    pid_t tid;
    pthread_t ptid;
    volatile sig_atomic_t signaled = 0;
    ucontext_t context;
    volatile sig_atomic_t done = 0;
};
static ThreadDumpInfo g_thread_infos[MAX_THREADS];
static std::atomic<int> g_thread_count{0};
static volatile sig_atomic_t g_handling_crash = 0;
static volatile sig_atomic_t g_crash_done = 0;
// 简单信号安全打印
static void sig_safe_print(const char* msg) { write(STDERR_FILENO, msg, strlen(msg)); }
// 注册当前线程
void register_thread() {
    pid_t tid = syscall(SYS_gettid);
    pthread_t ptid = pthread_self();
    int idx = g_thread_count.fetch_add(1);
    if (idx < MAX_THREADS) {
        g_thread_infos[idx].tid = tid;
        g_thread_infos[idx].ptid = ptid;
    }
}
// 发送SIGUSR1给其他线程
void signal_other_threads() {
    pid_t self_tid = syscall(SYS_gettid);
    for (int i = 0; i < g_thread_count; ++i) {
        if (g_thread_infos[i].tid != self_tid) {
            pthread_kill(g_thread_infos[i].ptid, SIGUSR1);
        }
    }
}
// 其他线程信号处理器，收到SIGUSR1后保存寄存器状态
void other_thread_handler(int sig, siginfo_t*, void* uc_void) {
    pid_t tid = syscall(SYS_gettid);
    ucontext_t* uc = (ucontext_t*)uc_void;
    for (int i = 0; i < g_thread_count; ++i) {
        if (g_thread_infos[i].tid == tid) {
            g_thread_infos[i].signaled = sig;
            memcpy(&g_thread_infos[i].context, uc, sizeof(ucontext_t));
            g_thread_infos[i].done = 1;
            break;
        }
    }
    // 等待主线程写完dump文件后退出
    while (!g_crash_done) {
        usleep(100000);
    }
    _exit(0);
}
// 写寄存器到fd，简化只写RIP寄存器（x86_64）
void dump_registers(int fd, ucontext_t* uc) {
#if defined(__x86_64__)
    char buf[128];
    int len = snprintf(buf, sizeof(buf), "RIP=0x%llx\n",
                       (unsigned long long)uc->uc_mcontext.gregs[REG_RIP]);
    write(fd, buf, len);
#endif
}
// 写简单栈快照128字节（栈指针附近）
void dump_stack(int fd, ucontext_t* uc) {
#if defined(__x86_64__)
    void* sp = (void*)uc->uc_mcontext.gregs[REG_RSP];
    write(fd, "STACK_DATA:\n", 11);
    ssize_t wr = write(fd, sp, 128);
    (void)wr;  // 可能失败，简单忽略
#endif
}
// 崩溃信号处理器
void crash_handler(int sig, siginfo_t* si, void* uc_void) {
    if (__sync_lock_test_and_set(&g_handling_crash, 1)) {
        _exit(1);  // 防止重入
    }
    sig_safe_print("Fatal signal received. Writing mini dump...\n");
    int fd = open("/tmp/minidump.raw", O_CREAT | O_WRONLY | O_TRUNC, 0644);
    if (fd < 0) {
        _exit(1);
    }
    // 写信号和进程信息
    dprintf(fd, "SIGNAL: %d\n", sig);
    dprintf(fd, "PID: %d\n", getpid());
    dprintf(fd, "CRASH_THREAD_TID: %d\n", syscall(SYS_gettid));
    // 写崩溃线程寄存器和栈
    ucontext_t* uc = (ucontext_t*)uc_void;
    dump_registers(fd, uc);
    dump_stack(fd, uc);
    // 通知其他线程写寄存器栈
    signal_other_threads();
    // 等待其他线程完成
    for (int i = 0; i < 50; ++i) {
        bool all_done = true;
        for (int j = 0; j < g_thread_count; ++j) {
            if (g_thread_infos[j].tid != syscall(SYS_gettid) && g_thread_infos[j].done == 0) {
                all_done = false;
                break;
            }
        }
        if (all_done) break;
        usleep(100000);
    }
    // 写其他线程寄存器简略信息
    write(fd, "\nOTHER_THREADS:\n", 15);
    for (int i = 0; i < g_thread_count; ++i) {
        if (g_thread_infos[i].tid != syscall(SYS_gettid) && g_thread_infos[i].done) {
            dprintf(fd, "Thread TID: %d\n", g_thread_infos[i].tid);
            dump_registers(fd, &g_thread_infos[i].context);
            // 栈数据写略
        }
    }
    // 读取 /proc/self/maps 写入
    write(fd, "\nPROC_SELF_MAPS:\n", 16);
    int maps_fd = open("/proc/self/maps", O_RDONLY);
    if (maps_fd >= 0) {
        char buf[256];
        ssize_t r;
        while ((r = read(maps_fd, buf, sizeof(buf))) > 0) {
            write(fd, buf, r);
        }
        close(maps_fd);
    }
    close(fd);
    g_crash_done = 1;
    _exit(1);
}
// 安装信号处理器
void setup_signal_handlers() {
    struct sigaction sa = {};
    sa.sa_sigaction = crash_handler;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = SA_SIGINFO | SA_RESTART;
    sigaction(SIGSEGV, &sa, NULL);
    sigaction(SIGABRT, &sa, NULL);
    struct sigaction sa_usr1 = {};
    sa_usr1.sa_sigaction = other_thread_handler;
    sigemptyset(&sa_usr1.sa_mask);
    sa_usr1.sa_flags = SA_SIGINFO | SA_RESTART;
    sigaction(SIGUSR1, &sa_usr1, NULL);
}
// 工作线程示范
void* worker_thread(void*) {
    register_thread();
    while (1) {
        unsigned int ret = sleep(1);
        if (ret == 0) break;  // 正常睡眠完毕
        // 否则被信号中断，继续睡剩余时间
    }
    return NULL;
}
int main() {
    register_thread();  // 主线程注册一次
    setup_signal_handlers();
    pthread_t t1, t2;
    pthread_create(&t1, NULL, worker_thread, NULL);
    pthread_create(&t2, NULL, worker_thread, NULL);
    sleep(1);
    // 故意崩溃触发
    *(volatile int*)0 = 42;
    // main函数中等待线程启动
    for (int i = 0; i < 10; ++i) {
        if (g_thread_count.load() >= 3) break;  // 主线程 + 两个工作线程
        usleep(100000);                         // 100ms，快速轮询等待
    }
    return 0;
}

主要内容与背景

这是关于一种崩溃（crash）时生成内存转储（core dump / minidump）机制的讨论，结合了当前设计状态和未来规划。

1. 现状 Caveats（限制/注意点）

没有稀疏虚拟地址 (sparse virtual addresses)
目前系统没有使用稀疏虚拟地址技术。
意味着：
- 如果一块内存区域在 /proc/self/maps 中列出，并且是以 2MB 为单位的连续块，那它肯定也对应物理内存。
- 这样简化了内存转储过程，因为不用担心虚拟地址映射到的物理内存不连续或不存在。
- 这是可以解决的问题，因为内存分配器是自家的，可以控制如何分配内存。

2. 未来工作（Future work）

a) 标记内存区域的转储策略的API

想要提供接口，可以标记某些内存范围为：
- “永远转储” (always dump)
- “永不转储” (never dump)
对“永远转储”的期望：
- 只在启动时标记，不是在运行时动态改变。
- 用于保存关键且有价值的数据结构（比如服务器或权限管理相关的核心数据）。
对“永不转储”的期望：
- 尽量少用。
- 用于敏感信息（如AES密钥不在进程时），DMA缓冲区，消息缓冲区等不需要保存的区域。
需要考虑设计一个无锁且崩溃安全的表结构，用于管理这些标记，保证崩溃时读取时不会出错。

b) 保存更多寄存器状态？

是否保存更多CPU状态结构，比如 NT_FPREGSET (浮点寄存器) 和 NT_X86_XSTATE（扩展CPU状态）？
目前还没发现需要额外保存这些。

3. 总结 Summary

通过信号处理器（signal handler）可以写出一个有效的 core dump（或者 minidump）。
在崩溃时通知其他线程收集它们的寄存器和栈信息。
实际测试表明，生成的 minidump 文件在大小和效率上都优于传统 core 文件，甚至小了一个数量级（1.4G 的 core 文件，对比 313M 的 minidump）。

4. 你可以这样理解：

这段文字说明了：

目前的内存转储方案比较简洁，依赖于某些假设（无稀疏虚拟内存），方便快速抓取核心数据。
未来希望能更灵活，精细地控制哪些内存块要转储，哪些不要，尤其是为了保护敏感数据和优化转储文件大小。
已经能写出比较紧凑且有用的转储文件，方便崩溃调试，同时避免传统core文件过大问题。

你可能感兴趣的:(CppCon,学习,c++,开发语言)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
Effective C++ 条款10：令operator=返回一个reference to *this 君鼎 C++c++
EffectiveC++条款10：令operator=返回一个referenceto*this核心思想：赋值操作符（operator=）应始终返回当前对象的引用（*this），以实现连锁赋值并保持与内置类型一致的语义。⚠️1.问题场景：违反连锁赋值语义classWidget{public:voidoperator=(constWidget&rhs){//错误：返回voidvalue=rhs.val
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
C++ ：vector的模拟诚自然成 c++开发语言
目录一、vector的迭代器二、vector的构造函数默认构造函数参数构造函数迭代器范围构造函数拷贝构造函数swap:交换vector重载赋值符析构函数reserve:扩容vectorresize:调整大小push_back:添加元素empty:判空pop_back:后删获取大小与容量：size(),capacity()重载operator[]：元素访问insert：插入元素erase:删除一个元
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
闭组进行时... 李亚青_强化班
今天是2019年12月1号距离开始三月学习的日子:2019年10月07,已经过去将近两个月，回顾这一阶段的学习，收获了什么?又学会了什么呢?图片发自App我想，收获最大的就是身边这一群人吧,有和蔼可亲的学姐，贴心的学长，嬉戏打闹，玩的不亦乐乎，但也同样认真踏实学习小伙伴图片发自App本以为在这样的时刻，有太多太多话，太多太多想法想要表达，可言到此处，又觉得似乎没有什么想要说的了还是那句话，幸运遇到
2021-10-23 赵甄文的幸福
秀荣感恩日记Day42[烟花]感恩语录感恩自己有能力有好身体，可以到处走动，做自己想做的事情10.23感恩日记今天做的事情瑜伽一小时户外散步一小时泡脚20分钟学习打卡和孩子沟通[爱心]感动的瞬间今天瑜伽回来，发现老公在厨房里做鱼。每次老公有时间休息的时候都会给我做硬菜。刘姐约我一起去公园散步晒太阳。虽然完美错过，但心里还是暖暖的。每天睁开眼打开手机，先去自己的群里逛一逛，每每发现有人点赞或者互动都
孤独的守候怒吼的生命
孤独了时光岁月了寂寞带来了惆怅那些孤独的日子里我们珍惜奋斗起来品味人生的真谛做到更好奋斗当中的你是那么努力格外自律学习起来五彩斑斓那些日子时光匆匆人生的机会很多需要把握痛苦的回忆记得住那些忧愁孤苦五一的日子寂寞当中的你时光荏苒独自带给我荒草学习起来努力奋斗可是我们做的还不够把握发展生活带给我们更多希望静静的述说你的故事你的精彩人生当中我们总是努力把握生活带给我们更多的学习生活当中我们奋斗可是做的还
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
2018-08-29精进打卡米兰王
姓名:王兰英【日精进打卡第25天】【知～学习】《六项精进》1遍共39遍《大学》1遍共50遍【经典名句分享】一切都是最好的安排。【行～实践】一、修身：（对自己个人）1，散步1小时。2，每天坚持读书。二、齐家：（对家庭和家人）1，指导孩子开车。2，和家人一起逛超市。三、建功：（对工作）用心做好每件事。｛积善｝：发愿从2018年8月5日起1年内365个善事。今日1善，累计27善。【省～觉悟】正人先正己。
陶勇：要不要参加分班考试学习？看完再说。陶勇
每年到了升学季，有很多培训机构都特别忙，为什么呢？因为有成千上万的学生，会选择升学前的分班考试的培训。比如说，小升初的孩子，到了暑假，很多孩子都会去选择一个初中，初一的分班考试的培训，那考入高中的孩子也有很多孩子会选择这种新高一的分班考试的培训。当然了，我个人认为这种选择并不是孩子自身的选择，主要还是家长的选择。当然也有少数孩子会对自己有比较高的要求，他们也会主动的去选择。为什么要去上分班考试的这
C++编程基础与面向对象概念解析侯昂面向对象编程 C++语法函数类与对象继承与多态性
C++编程基础与面向对象概念解析背景简介C++是一种广泛使用的面向对象编程语言，它允许开发者创建高效、灵活且功能强大的程序。本文基于《C++Primer》一书的章节内容，深入解析C++的核心概念和面向对象编程原则，旨在帮助读者构建扎实的C++编程基础。面向对象编程的原则软件危机与进化介绍了软件危机的产生和软件进化的必要性，强调了面向对象编程（OOP）在应对这些问题中的优势。面向对象编程范式讨论了面
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

CppCon 2018 学习:Mini Dumps Efficient core dumps for FlashBlade

什么是 Core Dump？

Mini Dump 的目的

FlashBlade 场景中应用 Mini Dump 的原因

Mini Dump 的内容通常包括：

Mini Dump 的技术实现方式（一般思路）：

开发者如何利用 Mini Dump？

总结一句话：

动机（Motivation）解析：

1. Core dumps 非常有用

2. 传统 core dump 的问题

3. 我们真正想要的东西：

关键要点总结：

Mini Dump 的设计目标

为什么不用 MADV_DONTDUMP 来排除内存区域？

什么是 MADV_DONTDUMP？

为什么 不能仅靠 MADV_DONTDUMP？

总结：

core dump 文件（通常是 core）内部到底包含了什么？

什么是 Core Dump？

如何查看 core 文件内容？

Core 文件结构解析：

Notes 区域内容详解

PT_LOAD 段

总结图示：

你可以实际尝试：

在信号处理函数（signal handler）里做什么 —— “轻量 mini core dump” 的关键技术点之一

信号处理函数是什么？

在 signal handler 中能干什么？

“Signal-safe functions”（异步信号安全函数）

不能做的事（常见坑）

这意味着什么？

你 可以写出简化版 core 文件：

示例：注册一个最小 signal handler

总结：信号处理器中能做的事情

改进这个 dump 文件内容，让它更像一个实用的 mini core dump，可参考以下几个扩展方向：

目标：写一个更实用的 mini dump 文件

改进后的 handler 示例代码

main() 保持不变：

编译和运行

代码已经实现了基础的信号捕获与部分信息写入：

1. 写寄存器状态（而非只写栈帧指针）

2. 信号处理函数注册用 sigaction 并使用 SA_SIGINFO

3. 对栈内容和指针进行更安全的访问

4. 多线程处理

5. 设计“锚点”机制

6. 避免非信号安全函数

7. 例子：改进后的注册与信号处理器

总结

想做一个非常完善的多线程mini dump工具，包含：

1. 线程启动自动登记tid

2. 更完整寄存器和栈遍历

3. 锚点内存块管理与递归追踪

4. 多线程信号同步（无锁或条件变量）

5. dump文件结构（建议）

简单示例：自定义格式写法（伪代码）

总结

主要内容与背景

1. 现状 Caveats（限制/注意点）

2. 未来工作（Future work）

a) 标记内存区域的转储策略的API

b) 保存更多寄存器状态？

3. 总结 Summary

4. 你可以这样理解：

你可能感兴趣的:(CppCon,学习,c++,开发语言)

为什么不用 `MADV_DONTDUMP` 来排除内存区域？

什么是 `MADV_DONTDUMP`？

为什么不能仅靠 MADV_DONTDUMP？

core dump 文件（通常是 `core`）内部到底包含了什么？

你可以写出简化版 core 文件：

改进后的 `handler` 示例代码

`main()` 保持不变：

2. 信号处理函数注册用 `sigaction` 并使用 `SA_SIGINFO`