crash分析ramdump

我们需要在PC机上运行crash,从源码来编译,

可以从Redhat社区下载源码。

解压后,进入目录后使用一下命令:

make target=arm64
make install

这样就安装好了crash了。

 crash介绍

crash主要是用来离线分析linux内核内存转存文件,它整合了gdb工具,具有很强的功能,可以查看堆栈,dmesg日志,内核数据结构,反汇编等等.其支持多种工具生成的内存转储文件格式,包括:

  • Live linux系统

  • kdump产生的正常的和压缩的内存转储文件

  • 由makedumpfile命令生成的压缩的内存转储文件

  • 由netdump生成的内存转储文件

  • 由diskdump生成的内存转储文件.

  • 由kdump生成的Xen的内存转储文件

  • LKCD生成的内存转储文件

  • Mcore生成的内存转储文件

  • ramdump格式的raw内存转储文件

crash使用方法

本文主要使用crash来分析ramdump文件.ramdump文件几乎是对整个内存的镜像,除了一些security类型的memory抓不出来之外,几乎所有的DRAM都被抓下来.有些问题的复现概率低,而且有些问题是由于踩内存导致的,这种问题靠log往往是无法分析出来的,所以如果可以在问题发生时候把内存镜像保存下来,就可以分析了.

在命令行下使用如下命令,在”@”后面跟的是DRAM的物理内存开始的物理地址:

#crash  

这里的vmlinux是和ram dump上的内核要一致,而且是需要打开内核的debug选项.

crash分析ramdump_第1张图片

Crash成功启动后,会出现如下的信息:crash分析ramdump_第2张图片这里就可以看到关于一些系统的信息等等;接下来我们可以在”crash>”输入命令来分析了。

crash中的命令使用

ps

该命令可以输出进程信息

这里的进程状态标志:

  • RU:即R状态,进程处于TASK_RUNNING.

  • IN:S状态,进程处于TASK_INTERRUPTIBLE.

  • UN:D状态,进程处于TASK_UNINTERRUPTIBLE.

bt

用于查看某个线程或进程的调用栈

bt -a:以任务为单位,显示每个任务的堆栈信息.

bt -t:显示当前任务的堆栈中的所有文本标志付

bt -f:显示当前任务的所有堆栈数据,通常用来检查每个函数的参数传递.

#@# dis <函数名>

用于反汇编某个函数.

crash分析ramdump_第3张图片

dis后面还可以跟着的参数有:

-l | -u | -b num | address| symbol| expression| count

whatis -o <结构体>

用于查看结构体.这后面还可以跟联合体,宏的名称或者内核的符号.

crash分析ramdump_第4张图片

rd <虚拟地址>

用于查看虚拟地址的值.其后面可以跟的参数还有:

-dDsSupxmf | -8 | -16| -32| -64| -o offset| -e addr| address| symbol |count

struct <结构体> <该结构体的虚拟地址>

用于查看该虚拟地址处,该结构体的值,使用这个可以查看某个进程在所拥有的某个结构体的值

crash分析ramdump_第5张图片

struct <结构体>.成员,成员<结构体的虚拟地址>

用于查看该结构体的内部成员的值.

sym

用于把一个标志符转换到它所对应的虚拟地址,或者把虚拟地址转换为它所对应的标志符。

sym -l:列出所有的标志符以及虚拟地址.

sym -M:列出模块标志符的集合.

sym -m module :列出模块name的虚拟地址

sym vaddr:显示虚拟地址vaddr所代表的标志.

sym -q :搜索所有包含string的标志以及虚拟地址.

crash分析ramdump_第6张图片

task [ -R member][,member] [pid]

用于显示指定进程的task_struct的内容.

timer

用于显示timer相关信息.

kmem -i

用于查看内存使用信息.

l *虚拟地址

用于查看指定地址对应的代码行.

附:crash中常用的命令

命令 说明 例子
* 指针的快捷方式,用于代替struct/union *page 0xc02943c0:显示0xc02943c0地址的page结构体
files 显示已打开的所有文件的信息 files 462:显示进程462的已打开文件信息
mach 显示与机器相关的参数信息 mach:显示CPU型号,核数,内存大小等
sys 显示特殊系统的数据 s ys config:显示CONFIG_xxx配置宏状态
timer 无参数。按时间的先后顺序显示定时器队列的数据 timer:显示详细信息
mod 显示已加载module的详细信息 mod:列出所有已加载module信息
runq 显示runqueue信息 runq:显示所有runqueue里的task
tree 显示基数树/红黑树结构 tree -t rbtree -o vmap_area.rb_node vmap_area_root:显示所有红黑树vmap_area.rb_node节点地址
fuser 显示哪些task使用了指定的文件/socket fuser /usr/lib/libkfm.so.2.0.0:显示使用了该文件的所有进程
mount 显示已挂载的文件系统信息 mount:当前已挂载的文件系统信息
ipcs 显示System V IPC信息 ipcs:显示系统中System V IPC信息
ps 显示进程状态 注意:类似ps命令
struct 显示结构体的具体内容 struct vm_area_struct c1e44f10:显示c1e44f10结构
union 显示联合体的具体内容,用法与struct一致 union bdflush_param:显示bdflush_param结构
waitq 列出在等待队列中的所有task。参数可以指定队列的名称、内存地址等 waitq buffer_wait:显示buffer_wait等待队列信息
irq 显示中断编号的所有信息 irq 18:显示中断18的信息
list 显示链表的内容 list task_struct.p_pptr c169a000:显示c169a000地址所指task里p_pptr链表
log 显示内核的日志,以时间的先后顺序排列 log -m:显示kernel log
dev 显示数据关联着的块设备分配,包括端口使用、内存使用及PCI设备数据 dev:显示字符/块设备相关信息
sig 显示一个或者多个task的signal-handling数据 sig 8970:显示进程8970的信号处理相关信息
task 显示指定内容或者进程的task_struct的内容 task -x:显示当前进程task_struct等内容
swap 无参数。显示已配置好的交换设备信息 swap:交换设备信息
search 在给定范围的用户、内核虚拟内存或者物理内存搜索值 search -u deadbeef:在用户内存搜索0xdeadbeef
bt 显示调用栈信息 bt:显示当前调用栈
net 显示各种网络相关的数据 net:显示网络设备列表
vm 显示task的基本虚拟内存信息 vm:类似于/proc/self/maps
btop 把一个16进制地址转换成它的分页号 N/A
ptob 该命令与btop相反,是把一个分页号转换成地址 N/A
vtop 显示用户或内核虚拟内存所对应的物理内存 N/A
ptov 该命令与vtop相反。把物理内存转换成虚拟内存 N/A
pte 16进制页表项转换为物理页地址和页的位设置 N/A
alias 显示或建立一个命令的别名 alias kp kmem -p:以后用kp命令相当于kmem -p
foreach 用指定的命令枚举 foreach bt:显示所有进程的调用栈
repeat 循环执行指定命令 repeat -1 p jiffies:每个1s执行p jiffies
ascii 把16进制表示的字符串转化成ascii表示的字符串 ascii 62696c2f7273752f:结果为/usr/lib
set 设置要显示的内容,内容一般以进程为单位,也可以设置当前crash的内部变量 set -p:切换到崩溃进程的上下文环境
p print的缩写,打印表达式的值。表达式可以为变量,也可以为结构体 N/A
dis disassemble的缩写。把一个命令或者函数分解成汇编代码 dis sys_signal:反汇编sys_signal函数
whatis 搜索数据或者类型的信息 whatis linux_binfmt:显示linux_binfmt结构体
eval 计算表达式的值,及把计算结果或者值显示为16、10、8和2进制 N/A
kmem 显示当前kernel使用内存状况 kmem -i:显示kernel使用内存状况
sym 显示符号所在的虚拟地址,或虚拟地址对应的符号 sym jiffies:显示jiffies地址
rd 显示指定内存的内容。缺少的输出格式是十六进制输出 rd -a linux_banner:显示linux_banner内容
wr 根据参数指定的写内存。在定位系统出错的地方时,一般不使用该命令 wr my_debug_flag 1:修改my_debug_flag值为1
gdb 执行GDB原生命令 gdb help:执行gdb的help命令
extend 动态装载或卸载crash额外的动态链接库 N/A
q 退出 N/A
exit 同q,退出 N/A
help 帮助命令 N/A

你可能感兴趣的:(Linux性能优化,linux,debug,linux)