编译链接过程

编译链接过程

一个完整的编译链接过程包含了以下步骤:

  • 预编译
  • 编译
  • 汇编
  • 链接

预编译

预编译的处理规则如下

  • 删除#define,并且展开所有的宏定义
  • 处理条件预编译指令,#if/#ifdef/#elif/#else/#endif
  • 递归处理#include
  • 删除注释 // /注释/
  • 添加行好和文件标识,以便编译时产生的错误或警告时能显示行号
  • 保留#pragma编译指令,编译阶段需要使用到
gcc -E hello.c -o hello.i

编译

编译把预编译生成的文件进行一些列的词法语法分析生成汇编代码

gcc -S hello.i -o hello.s
# 或者
gcc -S hello.c -o hello.s

汇编

汇编是将汇编代码转换成机器可以执行的指令(称为目标文件)

as hello.s -o hello.o
# 或者
gcc -c hello.c -o hello.o
gcc -c hello.s -o hello.o

链接

把目标文件链接最终生成可执行文件

 /Users/aron/softwares/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/ld" -demangle -lto_library /Users/aron/softwares/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/libLTO.dylib -no_deduplicate -dynamic -arch x86_64 -macosx_version_min 10.13.0 -o a.out /var/folders/nw/w87gck5x1mb57_rh9_g1cyd80000gn/T/hello-316635.o -lSystem /Users/aron/softwares/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/clang/9.0.0/lib/darwin/libclang_rt.osx.a

 # 去掉路径的简化版本

 ld -demangle -lto_library libLTO.dylib -no_deduplicate -dynamic -arch x86_64 -macosx_version_min 10.13.0 -o a.out hello.o -lSystem libclang_rt.osx.a

其中编译过程是复杂度最高的本部分,包含了

  • 词法分析
  • 语法分析
  • 语义分析
  • 中间语言生成

编译过程展开

词法分析

源码输入到扫描器,分割为一系列的记号(Token),现成的工具lex
Yacc 与 Lex 快速入门 https://www.ibm.com/developerworks/cn/linux/sdk/lex/

# lex-code-snipet.c 文件内容
# arrar[index] = (index + 4) * (2 + 6)

lex -t lex-code-snipet.c > lex-code-result.yyc

语法分析

把语法分析的结果转换为表达式树
现成的工具yacc
Yacc 与 Lex 快速入门 https://www.ibm.com/developerworks/cn/linux/sdk/lex/

语法分析

语义分析

分析语法树的表达式是否合法
静态语义分析:

  • 浮点型的表达式赋值给整形表达式,隐含了转换过程
  • 浮点型的表达式赋值给指针,语义分析会检测出类型不匹配编译器将会报错


    语义分析

中间语言生成

源码级别会有一个优化的过程(Source Code optimizer),优化后的语法树如下


中间语言生成

源码优化器往往将整个语法树转换成中间代码,他是语法树的顺序标识,和目标代码非常接近,与机器的运行环境无关,不包含数据的尺寸、变量的地址和寄存器名称,常见的中间代码是三地址码(Three-Address Code)

中间代码是的编译器可以被分为编译前端和编译后端

  • 编译前端生成和目标机器无关的中间代码
  • 编译后端把中间代码转换为目标机器的代码

模块拼装-静态链接

链接的主要内容就是把各个模块之间相互引用的部分都处理好,使得各个模块之间能够正确的衔接,链接过程包含:

  • 地址空间分配
  • 符号决议
  • 重定位

模块拼装-静态链接

链接过程解析:

链接过程解析

  • main.o 依赖 func.o foo函数
  • main.o 和 func.o 分开独立编译
  • main.o 预留func.o foo符号的地址
  • 拼接main.o 和 func.o 是修正main.o 中预留的 foo符号的地址,这个过程称为重定位(Relocation)

这个地址修正的过程称为重定位(Relocation),每个要被修正的地方叫重定位入口(Relocation Entry)

你可能感兴趣的:(编译链接过程)