代码生成

在计算机科学中，代码生成是代码编译过程中的其中一个环节。在这个环节中，代码生成器会将某中間語言（IR）转换为机器可以执行的形式如机器码，或者另一门语言，如C语言代码^[1]。

工业级的编译器一般存在多个编译环节（Compiler pass）。第一个环节通常会将源代码转换成抽象语法树，而抽象语法树随后又会被转换成某种中间语言（IR）。编译器的中间环节会对这门中间语言进行各种变换以优化程序的性能。这种具有阶段性的编译方式，其优势在于允许编译器开发者复用前段和中端的代码，同时也降低了编译器的开发难度，因为一些优化算法的执行条件需要由其他优化算法完成，也因为一些算法需要一次次地重复执行。由于以上原因，复用性以及重复性都相对较低的代码生成器，一般位于编译过程中的最后几个环节。

主要工作

除了将中间语言转换成线性的机器码序列这项基本工作，典型的代码生成器也会试图优化生成出来的代码。

工业级编译器的代码生成阶段一般包括了：

指令选择：决定了编译器使用哪些指令来表达中间语言中的某一操作。
指令调度：决定了编译器以何种顺序放置这些选择好的指令。对于有流水线的目标机器，这个阶段有着关键影响。
寄存器分配：目的是将每个变量与处理器上的寄存器一一对应。
如果有相关需求，生成调试数据并且将其嵌入二进制文件中，以方便程序员调试程序。

运行时代码生成

在即时编译（JIT）等场景下，会要求程序在运行时生成代码，而生成代码的时间和空间效率在这种情况下都极其重要。例如说，当有程序在运行时解释正则表达式，并根据该正则表达式生成代码时，通常该程序会先生成非确定有限状态自动机而不是确定有限状态自动机，因为通常前者的创建速度以及占用的内存空间等属性往往会比后者更为优秀。

参考文献

^ Steven Muchnick; Muchnick and Associates. Advanced Compiler Design Implementation. Morgan Kaufmann. 15 August 1997. ISBN 978-1-55860-320-2. code generation.

[MuchnickAssociates1997-1] Steven Muchnick; Muchnick and Associates. Advanced Compiler Design Implementation. Morgan Kaufmann. 15 August 1997. ISBN 978-1-55860-320-2. code generation.

[1]

查论编编译器优化
基本塊	窥孔优化
循环优化（英语：Loop optimization）	归纳变量（英语：Induction variable）強度折減循环合并（英语：Loop fusion）循环反演（英语：Loop inversion）循环交换（英语：Loop interchange）循环不变代码外提循环嵌套优化（英语：Loop nest optimization）循环展开循环分割（英语：Loop splitting）迴圈判斷外提软件流水（英语：Software pipelining）自动并行化（英语：Automatic parallelization）
数据流分析	公共子表达式消除常數折疊归纳变量识别和消除（英语：Induction variable recognition and elimination）无作用储存体（英语：Dead store）消除用户定义链（英语：Use-define chain）活跃变量分析（英语：Live variable analysis）可用表达式（英语：Available expression）
基于SSA的优化	全局值编号（英语：Global value numbering）稀疏有條件的常數傳播
代码生成	暫存器配置指令选择指令调度再具体化
函数	尾调用消除去森林化（英语：Deforestation (computer science)）
全局	过程间优化（英语：Interprocedural optimization）
其他	边界检查消除（英语：Bounds-checking elimination）编译时函数执行（英语：Compile-time function execution）死碼刪除内联展开跳转线程（英语：Jump threading）
静态分析	别名分析指针分析（英语：Pointer analysis）形状分析（英语：Shape analysis (program analysis)）逃逸分析数组访问分析（英语：Array access analysis）依赖分析（英语：Dependence analysis）控制流分析数据流分析

代码生成

主要工作

运行时代码生成

参考文献

€4.95