Basic Blocks and Traces：基本块、迹¶

约 1089 个字 4 行代码 6 张图片预计阅读时间 4 分钟

这一阶段的目标是将 IR 转换为更加契合机器码的 IR。上一章节讲到的 IR 与机器码之间有一些 mismatch：

解决方法是：

1. Canonical Trees：规范树¶

规范树是：

两个概念和在一起：

思想是上提 ESEQ 节点，直到其能变成 SEQ 节点的形式。

例子

需要注意以下特殊情况：

为了维持语句执行的顺序，e1 需要在 s 执行之前就获取到表达式的值。方法是：

但是也不全是这样，如果 s 和 e1 可以交换（commute），那么就可以直接将 e1 上提到 s 的前面。

如何知道是否 commute？

事实上，有些时候是否 commute，不是编译时刻就能够确定的。所以我们保守的估计：只有确定 e1 和 s 是 commute 的时候，才按照 commute 的方式上提，否则都按照上面的方法处理。

许多架构的 CALL 返回值都写在一个固定的寄存器中，这时如果有嵌套的 CALL，就会导致返回值覆盖丢失。为了避免这种情况，我们的想法是：每个返回值都赋给一个全新的临时寄存器。

CALL(f, args) ->
    ESEQ(MOVE(TEMP t, CALL(f, args)), TEMP t)

很简单。前面的工作完成后，树长得像

SEQ(SEQ(SEQ(..., sx), sy), sz)

持续应用规则 SEQ(SEQ(a, b), c) -> SEQ(a, SEQ(b, c))，直到树长得像

SEQ(s1, SEQ(s2, ..., SEQ(sn-1, sn)...))

这样，就可以直接把这个树拆成语句 s1, s2, ..., sn。

基本块是一个语句序列，总在开始进入，结尾退出，也即：

很直观，就是对程序段进行线性扫描：

BB 可以按照任意顺序重排，最后的执行结果是一样的。

Trace（迹）就是一个有序的基本块集合。一个程序有很多个，可能互相重叠的 trace。

基于上面的目标，我们希望组织出这样的 traces：

同时我们需要尽可能减小 trace 的数量。

算法就是 DFS：

为了简化后续的流程，Tiger 编译器还会做一些调整：

任何后面紧跟着 false label 的 CJUMP
- 不动
任何后面紧跟着 true label 的 CJUMP
- 调换条件
其他情况（CJUMP 后面紧跟着的不是 true label 或 false label）
- 创建一个新的 false label，跳转到这个 label
- 之后，再跳转到真正的 false label