Lab6: update experiment record for local array initialization optimization
This commit is contained in:
@@ -89,6 +89,19 @@ LICM 的主要步骤如下:
|
||||
#### 效果
|
||||
不仅提升了循环内部求值的运行效率,而且由于 GEP 和类型转换能够被完美外提,后端分配物理寄存器时的压力也得到了有效缓解。
|
||||
|
||||
### 4.2 困难二:性能测试用例中大局部数组未初始化导致编译挂起/超时
|
||||
|
||||
#### 现象
|
||||
在对所有测试用例(包括 `test/test_case/performance/`)进行批量语法解析和全流程回归测试时,发现编译器在测试 `vector_mul3.sy` 时一直挂起,且在执行优化遍时超时。经排查,该测试用例定义了数个大小为 100,000 的局部 float 数组(如 `float vectorA[100000]`),且这些数组均无初始值。
|
||||
原先的 IR 翻译(`IRGenDecl.cpp`)在声明任何局部变量时,无论其是否有初始化表达式,均会默认递归调用 `ZeroInitializeLocal`。这对于 100,000 大小的数组会一次性生成多达 10 万个 GEP 指令和 10 万个 Store 指令。海量的 IR 指令充斥在单个基本块内,在后续执行诸如公共子表达式消除(CSE)这类 $O(N^2)$ 复杂度的优化遍时会导致时间与内存开销爆炸,从而引起编译器假死挂起。
|
||||
|
||||
#### 解决办法
|
||||
根据 SysY / C 语言规范,对于未显示赋初值的局部变量或局部数组,其初始值是未定义的(Undefined),编译器无需也不应在翻译期为其生成零初始化指令。
|
||||
修改 `src/irgen/IRGenDecl.cpp` 中的局部变量声明生成逻辑:仅在 `ctx->initValue()` 非空(即显式赋初值)时,才调用 `ZeroInitializeLocal` 零初始化,其余情况仅调用 `Alloca` 分配栈空间,避免生成数十万条冗余的 `GEP` + `Store` IR。
|
||||
|
||||
#### 效果
|
||||
修改后,针对 `vector_mul3.sy` 这样的大局部数组未初始化用例,IR 生成指令数剧降。全编译优化流程在几毫秒内即可顺利运行完毕,且生成的 IR 更加简洁高效,批量测试脚本 `run_all_tests.sh` 能够在 10 秒内全部运行成功,未再出现任何超时挂起现象。
|
||||
|
||||
## 5. 验证结果
|
||||
|
||||
重新构建并执行所有的后端汇编生成与模拟执行测试:
|
||||
|
||||
Reference in New Issue
Block a user