Lab6: update experiment record for local array initialization optimization

2026-06-01 16:05:00 +08:00
parent 233c163271
commit e62c115693
1 changed files with 13 additions and 0 deletions
--- a/doc/Lab6-实验记录.md
+++ b/doc/Lab6-实验记录.md
@@ -89,6 +89,19 @@ LICM 的主要步骤如下：
 #### 效果
 不仅提升了循环内部求值的运行效率，而且由于 GEP 和类型转换能够被完美外提，后端分配物理寄存器时的压力也得到了有效缓解。

+### 4.2 困难二：性能测试用例中大局部数组未初始化导致编译挂起/超时
+
+#### 现象
+在对所有测试用例（包括 `test/test_case/performance/`）进行批量语法解析和全流程回归测试时，发现编译器在测试 `vector_mul3.sy` 时一直挂起，且在执行优化遍时超时。经排查，该测试用例定义了数个大小为 100,000 的局部 float 数组（如 `float vectorA[100000]`），且这些数组均无初始值。
+原先的 IR 翻译（`IRGenDecl.cpp`）在声明任何局部变量时，无论其是否有初始化表达式，均会默认递归调用 `ZeroInitializeLocal`。这对于 100,000 大小的数组会一次性生成多达 10 万个 GEP 指令和 10 万个 Store 指令。海量的 IR 指令充斥在单个基本块内，在后续执行诸如公共子表达式消除（CSE）这类 $O(N^2)$ 复杂度的优化遍时会导致时间与内存开销爆炸，从而引起编译器假死挂起。
+
+#### 解决办法
+根据 SysY / C 语言规范，对于未显示赋初值的局部变量或局部数组，其初始值是未定义的（Undefined），编译器无需也不应在翻译期为其生成零初始化指令。
+修改 `src/irgen/IRGenDecl.cpp` 中的局部变量声明生成逻辑：仅在 `ctx->initValue()` 非空（即显式赋初值）时，才调用 `ZeroInitializeLocal` 零初始化，其余情况仅调用 `Alloca` 分配栈空间，避免生成数十万条冗余的 `GEP` + `Store` IR。
+
+#### 效果
+修改后，针对 `vector_mul3.sy` 这样的大局部数组未初始化用例，IR 生成指令数剧降。全编译优化流程在几毫秒内即可顺利运行完毕，且生成的 IR 更加简洁高效，批量测试脚本 `run_all_tests.sh` 能够在 10 秒内全部运行成功，未再出现任何超时挂起现象。
+
 ## 5. 验证结果

 重新构建并执行所有的后端汇编生成与模拟执行测试：