Merge branch 'midend' into backend

2025-08-15 21:23:48 +08:00
parent 8cabb1f195 fa33bf5134
commit fdba73d5e1
42 changed files with 11353 additions and 566 deletions
--- a/src/midend/SysYIRGenerator.cpp
+++ b/src/midend/SysYIRGenerator.cpp
@@ -391,26 +391,7 @@ void SysYIRGenerator::compute() {
              case BinaryOp::ADD: resultValue = builder.createAddInst(lhs, rhs); break;
              case BinaryOp::SUB: resultValue = builder.createSubInst(lhs, rhs); break;
              case BinaryOp::MUL: resultValue = builder.createMulInst(lhs, rhs); break;
-              case BinaryOp::DIV: {
-                ConstantInteger *rhsConst = dynamic_cast<ConstantInteger *>(rhs);
-                if (rhsConst) {
-                  int divisor = rhsConst->getInt();
-                  if (divisor > 0 && (divisor & (divisor - 1)) == 0) {
-                    int shift = 0;
-                    int temp = divisor;
-                    while (temp > 1) {
-                      temp >>= 1;
-                      shift++;
-                    }
-                    resultValue = builder.createSRAInst(lhs, ConstantInteger::get(shift));
-                  } else {
-                    resultValue = builder.createDivInst(lhs, rhs);
-                  }
-                } else {
-                  resultValue = builder.createDivInst(lhs, rhs);
-                }
-                break;
-              }
+              case BinaryOp::DIV: resultValue = builder.createDivInst(lhs, rhs); break;
              case BinaryOp::MOD: resultValue = builder.createRemInst(lhs, rhs); break;
              }
            } else if (commonType == Type::getFloatType()) {
@@ -1212,15 +1193,25 @@ std::any SysYIRGenerator::visitFuncDef(SysYParser::FuncDefContext *ctx){
  for(int i = 0; i < paramActualTypes.size(); ++i) {
    Argument* arg = new Argument(paramActualTypes[i], function, i, paramNames[i]);
    function->insertArgument(arg);
+  }

+  // 先将所有参数名字注册到符号表中，确保alloca不会使用相同的名字
+  for (int i = 0; i < paramNames.size(); ++i) {
+    // 预先注册参数名字，这样addVariable就会使用不同的后缀
+    module->registerParameterName(paramNames[i]);
  }

  auto funcArgs = function->getArguments();
  std::vector<AllocaInst *> allocas;
  for (int i = 0; i < paramActualTypes.size(); ++i) {
-    AllocaInst *alloca = builder.createAllocaInst(Type::getPointerType(paramActualTypes[i]), paramNames[i]);
+    // 使用函数特定的前缀来确保参数alloca名字唯一
+    std::string allocaName = name + "_param_" + paramNames[i];
+    AllocaInst *alloca = builder.createAllocaInst(Type::getPointerType(paramActualTypes[i]), allocaName);
+    // 直接设置唯一名字，不依赖addVariable的命名逻辑
+    alloca->setName(allocaName);
    allocas.push_back(alloca);
-    module->addVariable(paramNames[i], alloca);
+    // 直接添加到符号表，使用原参数名作为查找键
+    module->addVariableDirectly(paramNames[i], alloca);
  }

  for(int i = 0; i < paramActualTypes.size(); ++i) {
@@ -1289,6 +1280,45 @@ std::any SysYIRGenerator::visitAssignStmt(SysYParser::AssignStmtContext *ctx) {
    if (dynamic_cast<AllocaInst*>(variable) || dynamic_cast<GlobalValue*>(variable)) {
        LValue = variable;
    }
+    
+    // 标量变量的类型推断
+    Type* LType = builder.getIndexedType(variable->getType(), indices);
+    
+    Value* RValue = computeExp(ctx->exp(), LType); // 右值计算
+    Type* RType = RValue->getType();
+
+    // TODO:computeExp处理了类型转换，可以考虑删除判断逻辑
+    if (LType != RType) {
+      ConstantValue *constValue = dynamic_cast<ConstantValue *>(RValue);
+      if (constValue != nullptr) {
+        if (LType == Type::getFloatType()) {
+          if(dynamic_cast<ConstantInteger *>(constValue)) {
+            // 如果是整型常量，转换为浮点型
+            RValue = ConstantFloating::get(static_cast<float>(constValue->getInt()));
+          } else if (dynamic_cast<ConstantFloating *>(constValue)) {
+            // 如果是浮点型常量，直接使用
+            RValue = ConstantFloating::get(static_cast<float>(constValue->getFloat()));
+          }
+        } else { // 假设如果不是浮点型，就是整型
+          if(dynamic_cast<ConstantFloating *>(constValue)) {
+            // 如果是浮点型常量，转换为整型
+            RValue = ConstantInteger::get(static_cast<int>(constValue->getFloat()));
+          } else if (dynamic_cast<ConstantInteger *>(constValue)) {
+            // 如果是整型常量，直接使用
+            RValue = ConstantInteger::get(static_cast<int>(constValue->getInt()));
+          }
+        }
+      } else {
+        if (LType == Type::getFloatType() && RType != Type::getFloatType()) {
+          RValue = builder.createItoFInst(RValue);
+        } else if (LType != Type::getFloatType() && RType == Type::getFloatType()) {
+          RValue = builder.createFtoIInst(RValue);
+        }
+        // 如果两者都是同一类型，就不需要转换
+      }
+    }
+    
+    builder.createStoreInst(RValue, LValue);
  }
  else {
    // 对于数组或多维数组的左值处理
@@ -1326,51 +1356,47 @@ std::any SysYIRGenerator::visitAssignStmt(SysYParser::AssignStmtContext *ctx) {
    } 
    // 左值为地址
    LValue = getGEPAddressInst(gepBasePointer, gepIndices);
-  }
+    
+    // 数组变量的类型推断，使用gepIndices和gepBasePointer的类型
+    Type* LType = builder.getIndexedType(gepBasePointer->getType(), gepIndices);
+    
+    Value* RValue = computeExp(ctx->exp(), LType); // 右值计算
+    Type* RType = RValue->getType();

-  // Value* RValue = std::any_cast<Value *>(visitExp(ctx->exp())); // 右值
-
-  // 先推断 LValue 的类型
-  // 如果 LValue 是指向数组的指针，则需要根据 indices 获取正确的类型
-  // 如果 LValue 是标量，则直接使用其类型
-  // 注意：LValue 的类型可能是指向数组的指针 (e.g., int(*)[3]) 或者指向标量的指针 (e.g., int*) 也能推断
-  Type* LType = builder.getIndexedType(variable->getType(), indices);
-
-  Value* RValue = computeExp(ctx->exp(), LType); // 右值计算
-  Type* RType = RValue->getType();
-
-  // TODO:computeExp处理了类型转换，可以考虑删除判断逻辑
-  if (LType != RType) {
-    ConstantValue *constValue = dynamic_cast<ConstantValue *>(RValue);
-    if (constValue != nullptr) {
-      if (LType == Type::getFloatType()) {
-        if(dynamic_cast<ConstantInteger *>(constValue)) {
-          // 如果是整型常量，转换为浮点型
-          RValue = ConstantFloating::get(static_cast<float>(constValue->getInt()));
-        } else if (dynamic_cast<ConstantFloating *>(constValue)) {
-          // 如果是浮点型常量，直接使用
-          RValue = ConstantFloating::get(static_cast<float>(constValue->getFloat()));
+    // TODO:computeExp处理了类型转换，可以考虑删除判断逻辑
+    if (LType != RType) {
+      ConstantValue *constValue = dynamic_cast<ConstantValue *>(RValue);
+      if (constValue != nullptr) {
+        if (LType == Type::getFloatType()) {
+          if(dynamic_cast<ConstantInteger *>(constValue)) {
+            // 如果是整型常量，转换为浮点型
+            RValue = ConstantFloating::get(static_cast<float>(constValue->getInt()));
+          } else if (dynamic_cast<ConstantFloating *>(constValue)) {
+            // 如果是浮点型常量，直接使用
+            RValue = ConstantFloating::get(static_cast<float>(constValue->getFloat()));
+          }
+        } else { // 假设如果不是浮点型，就是整型
+          if(dynamic_cast<ConstantFloating *>(constValue)) {
+            // 如果是浮点型常量，转换为整型
+            RValue = ConstantInteger::get(static_cast<int>(constValue->getFloat()));
+          } else if (dynamic_cast<ConstantInteger *>(constValue)) {
+            // 如果是整型常量，直接使用
+            RValue = ConstantInteger::get(static_cast<int>(constValue->getInt()));
+          }
        }
-      } else { // 假设如果不是浮点型，就是整型
-        if(dynamic_cast<ConstantFloating *>(constValue)) {
-          // 如果是浮点型常量，转换为整型
-          RValue = ConstantInteger::get(static_cast<int>(constValue->getFloat()));
-        } else if (dynamic_cast<ConstantInteger *>(constValue)) {
-          // 如果是整型常量，直接使用
-        RValue = ConstantInteger::get(static_cast<int>(constValue->getInt()));
-
+      } else {
+        if (LType == Type::getFloatType() && RType != Type::getFloatType()) {
+          RValue = builder.createItoFInst(RValue);
+        } else if (LType != Type::getFloatType() && RType == Type::getFloatType()) {
+          RValue = builder.createFtoIInst(RValue);
        }
-      }
-    } else {
-      if (LType == Type::getFloatType()) {
-        RValue = builder.createItoFInst(RValue);
-      } else { // 假设如果不是浮点型，就是整型
-        RValue = builder.createFtoIInst(RValue);
+        // 如果两者都是同一类型，就不需要转换
      }
    }
+    
+    builder.createStoreInst(RValue, LValue);
  }
-  
-  builder.createStoreInst(RValue, LValue);
+
  invalidateExpressionsOnStore(LValue);
  return std::any();
 }
@@ -1537,7 +1563,7 @@ std::any SysYIRGenerator::visitWhileStmt(SysYParser::WhileStmtContext *ctx) {
  }

  builder.createUncondBrInst(headBlock);
-  BasicBlock::conectBlocks(builder.getBasicBlock(), exitBlock);
+  BasicBlock::conectBlocks(builder.getBasicBlock(), headBlock);
  builder.popBreakBlock();
  builder.popContinueBlock();

@@ -1654,11 +1680,19 @@ std::any SysYIRGenerator::visitLValue(SysYParser::LValueContext *ctx) {
        break;
      }
    }
-    if (allIndicesConstant) {
+    // 如果是常量变量且所有索引都是常量，并且不是数组名单独出现的情况
+    if (allIndicesConstant && !dims.empty()) {
      // 如果是常量变量且所有索引都是常量，直接通过 getByIndices 获取编译时值
      // 这个方法会根据索引深度返回最终的标量值或指向子数组的指针 (作为 ConstantValue/Variable)
      return constVar->getByIndices(dims);
    }
+    // 如果dims为空，检查是否是常量标量
+    if (dims.empty() && declaredNumDims == 0) {
+      // 常量标量，直接返回其值
+      // 默认传入空索引列表，表示访问标量本身
+      return constVar->getByIndices(dims);
+    }
+    // 如果dims为空但不是标量（数组名单独出现），需要走GEP路径来实现数组到指针的退化
  }

  // 3. 处理可变变量 (AllocaInst/GlobalValue) 或带非常量索引的常量变量
@@ -1668,7 +1702,8 @@ std::any SysYIRGenerator::visitLValue(SysYParser::LValueContext *ctx) {
  if (dims.empty() && declaredNumDims == 0) {
    if (dynamic_cast<AllocaInst*>(variable) || dynamic_cast<GlobalValue*>(variable)) {
        targetAddress = variable;
-    } else {
+    } 
+    else {
        assert(false && "Unhandled scalar variable type in LValue access.");
        return static_cast<Value*>(nullptr);
    }
@@ -1683,16 +1718,39 @@ std::any SysYIRGenerator::visitLValue(SysYParser::LValueContext *ctx) {
      } else {
        gepBasePointer = alloc;
        gepIndices.push_back(ConstantInteger::get(0));
-        gepIndices.insert(gepIndices.end(), dims.begin(), dims.end());
+        if (dims.empty() && declaredNumDims > 0) {
+          // 数组名单独出现（没有索引）：在SysY中，多维数组名应该退化为指向第一行的指针
+          // 对于二维数组 T[M][N]，退化为 T(*)[N]，需要GEP: getelementptr T[M][N], T[M][N]* ptr, i32 0, i32 0
+          // 第一个i32 0: 选择数组本身，第二个i32 0: 选择第0行
+          // 结果类型: T[N]*
+          gepIndices.push_back(ConstantInteger::get(0));
+        } else {
+          // 正常的数组元素访问
+          gepIndices.insert(gepIndices.end(), dims.begin(), dims.end());
+        }
      }
    } else if (GlobalValue *glob = dynamic_cast<GlobalValue *>(variable)) {
      gepBasePointer = glob;
      gepIndices.push_back(ConstantInteger::get(0));
-      gepIndices.insert(gepIndices.end(), dims.begin(), dims.end());
+      if (dims.empty() && declaredNumDims > 0) {
+        // 全局数组名单独出现（没有索引）：应该退化为指向第一行的指针
+        // 需要添加一个额外的i32 0索引
+        gepIndices.push_back(ConstantInteger::get(0));
+      } else {
+        // 正常的数组元素访问
+        gepIndices.insert(gepIndices.end(), dims.begin(), dims.end());
+      }
    } else if (ConstantVariable *constV = dynamic_cast<ConstantVariable *>(variable)) {
      gepBasePointer = constV;
      gepIndices.push_back(ConstantInteger::get(0));
-      gepIndices.insert(gepIndices.end(), dims.begin(), dims.end());
+      if (dims.empty() && declaredNumDims > 0) {
+        // 常量数组名单独出现（没有索引）：应该退化为指向第一行的指针
+        // 需要添加一个额外的i32 0索引
+        gepIndices.push_back(ConstantInteger::get(0));
+      } else {
+        // 正常的数组元素访问
+        gepIndices.insert(gepIndices.end(), dims.begin(), dims.end());
+      }
    } else {
      assert(false && "LValue variable type not supported for GEP base pointer.");
      return static_cast<Value *>(nullptr);
@@ -1774,10 +1832,10 @@ std::any SysYIRGenerator::visitCall(SysYParser::CallContext *ctx) {

    // 获取形参列表。`getArguments()` 返回的是 `Argument*` 的集合，
    // 每个 `Argument` 代表一个函数形参，其 `getType()` 就是指向形参的类型的指针类型。
-    auto formalParams = function->getArguments();
+    const auto& formalParams = function->getArguments();

    // 检查实参和形参数量是否匹配。
-    if (args.size() != formalParams.size()) {
+    if (args.size() != function->getNumArguments()) {
      std::cerr << "Error: Function call argument count mismatch for function '" << funcName << "'." << std::endl;
      assert(false && "Function call argument count mismatch!");
    }
@@ -1809,15 +1867,27 @@ std::any SysYIRGenerator::visitCall(SysYParser::CallContext *ctx) {
          } else if (formalParamExpectedValueType->isFloat() && actualArgType->isInt()) {
            args[i] = builder.createItoFInst(args[i]);
          }
-          // 2. 指针类型转换 (例如数组退化：`[N x T]*` 到 `T*`，或兼容指针类型之间) TODO：不清楚有没有这种样例
+          // 2. 指针类型转换 (例如数组退化：`[N x T]*` 到 `T*`，或兼容指针类型之间)
          // 这种情况常见于数组参数，实参可能是一个更具体的数组指针类型，
-          // 而形参是其退化后的基础指针类型。LLVM 的 `bitcast` 指令可以用于
-          // 在相同大小的指针类型之间进行转换，这对于数组退化至关重要。
-          // else if (formalParamType->isPointer() && actualArgType->isPointer()) {
-            // 检查指针基类型是否兼容，或者是否是数组退化导致的类型不同。
-            // 使用 bitcast，
-            // args[i] = builder.createBitCastInst(args[i], formalParamType);
-          // }
+          // 而形参是其退化后的基础指针类型。
+          else if (formalParamExpectedValueType->isPointer() && actualArgType->isPointer()) {
+            // 检查是否是数组指针到元素指针的decay
+            // 例如：[N x T]* -> T*
+            auto formalPtrType = formalParamExpectedValueType->as<PointerType>();
+            auto actualPtrType = actualArgType->as<PointerType>();
+            
+            if (formalPtrType && actualPtrType && actualPtrType->getBaseType()->isArray()) {
+              auto actualArrayType = actualPtrType->getBaseType()->as<ArrayType>();
+              if (actualArrayType && 
+                  formalPtrType->getBaseType() == actualArrayType->getElementType()) {
+                // 这是数组decay的情况，添加GEP来获取数组的第一个元素
+                std::vector<Value*> indices;
+                indices.push_back(ConstantInteger::get(0)); // 第一个索引：解引用指针
+                indices.push_back(ConstantInteger::get(0)); // 第二个索引：获取数组第一个元素
+                args[i] = getGEPAddressInst(args[i], indices);
+              }
+            }
+          }
          // 3. 其他未预期的类型不匹配
          // 如果代码执行到这里，说明存在编译器前端未处理的类型不兼容或错误。
          else {
@@ -2201,15 +2271,23 @@ void Utils::createExternalFunction(
    const std::vector<std::string> &paramNames,
    const std::vector<std::vector<Value *>> &paramDims, Type *returnType,
    const std::string &funcName, Module *pModule, IRBuilder *pBuilder) {
-  auto funcType = Type::getFunctionType(returnType, paramTypes);
+  // 根据paramDims调整参数类型，数组参数需要转换为指针类型
+  std::vector<Type *> adjustedParamTypes = paramTypes;
+  for (int i = 0; i < paramTypes.size() && i < paramDims.size(); ++i) {
+    if (!paramDims[i].empty()) {
+      // 如果参数有维度信息，说明是数组参数，转换为指针类型
+      adjustedParamTypes[i] = Type::getPointerType(paramTypes[i]);
+    }
+  }
+  auto funcType = Type::getFunctionType(returnType, adjustedParamTypes);
  auto function = pModule->createExternalFunction(funcName, funcType);
  auto entry = function->getEntryBlock();
  pBuilder->setPosition(entry, entry->end());

  for (int i = 0; i < paramTypes.size(); ++i) {
-    auto arg = new Argument(paramTypes[i], function, i, paramNames[i]);
+    auto arg = new Argument(adjustedParamTypes[i], function, i, paramNames[i]);
    auto alloca = pBuilder->createAllocaInst(
-        Type::getPointerType(paramTypes[i]), paramNames[i]);
+        Type::getPointerType(adjustedParamTypes[i]), paramNames[i]);
    function->insertArgument(arg);
    auto store = pBuilder->createStoreInst(arg, alloca);
    pModule->addVariable(paramNames[i], alloca);