numpy换为torch；修复torch后端计算方式不支持的问题，加速svd；发现并行化err，尝试修复；当前加速比11x,但是最新的并行方式不稳定，可能有精度问题

2026-05-10 22:33:46 +08:00
parent fea8e5abc0
commit aa122964b4
4 changed files with 638 additions and 58 deletions
--- a/baseline_mps_expectation.py
+++ b/baseline_mps_expectation.py
@@ -1,18 +1,17 @@
 """Baseline MPS expectation scan with the qmatchatea backend."""

 import argparse
+import json
 import logging
 import math
 import time

+import numpy as np
 from qibo import Circuit, gates, hamiltonians
 from qibo.symbols import X, Z

 from qibotn.backends.qmatchatea import QMatchaTeaBackend
-
-
-def parse_bonds(value):
-    return [int(item) for item in value.split(",") if item.strip()]
+from qibotn.backends.vidal_tebd import run_vidal_ring_xz


 def build_circuit(nqubits, nlayers, seed):
@@ -33,9 +32,8 @@ def build_circuit(nqubits, nlayers, seed):

 def build_observable(nqubits):
    form = 0
-    for qubit in range(nqubits - 1):
-        form += 0.5 * Z(qubit) * Z(qubit + 1)
-    form += 0.25 * X(0)
+    for qubit in range(nqubits):
+        form += 0.5 * X(qubit) * Z((qubit + 1) % nqubits)
    return hamiltonians.SymbolicHamiltonian(form=form)


@@ -43,86 +41,123 @@ def exact_expectation(circuit, nqubits):
    import numpy as np

    state = circuit().state(numpy=True).reshape(-1)
-    probabilities = np.abs(state) ** 2
-    indices = np.arange(state.size)

    value = 0.0
-    for qubit in range(nqubits - 1):
-        left = (indices >> (nqubits - 1 - qubit)) & 1
-        right = (indices >> (nqubits - 2 - qubit)) & 1
-        value += 0.5 * np.sum(probabilities * (1 - 2 * left) * (1 - 2 * right))
-
-    flip_q0 = 1 << (nqubits - 1)
-    value += 0.25 * np.vdot(state[indices ^ flip_q0], state).real
+    chunk_size = 1 << 20
+    for qubit in range(nqubits):
+        next_qubit = (qubit + 1) % nqubits
+        x_flip = 1 << (nqubits - 1 - qubit)
+        z_shift = nqubits - 1 - next_qubit
+        term = 0.0
+        for start in range(0, state.size, chunk_size):
+            stop = min(start + chunk_size, state.size)
+            indices = np.arange(start, stop, dtype=np.int64)
+            z_bit = (indices >> z_shift) & 1
+            z_phase = 1 - 2 * z_bit
+            term += np.vdot(state[indices ^ x_flip], z_phase * state[start:stop]).real
+        value += 0.5 * term
    return float(value)


 def main():
    parser = argparse.ArgumentParser()
-    parser.add_argument("--nqubits", type=int, default=20)
-    parser.add_argument("--nlayers", type=int, default=8)
-    parser.add_argument("--bonds", type=parse_bonds, default=parse_bonds("2,4,8,16,32"))
+    parser.add_argument("--nqubits", type=int, default=40)
+    parser.add_argument("--nlayers", type=int, default=30)
+    parser.add_argument("--bond", "--bonds", dest="bond", type=int, default=512)
    parser.add_argument("--seed", type=int, default=42)
-    parser.add_argument("--cut-ratio", type=float, default=1e-12)
-    parser.add_argument("--svd-control", default="V")
-    parser.add_argument("--tensor-module", choices=("numpy", "torch"), default="numpy")
-    parser.add_argument("--torch-threads", type=int)
+    parser.add_argument("--tensor-module", choices=("numpy", "torch"), default="torch")
+    parser.add_argument("--torch-threads", type=int, default=32)
+    parser.add_argument(
+        "--executor", choices=("qmatchatea", "vidal"), default="qmatchatea"
+    )
+    parser.add_argument("--vidal-workers", type=int, default=1)
+    parser.add_argument("--vidal-batched", action="store_true")
+    parser.add_argument("--mpi-ct", action="store_true")
+    parser.add_argument("--mpi-barriers", type=int, default=-1)
+    parser.add_argument("--mpi-isometrization", type=int, default=-1)
    parser.add_argument("--exact", action="store_true")
    parser.add_argument("--exact-max-qubits", type=int, default=24)
-    parser.add_argument("--preprocess", action="store_true")
-    parser.add_argument("--compile-circuit", action="store_true")
-    parser.add_argument("--track-memory", action="store_true")
+    parser.add_argument("--reference-file")
    args = parser.parse_args()
    logging.getLogger("qibo.config").setLevel(logging.ERROR)
    logging.getLogger("qtealeaves").setLevel(logging.ERROR)
-    if args.torch_threads is not None:
-        import torch
+    import torch

-        torch.set_num_threads(args.torch_threads)
+    torch.set_num_threads(args.torch_threads)
+    rank = 0
+    size = 1
+    if args.mpi_ct:
+        from mpi4py import MPI
+
+        rank = MPI.COMM_WORLD.Get_rank()
+        size = MPI.COMM_WORLD.Get_size()

    circuit = build_circuit(args.nqubits, args.nlayers, args.seed)
    observable = build_observable(args.nqubits)
    exact = None
-    if args.exact:
+    if args.reference_file:
+        with open(args.reference_file, "r", encoding="utf-8") as f:
+            exact = float(json.load(f)["expectation"])
+    elif args.exact:
        if args.nqubits > args.exact_max_qubits:
            raise ValueError(
                f"--exact is limited to {args.exact_max_qubits} qubits by default."
            )
        exact = exact_expectation(circuit, args.nqubits)

-    print(
-        f"nqubits={args.nqubits} nlayers={args.nlayers} "
-        f"seed={args.seed} preprocess={args.preprocess} "
-        f"tensor_module={args.tensor_module}"
-    )
-    if exact is not None:
-        print(f"exact={exact:.16e}")
-    print("bond_dim expval abs_error rel_error seconds")
+    if rank == 0:
+        mpi_label = f"MPIMPS/{size}" if args.mpi_ct else "SR"
+        print(
+            f"nqubits={args.nqubits} nlayers={args.nlayers} "
+            f"bond={args.bond} seed={args.seed} "
+            f"tensor_module={args.tensor_module} svd_control=E! "
+            f"compile_circuit=True mpi={mpi_label} executor={args.executor} "
+            f"vidal_workers={args.vidal_workers} vidal_batched={args.vidal_batched}"
+        )
+        if exact is not None:
+            print(f"exact={exact:.16e}")
+        print("expval abs_error rel_error seconds")

-    backend = QMatchaTeaBackend()
-    for bond in args.bonds:
+    start = time.perf_counter()
+    if args.executor == "vidal":
+        if args.mpi_ct:
+            raise ValueError("--executor vidal is a single-process executor.")
+        value = run_vidal_ring_xz(
+            circuit,
+            max_bond=args.bond,
+            cut_ratio=1e-12,
+            tensor_module=args.tensor_module,
+            workers=args.vidal_workers,
+            use_batched=args.vidal_batched,
+        )
+    else:
+        backend = QMatchaTeaBackend()
        backend.configure_tn_simulation(
            ansatz="MPS",
-            max_bond_dimension=bond,
-            cut_ratio=args.cut_ratio,
-            svd_control=args.svd_control,
+            max_bond_dimension=args.bond,
+            cut_ratio=1e-12,
+            svd_control="E!",
            tensor_module=args.tensor_module,
-            compile_circuit=args.compile_circuit,
-            track_memory=args.track_memory,
+            compile_circuit=True,
+            track_memory=False,
+            mpi_approach="CT" if args.mpi_ct else "SR",
+            mpi_num_procs=size,
+            mpi_where_barriers=args.mpi_barriers if args.mpi_ct else -1,
+            mpi_isometrization=args.mpi_isometrization,
        )
-        start = time.perf_counter()
-        value = float(
-            backend.expectation(
-                circuit,
-                observable,
-                preprocess=args.preprocess,
-                compile_circuit=args.compile_circuit,
-            ).real
+        value = backend.expectation(
+            circuit,
+            observable,
+            preprocess=False,
+            compile_circuit=True,
        )
-        elapsed = time.perf_counter() - start
-        abs_error = float("nan") if exact is None else abs(value - exact)
-        rel_error = float("nan") if exact is None else abs_error / max(abs(exact), 1e-15)
-        print(f"{bond:d} {value:.16e} {abs_error:.6e} {rel_error:.6e} {elapsed:.3f}")
+    if rank != 0:
+        return
+    value = float(np.real(value))
+    elapsed = time.perf_counter() - start
+    abs_error = float("nan") if exact is None else abs(value - exact)
+    rel_error = float("nan") if exact is None else abs_error / max(abs(exact), 1e-15)
+    print(f"{value:.16e} {abs_error:.6e} {rel_error:.6e} {elapsed:.3f}")


 if __name__ == "__main__":