- action_unet 在默认 stream 上同时执行 - 用 wait_stream 确保两者都完成后再返回 两个 1D UNet 输入完全独立,共享的 hs_a 和 context_action 都是只读的。GPU 利用率只有 ~31%,小张量 kernel 不会打满 GPU,两个 stream 可以真正并行。
16 lines
319 B
JSON
16 lines
319 B
JSON
{
|
|
"permissions": {
|
|
"allow": [
|
|
"Bash(conda env list:*)",
|
|
"Bash(mamba env:*)",
|
|
"Bash(micromamba env list:*)",
|
|
"Bash(echo:*)",
|
|
"Bash(git show:*)",
|
|
"Bash(nvidia-smi:*)",
|
|
"Bash(conda activate unifolm-wma)",
|
|
"Bash(conda info:*)",
|
|
"Bash(direnv allow:*)"
|
|
]
|
|
}
|
|
}
|