|
|
ef56e5dcdb
|
Revert "tensorRT engines尝试精度没过,暂时先提交代码,后续再继续调试"
This reverts commit e1f8a83648.
|
2026-02-19 20:22:19 +08:00 |
|
|
|
e1f8a83648
|
tensorRT engines尝试精度没过,暂时先提交代码,后续再继续调试
|
2026-02-18 18:22:12 +08:00 |
|
|
|
5e0e21d91b
|
复原sh为原始版本
|
2026-02-18 14:11:55 +08:00 |
|
|
|
508b91f5a2
|
延迟 decode,只解码 CLIP 需要的 1 帧
- world model 调用 decode_video=False,跳过 16 帧全量 decode
- 只 decode 最后 1 帧给 CLIP embedding / observation queue
- 存 raw latent,循环结束后统一 batch decode 生成最终视频
- 每轮省 15 次 VAE decode,8 轮共省 120 次
- 跳过中间迭代的 wm tensorboard/mp4 保存
psnr微弱下降
|
2026-02-11 17:07:33 +08:00 |
|
|
|
3101252c25
|
速度变化不明显psnr显著提升
|
2026-02-11 16:38:21 +08:00 |
|
|
|
f386a5810b
|
补充上次提交
|
2026-02-11 16:24:40 +08:00 |
|
|
|
352a79035f
|
主干部分fp16,最敏感psnr=25.21,可以考虑对主干部分太敏感的部分回退fp32
|
2026-02-11 16:23:21 +08:00 |
|
|
|
9a08e27a19
|
KV 融合实现完成。改动总结: 速度微弱提升psnr略微上升
attention.py — 3处改动:
1. __init__ 添加 _kv_fused = False 标志
2.新增 fuse_kv() 方法:将 to_k + to_v → to_kv,同时处理 _ip/_as/_aa 辅助 KV 对
2. bmm_forward 两个分支加_kv_fused 判断,用to_kv().chunk(2, dim=-1) 替代分别调用
|
2026-02-11 12:36:38 +08:00 |
|
|
|
afa12ba031
|
每步迭代保存异步
|
2026-02-10 19:54:53 +08:00 |
|
|
|
bf4d66c874
|
跳过模型加载
|
2026-02-10 19:36:17 +08:00 |
|
|
|
2a6068f9e4
|
减少了一路视频vae解码
|
2026-02-10 17:13:45 +08:00 |
|
|
|
ed637c972b
|
tf32推理
|
2026-02-10 16:39:14 +08:00 |
|
yuchen-x
|
d7be60f9fe
|
init commit
|
2025-09-12 21:53:41 +08:00 |
|