qihuanye
|
25e4ddb628
|
继续做了通用性能优化,重点从 jepa.py 热路径转到实际的 stable_worldmodel
solver/policy 边界:去掉 CEM 每轮 cpu().tolist() 和结果过早回 CPU,把
plan/warm-start 保持在 GPU,只在 env.step 前最后一步转成 numpy,同时补
了输入张量的 contiguous 处理;
|
2026-04-09 12:33:50 +00:00 |
|
qihuanye
|
995cd8cfec
|
优化 jepa.py 中通用 rollout 热路径:批量预编码动
作、移除循环内
torch.cat,并为 history_size==1 与环形缓冲区更新
添加更轻量实现; 收益不大
|
2026-04-09 11:57:09 +00:00 |
|
qihuanye
|
006102d00c
|
减少循环里的张量形状重排和临时对象
|
2026-04-09 11:11:07 +00:00 |
|
qihuanye
|
fa1c15c896
|
Optimize JEPA eval outputs and inference hot path
|
2026-04-08 12:41:21 +00:00 |
|
qihuanye
|
8b84251eb9
|
add profile frame and bf15/fp16 switch
|
2026-03-31 11:09:02 +00:00 |
|
Lucas Maes
|
83f97d72ad
|
Initial commit
|
2026-03-23 14:22:26 +01:00 |
|