From dc563e2b6c4c258d12703f685d2a36e4611758a2 Mon Sep 17 00:00:00 2001
From: Paul Huliganga <paje0101@gmail.com>
Date: Sun, 19 Apr 2026 16:18:17 -0400
Subject: [PATCH] =?UTF-8?q?fix:=20exp11d=20remove=20progress=5Fpatience=20?=
 =?UTF-8?q?=E2=80=94=20grass=20fix=20only=20per=20ADR-020?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 agent/experiments/exp11d_parallel_v61.py | 9 +++------
 1 file changed, 3 insertions(+), 6 deletions(-)

diff --git a/agent/experiments/exp11d_parallel_v61.py b/agent/experiments/exp11d_parallel_v61.py
index dacb2b5..b41d5c1 100644
--- a/agent/experiments/exp11d_parallel_v61.py
+++ b/agent/experiments/exp11d_parallel_v61.py
@@ -43,7 +43,6 @@ def make_env(track_id, port):
         env = SpeedRewardWrapper(env,
             max_cte_terminate=4.0,   # terminate if CTE > 4m for 20 steps (grass fix)
             cte_patience=20,
-            progress_patience=60,    # terminate if no node advance for 60 steps (rollback fix)
         )
         return env
     return _init
@@ -53,9 +52,8 @@ log('Exp 11d: Parallel DummyVecEnv, v6.1 reward, 180k steps')
 log(f'  Sim 1: {HOST}:9091 → generated_track')
 log(f'  Sim 2: {HOST}:9093 → mountain_track')
 log(f'  throttle_min={THROTTLE_MIN}, lr={LR}, total={TOTAL_STEPS:,}')
-log(f'  Reward v6.1: speed×CTE + efficiency gate + grass/rollback terminators')
-log(f'    max_cte_terminate=4.0, cte_patience=20 (grass fix)')
-log(f'    progress_patience=60 (mountain rollback fix)')
+log(f'  Reward v6.1: speed×CTE + efficiency gate + grass exploit terminator')
+log(f'    max_cte_terminate=4.0, cte_patience=20 (grass fix only)')
 log(f'  Stuck: 40 steps')
 log('='*60)
 
@@ -141,8 +139,7 @@ for track_id, track_name in EVAL_TRACKS:
             raw = gym.make(track_id, conf={'host': HOST, 'port': EVAL_PORT})
             ei = ThrottleClampWrapper(raw, throttle_min=THROTTLE_MIN)
             ei = StuckTerminationWrapper(ei, stuck_steps=40, min_displacement=0.5)
-            ei = SpeedRewardWrapper(ei, max_cte_terminate=4.0, cte_patience=20,
-                                    progress_patience=60)
+            ei = SpeedRewardWrapper(ei, max_cte_terminate=4.0, cte_patience=20)
             ev = VecTransposeImage(DummyVecEnv([lambda e=ei: e]))
             m = PPO.load(best_model_path, env=ev, device='cpu')