donkeycar-rl-autoresearch

History

Paul Huliganga 0da04327ef docs: capture robust mountain finetune winner at 36k and preserve eval comparison		2026-04-20 00:43:27 -04:00
..
ARCHIVED_reward_hacking/champion_hacked	fix: hack-proof reward shaping + reward hacking detection + research log	2026-04-13 12:27:48 -04:00
champion	feat: Phase 3 — behavioral control, enhanced evaluator, 53 tests	2026-04-14 09:28:43 -04:00
exp14-mountain-v5-finetune	docs: capture robust mountain finetune winner at 36k and preserve eval comparison	2026-04-20 00:43:27 -04:00
wave3-champion	wave3: autoresearch trial 5 results	2026-04-14 18:22:44 -04:00
wave4-champion	wave3: autoresearch trial 5 results	2026-04-15 07:15:57 -04:00