reasoning-gym

mirror of https://github.com/open-thought/reasoning-gym.git synced 2026-04-19 12:58:07 +00:00

Author	SHA1	Message	Date
Andreas Köpf	d6f399b8e4	Add eval configs, small fixes to eval script & rush-hour score_answer	2025-03-16 09:18:05 +01:00
Andreas Köpf	bfa5f8078b	Eval N completions per prompt (#374 ) * feat: Add support for generating multiple completions per prompt * feat: Track best and mean scores for multiple completions per prompt * feat: Add checkpoint and resume functionality to evaluation script	2025-03-15 16:39:36 +01:00
Andreas Koepf	4109b5b72c	update eval yaml config files	2025-03-10 00:48:32 +01:00
Andreas Köpf	5b8d1b5175	Generate eval config tool (#240 ) * feat: Add generate_config.py script to create eval configurations	2025-02-27 21:40:53 +01:00