fix(envs): Add source dataset and index to metadata (#388)

* add source dataset and index to metadata * fix typo * fix coach class and its test
2026-05-02 17:45:58 +00:00 · 2025-03-20 12:12:14 +01:00 · 2025-03-20 12:12:14 +01:00 · 4c47527130
commit 4c47527130
parent c6d01541aa
104 changed files with 549 additions and 146 deletions
--- a/reasoning_gym/algorithmic/letter_jumble.py
+++ b/reasoning_gym/algorithmic/letter_jumble.py
@ -22,6 +22,9 @@ Now, unscramble these words: {words}
 """


+DATASET_NAME = "letter_jumble"
+
+
@dataclass
 class LetterJumbleConfig:
    """Configuration for letter jumbling task generation"""
@ -104,6 +107,8 @@ class LetterJumbleDataset(ProceduralDataset):
            "question": QUESTION_TEMPLATE.format(words=" ".join(scrambled_words)),
            "answer": " ".join(selected_words),
            "metadata": {
+                "source_dataset": DATASET_NAME,
+                "source_index": idx,
                "num_words": num_words,
                "corruption_level": corruption_level,
                "scrambled_words": scrambled_words,
@ -193,4 +198,4 @@ class LetterJumbleCurriculum(BaseCurriculum):
        )


-register_dataset("letter_jumble", LetterJumbleDataset, LetterJumbleConfig, LetterJumbleCurriculum)
+register_dataset(DATASET_NAME, LetterJumbleDataset, LetterJumbleConfig, LetterJumbleCurriculum)