fix(envs): Add source dataset and index to metadata (#388)

* add source dataset and index to metadata * fix typo * fix coach class and its test
2026-04-25 17:10:51 +00:00 · 2025-03-20 12:12:14 +01:00 · 2025-03-20 12:12:14 +01:00 · ce0a6c4878
commit ce0a6c4878
parent 7475a20700
104 changed files with 549 additions and 146 deletions
--- a/reasoning_gym/algorithmic/sentence_reordering.py
+++ b/reasoning_gym/algorithmic/sentence_reordering.py
@ -9,6 +9,8 @@ from ..coaching import BaseCurriculum, RangeAttributeDefinition
 from ..data import read_data_file
 from ..factory import ProceduralDataset, register_dataset

+DATASET_NAME = "sentence_reordering"
+

@dataclass
 class SentenceReorderingConfig:
@ -91,6 +93,8 @@ class SentenceReorderingDataset(ProceduralDataset):
            "question": f"Restore the correct order of words in the following sentence: {question}",
            "answer": solved_sentence,
            "metadata": {
+                "source_dataset": DATASET_NAME,
+                "source_index": idx,
                "word_count": word_count,
                "difficulty": {
                    "words_in_sentence": (self.config.min_words_in_sentence, self.config.max_words_in_sentence),
@ -137,6 +141,4 @@ class SentenceReorderingCurriculum(BaseCurriculum):
        )


-register_dataset(
-    "sentence_reordering", SentenceReorderingDataset, SentenceReorderingConfig, SentenceReorderingCurriculum
-)
+register_dataset(DATASET_NAME, SentenceReorderingDataset, SentenceReorderingConfig, SentenceReorderingCurriculum)