updated configs

2026-04-29 17:35:16 +00:00 · 2025-03-28 00:05:58 +00:00 · 2025-03-28 00:05:58 +00:00 · 7368d6d313
commit 7368d6d313
parent cc0bacd8e1
8 changed files with 158 additions and 315 deletions
--- a/reasoning_gym/algorithmic/spell_backward.py
+++ b/reasoning_gym/algorithmic/spell_backward.py
@ -19,6 +19,7 @@ class SpellBackwardConfig:
    min_word_len: int = 3  # Minimum word length
    max_word_len: int = 10  # Maximum word length
    seed: Optional[int] = None
+    data_file: str = "words3to10.txt"
    size: int = 500  # Virtual dataset size

    def validate(self) -> None:
@ -34,7 +35,7 @@ class SpellBackwardDataset(ProceduralDataset):
        super().__init__(config=config, seed=config.seed, size=config.size)

        # Load and preprocess text
-        text = read_data_file("words3to10.txt")
+        text = read_data_file(self.config.data_file)
        self.words = [
            word.strip()
            for word in text.splitlines()
@ -73,9 +74,9 @@ class SpellBackwardDataset(ProceduralDataset):
                if expected_answer == answer:
                    reward = 1.0
                else:
-                    answer_len = len(answer)
+                    answer_len = len(expected_answer)
                    for i in range(len(expected_answer)):
-                        if (i < len(expected_answer) and i < len(answer)) and expected_answer[i] == answer[i]:
+                        if i < len(expected_answer) and i < len(answer):
                            if expected_answer[i] == answer[i]:
                                reward += 1 / answer_len
                            else:
@ -96,7 +97,7 @@ class SpellBackwardCurriculum(BaseCurriculum):
        self._define_attributes(
            RangeAttributeDefinition(
                name="word_len",
-                levels=list(range(3, 11)),
+                levels=list(range(3, 10, 1)),
                description="Word length",
                lower_field_name="min_word_len",
                upper_field_name="max_word_len",