Add jugs curriculum (#369)

2026-04-22 16:49:06 +00:00 · 2025-03-14 12:04:33 -05:00 · 2025-03-14 12:04:33 -05:00 · 8a0cacc054
commit 8a0cacc054
parent 8c12fe86e2
3 changed files with 87 additions and 4 deletions
--- a/reasoning_gym/algorithmic/init.py
+++ b/reasoning_gym/algorithmic/init.py
@ -18,7 +18,7 @@ from .game_of_life_halting import GameOfLifeHaltingConfig, GameOfLifeHaltingData
 from .graph_color import GraphColorConfig, GraphColorCurriculum, GraphColorDataset
 from .group_anagrams import GroupAnagramsConfig, GroupAnagramsCurriculum, GroupAnagramsDataset
 from .isomorphic_strings import IsomorphicStringsConfig, IsomorphicStringsCurriculum, IsomorphicStringsDataset
-from .jugs import JugsConfig, JugsDataset
+from .jugs import JugsConfig, JugsCurriculum, JugsDataset
 from .letter_counting import LetterCountingConfig, LetterCountingCurriculum, LetterCountingDataset
 from .letter_jumble import LetterJumbleConfig, LetterJumbleCurriculum, LetterJumbleDataset
 from .manipulate_matrix import ManipulateMatrixConfig, ManipulateMatrixCurriculum, ManipulateMatrixDataset
@ -148,6 +148,7 @@ __all__ = [
    "RottenOrangesCurriculum",
    "JugsConfig",
    "JugsDataset",
+    "JugsCurriculum",
    "BinaryAlternationConfig",
    "BinaryAlternationDataset",
    "BinaryAlternationCurriculum",
--- a/reasoning_gym/algorithmic/jugs.py
+++ b/reasoning_gym/algorithmic/jugs.py
@ -6,6 +6,7 @@ from functools import reduce
 from random import Random
 from typing import Any, Optional

+from ..coaching import AttributeType, BaseCurriculum, ScalarAttributeDefinition
 from ..factory import ProceduralDataset, register_dataset


@ -280,7 +281,13 @@ Reply as a JSON-parsable list of moves which result in any of the jugs being fil
        return {
            "question": question,
            "answer": json.dumps(solution),  # one possible solution
-            "metadata": {"puzzle": puzzle},
+            "metadata": {
+                "puzzle": puzzle,
+                "difficulty": {
+                    "num_jugs": self.config.num_jugs,
+                    "difficulty": self.config.difficulty,
+                },
+            },
        }

    def score_answer(self, answer: Optional[str], entry: dict[str, Any]) -> float:
@ -310,4 +317,33 @@ Reply as a JSON-parsable list of moves which result in any of the jugs being fil
            return 0.0


-register_dataset("jugs", JugsDataset, JugsConfig)
+class JugsCurriculum(BaseCurriculum):
+    """Curriculum for Jugs puzzles"""
+
+    def __init__(self):
+        super().__init__(JugsCurriculum.__name__, JugsConfig)
+
+        # Define attributes
+        self._define_attributes(
+            ScalarAttributeDefinition(
+                name="num_jugs",
+                field_name="num_jugs",
+                levels=[3, 4, 5, 7],
+                default_level=0,
+                description="Number of jugs in the puzzle",
+                attr_type=AttributeType.STATIC,
+                min_value=3,
+            ),
+            ScalarAttributeDefinition(
+                name="difficulty",
+                field_name="difficulty",
+                levels=[2, 4, 6, 8],
+                default_level=0,
+                description="Minimum required moves to solve the puzzle",
+                attr_type=AttributeType.STATIC,
+                min_value=10,
+            ),
+        )
+
+
+register_dataset("jugs", JugsDataset, JugsConfig, JugsCurriculum)