include ranges rather than sampled values in difficulty metadata dicts (#387)

* update difficulty metadata for logic datasets * update difficulty metadata for graph datasets * update difficulty metadata for geometry datasets * update difficulty metadata for games datasets * update difficulty metadata for cognition datasets * update difficulty metadata for arithmetic datasets * update difficulty metadata for arc datasets * update difficulty metadata for algorithmic datasets * update difficulty metadata for algebra datasets * use tuples * update tests * update tests
2026-04-19 12:58:07 +00:00 · 2025-03-20 09:27:03 +00:00 · 2025-03-20 09:27:03 +00:00 · 7475a20700
commit 7475a20700
parent b69c35818a
80 changed files with 304 additions and 126 deletions
--- a/reasoning_gym/logic/circuit_logic.py
+++ b/reasoning_gym/logic/circuit_logic.py
@ -387,7 +387,7 @@ class CircuitLogicDataset(ProceduralDataset):
                "final_gate": final_gate_name,
                "inputs": inputs_list,
                "difficulty": {
-                    "terms": num_terms,
+                    "terms": (self.config.min_terms, self.config.max_terms),
                    "inputs": (self.config.min_inputs, self.config.max_inputs),
                },
            },
--- a/reasoning_gym/logic/propositional_logic.py
+++ b/reasoning_gym/logic/propositional_logic.py
@ -221,8 +221,8 @@ class PropositionalLogicDataset(ProceduralDataset):
                "complexity": self._measure_complexity(conclusion),
                "example_answer": str(conclusion),
                "difficulty": {
-                    "vars": num_vars,
-                    "statements": num_statements,
+                    "vars": (self.config.min_vars, self.config.max_vars),
+                    "statements": (self.config.min_statements, self.config.max_statements),
                    "complexity": (self.config.min_complexity, self.config.max_complexity),
                },
            },
--- a/reasoning_gym/logic/self_reference.py
+++ b/reasoning_gym/logic/self_reference.py
@ -346,7 +346,9 @@ class SelfReferenceDataset(ProceduralDataset):
        return {
            "question": puzz_s,
            "answer": answer,
-            "metadata": {"difficulty": difficulty},
+            "metadata": {
+                "difficulty": {"difficulty": difficulty},
+            },
        }

    def score_answer(self, answer: Optional[str], entry: dict[str, Any]) -> float: