use get_data_file_path to read file contents

2026-04-19 12:58:07 +00:00 · 2025-02-06 10:12:51 +01:00 · 2025-02-06 10:12:51 +01:00 · 256eb71555
commit 256eb71555
parent 6ec6876221
1 changed files with 13 additions and 9 deletions
--- a/reasoning_gym/algorithmic/group_anagrams.py
+++ b/reasoning_gym/algorithmic/group_anagrams.py
@ -12,6 +12,7 @@ from dataclasses import dataclass
 from random import Random
 from typing import Dict, Optional
 from ..data import get_data_file_path
 from ..factory import ProceduralDataset, register_dataset
 MAX_ANAGRAM_GROUPS = 500
@ -55,7 +56,7 @@ class GroupAnagramsDataset(ProceduralDataset):
    def __init__(self, config: GroupAnagramsConfig):
        super().__init__(config=config, seed=config.seed, size=config.size)
-        with open("reasoning_gym/data/anagrams.jsonl") as f:
+        with get_data_file_path("anagrams.jsonl").open() as f:
            self.anagrams = [json.loads(line)["words"] for line in f]
    def __len__(self) -> int:
@ -105,14 +106,17 @@ class GroupAnagramsDataset(ProceduralDataset):
        """Score a single Group Anagrams question"""
        reward = 0
        if answer is not None:
-            answer = json.loads(answer)
+            try:
-            oracle = entry["metadata"]["solution"]
+                answer = json.loads(answer)
-            answer_str = json.dumps(self._sort_nested_list(answer))
+                oracle = entry["metadata"]["solution"]
-            oracle_str = json.dumps(self._sort_nested_list(oracle))
+                answer_str = json.dumps(self._sort_nested_list(answer))
-            if answer_str == oracle_str:
+                oracle_str = json.dumps(self._sort_nested_list(oracle))
-                reward = 1
+                if answer_str == oracle_str:
-            else:
+                    reward = 1
-                reward = 0.01
+                else:
                    reward = 0.01
            except Exception:
                reward = 0
        return reward
    def __getitem__(self, idx: int) -> dict: