test: Add unit test for ReseedingDataset class

2026-04-19 12:58:07 +00:00 · 2025-01-30 22:05:47 +01:00 · 2025-01-30 22:05:47 +01:00 · 2ec8a1bcbb
commit 2ec8a1bcbb
parent e2d3f4b4e6
1 changed files with 47 additions and 0 deletions
--- a/tests/test_dataset.py
+++ b/tests/test_dataset.py
@ -0,0 +1,47 @@
+import pytest
+
+from reasoning_gym.dataset import ReseedingDataset
+from reasoning_gym.arithmetic.basic_arithmetic import BasicArithmeticDataset, BasicArithmeticDatasetConfig
+
+
+def test_reseeding_dataset_iteration():
+    """Test that ReseedingDataset provides infinite iteration with consistent chunks"""
+    
+    # Create base dataset
+    config = BasicArithmeticDatasetConfig(
+        min_terms=2,
+        max_terms=3,
+        min_digits=1,
+        max_digits=2,
+        operators=["+"],
+        allow_parentheses=False,
+        seed=42,
+        size=10
+    )
+    base_dataset = BasicArithmeticDataset(config)
+    
+    # Create reseeding dataset with small chunk size
+    chunk_size = 3
+    infinite_dataset = ReseedingDataset(base_dataset, chunk_size=chunk_size)
+    
+    # Get first 10 items
+    first_items = []
+    for _, item in zip(range(10), infinite_dataset):
+        first_items.append(item["question"])
+    
+    # Create new iterator and verify first 10 items are identical
+    second_items = []
+    for _, item in zip(range(10), infinite_dataset):
+        second_items.append(item["question"])
+    
+    assert first_items == second_items, "Items should be deterministic across iterations"
+    
+    # Verify chunks are different
+    chunk1 = first_items[:chunk_size]
+    chunk2 = first_items[chunk_size:2*chunk_size]
+    assert chunk1 != chunk2, "Different chunks should generate different items"
+    
+    # Test score_answer forwarding
+    test_item = next(iter(infinite_dataset))
+    assert infinite_dataset.score_answer("wrong", test_item) == 0.01
+    assert infinite_dataset.score_answer(test_item["answer"], test_item) == 1.0