Power Function (#102)

* power function dataset + tests
2026-04-19 12:58:07 +00:00 · 2025-02-10 22:04:58 +01:00 · 2025-02-10 22:04:58 +01:00 · a8c39ddcfb
commit a8c39ddcfb
parent bea9e6d96a
3 changed files with 141 additions and 0 deletions
--- a/reasoning_gym/arithmetic/init.py
+++ b/reasoning_gym/arithmetic/init.py
@ -10,6 +10,7 @@ from .gcd import GCDConfig, GCDDataset
 from .gsm_symbolic.gsm_symbolic import GSMSymbolicDataset, GSMSymbolicDatasetConfig
 from .lcm import LCMConfig, LCMDataset
 from .leg_counting import LegCountingConfig, LegCountingDataset
 from .power_function import PowerFunctionConfig, PowerFunctionDataset
 from .prime_factorization import PrimeFactorizationConfig, PrimeFactorizationDataset
 from .time_intervals import TimeIntervalsConfig, TimeIntervalsDataset
--- a/reasoning_gym/arithmetic/power_function.py
+++ b/reasoning_gym/arithmetic/power_function.py
@ -0,0 +1,62 @@
 """Computhe the power of a number."""
 from dataclasses import dataclass
 from math import pow
 from random import Random
 from typing import Dict, Optional
 from ..factory import ProceduralDataset, register_dataset
 QUESTION_TEMPLATE = """Compute {base}^{exponent}"""
@dataclass
 class PowerFunctionConfig:
    """Configuration for Power Function dataset generation"""
    min_base: float = -(10**6)  # Minimum base value
    max_base: float = 10**6  # Maximum base value
    min_exponent: int = -50  # Minimum exponent value
    max_exponent: int = 50  # Maximum exponent value
    size: int = 500  # Virtual dataset size
    seed: Optional[int] = None
 class PowerFunctionDataset(ProceduralDataset):
    """Generates Power Function exercises with configurable difficulty"""
    def __init__(self, config: PowerFunctionConfig):
        super().__init__(config=config, seed=config.seed, size=config.size)
    def score_answer(self, answer: Optional[str], entry: Dict[str, any]) -> float:
        """Overwrite this method in derived classes if a single oracle answer is not available."""
        oracle_answer = entry["answer"]
        reward = 0.0
        if answer is not None:
            difference = abs(float(answer) - float(oracle_answer))
            if difference < 1e-6:
                reward = 1.0
            elif difference < 1e-1:
                reward = 0.5
            else:
                reward = 0.01
        return reward
    def __getitem__(self, idx: int) -> dict:
        """Generate a single Power Function question"""
        rng = Random(self.seed + idx)
        base = rng.uniform(self.config.min_base, self.config.max_base)
        exponent = rng.randint(self.config.min_exponent, self.config.max_exponent)
        answer = pow(base, exponent)
        return {
            "question": f"Compute {base}^{exponent}",
            "answer": str(answer),
            "metadata": {"base": base, "exponent": exponent, "solution": answer},
        }
 register_dataset("power_function", PowerFunctionDataset, PowerFunctionConfig)
--- a/tests/test_power_function.py
+++ b/tests/test_power_function.py
@ -0,0 +1,78 @@
 """Tests for Power Function questions generation"""
 import pytest
 from reasoning_gym.arithmetic import PowerFunctionConfig, PowerFunctionDataset
 def test_power_function_dataset_deterministic():
    """Test that dataset generates same items with same seed"""
    config = PowerFunctionConfig(seed=42, size=10)
    dataset1 = PowerFunctionDataset(config)
    dataset2 = PowerFunctionDataset(config)
    for i in range(len(dataset1)):
        assert dataset1[i] == dataset2[i]
 def test_power_function_dataset_items():
    """Test basic properties of generated items"""
    config = PowerFunctionConfig(min_base=-100, max_base=-100, min_exponent=-10, max_exponent=10, size=10, seed=42)
    dataset = PowerFunctionDataset(config)
    for i in range(len(dataset)):
        item = dataset[i]
        # Check item structure
        assert isinstance(item, dict)
        assert "question" in item
        assert "answer" in item
        assert "metadata" in item
        # Check metadata
        assert "base" in item["metadata"]
        assert "exponent" in item["metadata"]
        base = item["metadata"]["base"]
        exponent = item["metadata"]["exponent"]
        solution = item["metadata"]["solution"]
        # Verify values
        assert config.min_base <= base <= config.max_base
        assert config.min_exponent <= exponent <= config.max_exponent
        assert solution == pow(base, exponent)
 def test_power_function_dataset_iteration():
    """Test that iteration respects dataset size"""
    config = PowerFunctionConfig(size=5, seed=42)
    dataset = PowerFunctionDataset(config)
    items = list(dataset)
    assert len(items) == config.size
    # Test multiple iterations yield same items
    assert items == list(dataset)
 def test_power_function_score_function():
    """Test score function"""
    config = PowerFunctionConfig(seed=42)
    dataset = PowerFunctionDataset(config)
    item = dataset[0]
    # Answer is within 1e-6 of solution
    answer = str(item["metadata"]["solution"] - 1e-7)
    assert dataset.score_answer(answer, item) == 1.0
    # Answer is within 1e-1 of solution
    answer = str(item["metadata"]["solution"] - 1e-2)
    assert dataset.score_answer(answer, item) == 0.5
    # Answer is far from solution
    answer = str(item["metadata"]["solution"] - 1)
    assert dataset.score_answer(answer, item) == 0.01
    # Answer is None
    answer = None
    assert dataset.score_answer(answer, item) == 0.0