Merge branch 'main' into koko/scramble

2026-04-19 12:58:07 +00:00 · 2025-01-26 15:41:25 +01:00 · 2025-01-26 15:41:25 +01:00 · 684a69603f
commit 684a69603f
parent 03d4a5d8ac 4fdf80e056
6 changed files with 171 additions and 31 deletions
--- a/README.md
+++ b/README.md
@ -4,6 +4,30 @@ We are building a python library of procedural dataset generators and algorithmi

 The goal is to generate virtually infinite data with adjustable complexity.

+### Set up for development
+1. Clone the project
+```
+git clone https://github.com/open-thought/reasoning-gym.git
+```
+2. Create a virtual environment(Here we use conda)
+```
+conda create --name reasoning_gym python=3.12 -y
+conda activate reasoning_gym
+```
+3. Link project and install dependencies
+```
+pip install -e .
+```
+4. Install development dependencies
+```
+pip install -r requirements-dev.txt
+```
+
+>NOTE: To consume the APIs in reasoning_gym, just install from pip using the following
+```
+pip install reasoning-gym
+```
+
 ### How to instantiate a task dataset?

 Example:
@ -35,9 +59,11 @@ Available dataset names (which can be used with `create_dataset()`):
 'base_conversion',
 'caesar_cipher',
 'letter_counting',
+'letter_jumble',
 'number_filtering',
 'number_sorting',
-'word_reversal',
+'spell_backward',
+'word_sequence_reversal',
 'basic_arithmetic',
 'chain_sum',
 'fraction_simplification',
@ -53,7 +79,7 @@ Available dataset names (which can be used with `create_dataset()`):
 'sudoku',
 'family_relationships',
 'propositional_logic',
-'syllogism'
+'syllogism',
 ```

 ### Task Overview
@ -82,7 +108,8 @@ Available dataset names (which can be used with `create_dataset()`):
 - `NumberSortingDataset`: Sort lists of numbers in ascending or descending order
 - `LetterJumbleDataset`: Unscramble words that have had their letters randomly jumbled
 - `SentenceReorderingDataset`: Reorder sentence after words in it have been randomly shuffled
- `WordReversalDataset`: Reverse word order in text spans
+- `SpellBackwardDataset`: Spell individual words backward (e.g. "sun" -> "nus")
+- `WordSequenceReversalDataset`: Reverse word order in text spans

 #### Cognition Tasks

--- a/reasoning_gym/algorithmic/init.py
+++ b/reasoning_gym/algorithmic/init.py
@ -12,10 +12,13 @@ from .letter_counting import LetterCountingConfig, LetterCountingDataset
 from .letter_jumble import LetterJumbleConfig, LetterJumbleDataset
 from .number_filtering import NumberFilteringConfig, NumberFilteringDataset
 from .number_sorting import NumberSortingConfig, NumberSortingDataset
-from .word_reversal import WordReversalConfig, WordReversalDataset
 from .sentence_reordering import SentenceReorderingConfig, SentenceReorderingDataset
+from .spell_backward import SpellBackwardConfig, SpellBackwardDataset
+from .word_sequence_reversal import WordSequenceReversalConfig, WordSequenceReversalDataset

 __all__ = [
+    "SpellBackwardConfig",
+    "SpellBackwardDataset",
    "BaseConversionConfig",
    "BaseConversionDataset",
    "CaesarCipherConfig",
@ -28,8 +31,8 @@ __all__ = [
    "NumberFilteringDataset",
    "NumberSortingConfig",
    "NumberSortingDataset",
-    "WordReversalConfig",
-    "WordReversalDataset",
    "SentenceReorderingConfig",
    "SentenceReorderingDataset",
+    "WordSequenceReversalConfig",
+    "WordSequenceReversalDataset",
 ]
--- a/reasoning_gym/algorithmic/spell_backward.py
+++ b/reasoning_gym/algorithmic/spell_backward.py
@ -0,0 +1,53 @@
+"""Spell backward task generator"""
+
+import re
+from dataclasses import dataclass
+from random import Random
+from typing import Optional
+
+from ..data import read_data_file
+from ..factory import ProceduralDataset, register_dataset
+
+
+@dataclass
+class SpellBackwardConfig:
+    """Configuration for spelling words backward task generation"""
+
+    min_word_len: int = 3  # Minimum word length
+    seed: Optional[int] = None
+    size: int = 500  # Virtual dataset size
+
+    def validate(self) -> None:
+        """Validate configuration parameters"""
+        assert self.min_word_len > 0, "min_word_len must be positive"
+
+
+class SpellBackwardDataset(ProceduralDataset):
+    """Generates tasks to spell words backward"""
+
+    def __init__(self, config: SpellBackwardConfig):
+        super().__init__(config=config, seed=config.seed, size=config.size)
+
+        # Load and preprocess text
+        text = read_data_file("in_the_year_2889.txt")
+        # Extract words and clean them to contain only alphanumeric characters
+        self.words = [
+            word for word in re.findall(r"\b\w+\b", text) if word.isalnum() and len(word) >= config.min_word_len
+        ]
+
+    def __getitem__(self, idx: int) -> dict:
+        """Generate a single spell backward task"""
+        rng = Random(self.seed + idx)
+
+        # Select random word
+        word = rng.choice(self.words)
+        answer = word[::-1]
+
+        return {
+            "question": f"Spell this word backward (example: sun -> nus): {word}",
+            "answer": answer,
+            "metadata": {"word": word, "word_len": len(word)},
+        }
+
+
+register_dataset("spell_backward", SpellBackwardDataset, SpellBackwardConfig)
--- a/reasoning_gym/algorithmic/word_sequence_reversal.py
+++ b/reasoning_gym/algorithmic/word_sequence_reversal.py
@ -10,8 +10,8 @@ from ..factory import ProceduralDataset, register_dataset


@dataclass
-class WordReversalConfig:
-    """Configuration for word reversal task generation"""
+class WordSequenceReversalConfig:
+    """Configuration for word sequence reversal task generation"""

    min_words: int = 3  # Minimum words in list
    max_words: int = 8  # Maximum words in list
@ -24,10 +24,10 @@ class WordReversalConfig:
        assert self.max_words >= self.min_words, "max_words must be >= min_words"


-class WordReversalDataset(ProceduralDataset):
-    """Generates word reversal tasks from text spans"""
+class WordSequenceReversalDataset(ProceduralDataset):
+    """Generates word sequence reversal tasks from text spans"""

-    def __init__(self, config: WordReversalConfig):
+    def __init__(self, config: WordSequenceReversalConfig):
        super().__init__(config=config, seed=config.seed, size=config.size)

        # Load and preprocess text
@ -55,4 +55,4 @@ class WordReversalDataset(ProceduralDataset):
        }


-register_dataset("word_reversal", WordReversalDataset, WordReversalConfig)
+register_dataset("word_sequence_reversal", WordSequenceReversalDataset, WordSequenceReversalConfig)
--- a/tests/test_spell_backward.py
+++ b/tests/test_spell_backward.py
@ -0,0 +1,59 @@
+"""Tests for spell backward task generation"""
+
+import pytest
+
+from reasoning_gym.algorithmic.spell_backward import SpellBackwardConfig, SpellBackwardDataset
+
+
+def test_spell_backward_config_validation():
+    """Test that invalid configs raise appropriate errors"""
+    with pytest.raises(AssertionError):
+        config = SpellBackwardConfig(min_word_len=0)
+        config.validate()
+
+
+def test_spell_backward_dataset_deterministic():
+    """Test that dataset generates same items with same seed"""
+    config = SpellBackwardConfig(seed=42, size=10)
+    dataset1 = SpellBackwardDataset(config)
+    dataset2 = SpellBackwardDataset(config)
+
+    for i in range(len(dataset1)):
+        assert dataset1[i] == dataset2[i]
+
+
+def test_spell_backward_dataset_items():
+    """Test basic properties of generated items"""
+    config = SpellBackwardConfig(min_word_len=3, size=10, seed=42)
+    dataset = SpellBackwardDataset(config)
+
+    for i in range(len(dataset)):
+        item = dataset[i]
+        # Check item structure
+        assert isinstance(item, dict)
+        assert "question" in item
+        assert "answer" in item
+        assert "metadata" in item
+
+        # Check metadata
+        assert "word" in item["metadata"]
+        assert "word_len" in item["metadata"]
+
+        # Verify word length constraint
+        word = item["metadata"]["word"]
+        assert len(word) >= config.min_word_len
+
+        # Verify answer is correct
+        assert item["answer"] == word[::-1]
+
+
+def test_spell_backward_dataset_iteration():
+    """Test that iteration respects dataset size"""
+    config = SpellBackwardConfig(size=5, seed=42)
+    dataset = SpellBackwardDataset(config)
+
+    items = list(dataset)
+    assert len(items) == config.size
+
+    # Test multiple iterations yield same items
+    assert items == list(dataset)
--- a/tests/test_word_sequence_reversal.py
+++ b/tests/test_word_sequence_reversal.py
@ -1,35 +1,33 @@
-"""Tests for word reversal task generation"""
-
 import pytest

-from reasoning_gym.algorithmic.word_reversal import WordReversalConfig, WordReversalDataset
+from reasoning_gym.algorithmic.word_sequence_reversal import WordSequenceReversalConfig, WordSequenceReversalDataset


-def test_word_reversal_config_validation():
+def test_word_sequence_reversal_config_validation():
    """Test that invalid configs raise appropriate errors"""
    with pytest.raises(AssertionError):
-        config = WordReversalConfig(min_words=0)
+        config = WordSequenceReversalConfig(min_words=0)
        config.validate()

    with pytest.raises(AssertionError):
-        config = WordReversalConfig(min_words=10, max_words=5)
+        config = WordSequenceReversalConfig(min_words=10, max_words=5)
        config.validate()


-def test_word_reversal_dataset_deterministic():
+def test_word_sequence_reversal_dataset_deterministic():
    """Test that dataset generates same items with same seed"""
-    config = WordReversalConfig(seed=42, size=10)
-    dataset1 = WordReversalDataset(config)
-    dataset2 = WordReversalDataset(config)
+    config = WordSequenceReversalConfig(seed=42, size=10)
+    dataset1 = WordSequenceReversalDataset(config)
+    dataset2 = WordSequenceReversalDataset(config)

    for i in range(len(dataset1)):
        assert dataset1[i] == dataset2[i]


-def test_word_reversal_dataset_items():
+def test_word_sequence_reversal_dataset_items():
    """Test basic properties of generated items"""
-    config = WordReversalConfig(min_words=3, max_words=6, size=10, seed=42)
-    dataset = WordReversalDataset(config)
+    config = WordSequenceReversalConfig(min_words=3, max_words=6, size=10, seed=42)
+    dataset = WordSequenceReversalDataset(config)

    for i in range(len(dataset)):
        item = dataset[i]
@ -54,10 +52,10 @@ def test_word_reversal_dataset_items():
        assert answer_words == list(reversed(question_words))


-def test_word_reversal_dataset_iteration():
+def test_word_sequence_reversal_dataset_iteration():
    """Test that iteration respects dataset size"""
-    config = WordReversalConfig(size=5, seed=42)
-    dataset = WordReversalDataset(config)
+    config = WordSequenceReversalConfig(size=5, seed=42)
+    dataset = WordSequenceReversalDataset(config)

    items = list(dataset)
    assert len(items) == config.size
@ -66,10 +64,10 @@ def test_word_reversal_dataset_iteration():
    assert items == list(dataset)


-def test_word_reversal_text_preprocessing():
+def test_word_sequence_reversal_text_preprocessing():
    """Test that text preprocessing handles edge cases"""
-    config = WordReversalConfig(size=1, seed=42)
-    dataset = WordReversalDataset(config)
+    config = WordSequenceReversalConfig(size=1, seed=42)
+    dataset = WordSequenceReversalDataset(config)

    # Verify words were extracted from text
    assert len(dataset.words) > 0