mirror of https://github.com/NousResearch/atropos.git synced 2026-04-19 12:57:58 +00:00

History

pre-commit-ci[bot] 34cabbb30f [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci		2025-09-15 16:41:26 +00:00
..
AI_Diplomacy@70d4ae2fe0	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00
__init__.py	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00
atropos_client_minimal.py	[pre-commit.ci] auto fixes from pre-commit.com hooks	2025-09-15 16:41:26 +00:00
diplomacy_env_minimal.py	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00
diplomacy_local_server.py	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00
queue_manager.py	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00
README.md	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00
requirements.txt	Diplomacy trainer env (#227 )	2025-08-12 09:02:16 +10:00

Minimal Diplomacy Environment

A simplified Diplomacy RL training environment for Atropos that integrates with AI_Diplomacy.

Overview

This minimal implementation provides:

Atropos Policy Server
        ↓
AtroposClientMinimal (proxy)
        ↓
AI_Diplomacy Game Engine
        ↓
Game Execution

pip install -r requirements.txt
cd AI_Diplomacy
pip install -e .

python diplomacy_env_minimal.py serve

Key settings in DiplomacyEnvMinimalConfig:

Parallel Rollouts: Each training step runs group_size games with the same initial seed
LLM Interception: AtroposClientMinimal intercepts all LLM calls from AI_Diplomacy
Trajectory Collection: Game interactions are collected and scored
Best Selection: The highest scoring trajectory is returned for training