add managed vllm server

2026-04-19 12:57:58 +00:00 · 2025-11-07 13:06:49 -06:00 · 2025-11-07 13:06:49 -06:00 · e6ac3abdcb
commit e6ac3abdcb
parent 578175a709
9 changed files with 597 additions and 15 deletions
--- a/environments/math_server_zero.py
+++ b/environments/math_server_zero.py
@ -155,7 +155,7 @@ class MathEnv(BaseEnv):
        server_configs = ServerBaseline(
            model_name="Qwen/Qwen2.5-7B",
            num_requests_for_eval=256,  # since evaling only on one...
-            server_type="sglang",
+            server_type="vllm",
        )

        return env_config, server_configs
@ -255,15 +255,15 @@ class MathEnv(BaseEnv):
        return

    async def rollout_and_score_eval(self, question, answer, subset):
-
-        completion = await self.server.completion(
-            prompt=question,
-            n=1,
-            max_tokens=32765,
-            temperature=0.0,
-            split="eval",
-            stop=stop_list,
-        )
+        async with self.server.managed_server(tokenizer=self.tokenizer) as managed:
+            completion = await managed.completion(
+                prompt=question,
+                n=1,
+                max_tokens=32765,
+                temperature=0.0,
+                split="eval",
+                stop=stop_list,
+            )
        loop = asyncio.get_event_loop()
        gold = "\\boxed{" + answer + "}" if "\\boxed" not in answer else answer
        resp = completion.choices[0].text