BLEUBERI/eval/arena-hard-v2.0/utils/math_utils.py

import torch
import os

import torch.nn as nn
import torch.optim as optim
import numpy as np
import multiprocessing as mp

from tqdm import tqdm
from dataclasses import dataclass
from functools import partial
from typing import Dict, Tuple, Callable, Optional
from concurrent.futures import ProcessPoolExecutor

REGISTER_LOSSES: Dict[str, Callable] = {}
REGISTER_MODELS: Dict[str, Callable] = {}


def register_loss(name: str):
    def decorator(func: Callable):
        REGISTER_LOSSES[name] = func
        return func

    return decorator


def register_model(name: str):
    def decorator(func: Callable):
        REGISTER_MODELS[name] = func
        return func

    return decorator


@dataclass
class ModelParams:
    coefs: torch.FloatTensor = None
    eta: Optional[torch.FloatTensor] = None


@register_model("bt")
class BTModel(nn.Module):
    def __init__(self, num_components):
        super().__init__()
        self.logits = nn.Parameter(
            nn.init.normal_(torch.empty(num_components), mean=0.0, std=0.01)
        )

    def forward(self):
        return self.logits, None


@register_model("rk")
class RKModel(nn.Module):
    def __init__(self, num_components):
        super().__init__()
        self.logits = nn.Parameter(
            nn.init.constant_(torch.empty(num_components), 0.5)
        )
        self.eta = nn.Parameter(torch.tensor(0.1))

    def forward(self):
        return self.logits, self.eta


@register_loss("bt")
def bt_loss(
    logits: torch.Tensor,
    outcomes: torch.Tensor,
    alpha: float = 0.5,
    **kwargs,
):
    # reg_loss = alpha * torch.linalg.norm(logits, dim=-1)

    probs = torch.sigmoid(logits)

    # Clip probabilities to avoid log(0)
    epsilon = 1e-8
    probs = torch.clamp(probs, min=epsilon, max=1.0 - epsilon)

    # TODO: current implementation works for ties if tie outcomes=0.5
    loss = -(torch.log(probs) * outcomes + torch.log(1.0 - probs) * (1.0 - outcomes)).sum()

    return loss


@register_loss("rk")
def rk_loss(
    logits: torch.Tensor,
    outcomes: torch.Tensor,
    eta: torch.Tensor,
    alpha: float = 0.5,
    eps: float = 1e-10,
    **kwargs,
):
    logits = torch.where(outcomes == 0, -logits, logits)

    probs_w = torch.sigmoid(logits - eta)
    probs_l = torch.sigmoid(-1 * logits - eta)
    probs_t = 1 - probs_w - probs_l

    # point-wise likelihood
    ties = (outcomes == 0.5).long() # TODO: Ties must be 0.5

    A = torch.stack((probs_w, probs_t))
    p = A.take_along_dim(dim=0, indices=ties.unsqueeze(0))

    loss = -torch.log(p + eps).mean()

    return loss


def fit_pairwise_model(
    features: torch.Tensor,
    outcomes: torch.Tensor,
    loss_type: str = 'bt',
    indices: torch.Tensor = None,
    lr: float = 1.0,
    tol: float = 1e-9,
    max_epochs: int = 50
):
    model_cls = REGISTER_MODELS[loss_type]
    loss_func = REGISTER_LOSSES[loss_type]

    if indices is not None:
        features = features[indices]
        outcomes = outcomes[indices]

    model = model_cls(num_components=features.shape[1])

    optimizer = optim.LBFGS(
        model.parameters(),
        lr=lr,
        max_iter=max_epochs,
        tolerance_grad=tol,
        tolerance_change=tol,
    )

    def closure():
        optimizer.zero_grad()
        current_model_logits, eta = model()

        _logits = features @ current_model_logits

        loss = loss_func(
            logits=_logits,
            outcomes=outcomes,
            eta=eta
        )

        # Assuming prior fixes (like prob clamping in bt_loss) prevent NaN/Inf loss.
        # If loss could still be NaN/Inf, a check would be needed here before backward().
        loss.backward()
        return loss

    optimizer.step(closure)

    final_model_logits, final_eta = model()
    return final_model_logits.detach(), final_eta if final_eta is None else final_eta.detach()


def worker_fn_pairwise_model(features, outcomes, loss_type, boot_idxs, idx):
    indices = boot_idxs[idx]
    return fit_pairwise_model(features, outcomes, loss_type, indices)


def bootstrap_pairwise_model(
    features: torch.Tensor,
    outcomes: torch.Tensor,
    loss_type: str = "bt",
    num_round: int = 100,
):
    boot_idxs = np.random.randint(
        low=0, high=features.shape[0],
        size=(num_round, features.shape[0])
    )

    results = [fit_pairwise_model(features, outcomes, loss_type, boot_idxs[i]) for i in tqdm(range(num_round))]

    logit_stacks = torch.stack([result[0] for result in results])

    if results[0][1] is not None:
        eta_stacks = torch.stack([result[1] for result in results])
    else:
        eta_stacks = None

    return logit_stacks, eta_stacks


def fit_binary_model(
    features: np.ndarray,
    outcomes: np.ndarray,
    indices: np.ndarray = None,
    max_iter: int = 1000,
):
    from sklearn.linear_model import LogisticRegression

    if indices is not None:
        features = features[indices]
        outcomes = outcomes[indices]

    model = LogisticRegression(max_iter=max_iter)
    model.fit(features, outcomes)

    return model.coef_, model.intercept_


def worker_fn_binary_model(idx, features, outcomes, boot_idxs):
    indices = boot_idxs[idx]
    return fit_binary_model(features, outcomes, indices)


def bootstrap_binary_model(
    features: np.ndarray,
    outcomes: np.ndarray,
    num_round: int = 100,
    num_cpu: Optional[int] = None,
):

    boot_idxs = np.random.randint(
        low=0, high=features.shape[0],
        size=(num_round, features.shape[0])
    )

    try:
        mp.set_start_method('spawn')
    except RuntimeError:
        pass

    worker = partial(
        worker_fn_binary_model,
        features,
        outcomes,
        boot_idxs
    )

    num_cpu = num_cpu if num_cpu else os.cpu_count() // 4
    print(f"INFO: Using {num_cpu} CPUs for bootstrapping.")

    with mp.Pool(num_cpu) as pool:
        results = list(
            tqdm(pool.imap(worker, range(num_round)), total=num_round)
        )

    coef_stacks = [result[0] for result in results]
    intercept_stacks = [result[1] for result in results]

    return coef_stacks, intercept_stacks


def one_hot_encode(items, baseline="o3-mini-2025-01-31"):
    # Get unique items and sort them
    unique_items = sorted(set(items + [baseline]))
    item_to_index = {item: idx for idx, item in enumerate(unique_items)}

    # Initialize the one-hot encoded matrix
    one_hot_matrix = []

    for item in items:
        # Create a zero-filled list
        one_hot_vector = [0] * len(unique_items)
        # Set the appropriate index to 1
        one_hot_vector[item_to_index[item]] = 1
        one_hot_vector[item_to_index[baseline]] = -1
        one_hot_matrix.append(one_hot_vector)

    return torch.tensor(one_hot_matrix, dtype=torch.float32), unique_items


def to_winrate_probabilities(
    coefs,
    models,
    baseline_model="o3-mini-2025-01-31",
):
    baseline_idx = models.index(baseline_model)

    exp_coefs = torch.exp(coefs)
    probs = torch.zeros(coefs.shape[0], coefs.shape[1])

    for idx in range(len(models)):
        if models[idx] == baseline_model:
            probs[:, idx] = 0.5
        probs[:, idx] = exp_coefs[:, idx] / (exp_coefs[:, idx] + exp_coefs[:, baseline_idx])

    return probs