gradient checkpointing issue for LoRAs

2026-04-27 17:23:08 +00:00 · 2025-12-09 10:04:36 -05:00 · 2025-12-09 10:04:36 -05:00 · e202e2c288
commit e202e2c288
parent a7bdc0270d
1 changed files with 11 additions and 1 deletions
--- a/example_trainer/grpo.py
+++ b/example_trainer/grpo.py
@ -389,7 +389,17 @@ def load_model_and_tokenizer(
        )
        model.to(config.device)

-    model.gradient_checkpointing_enable()
+    # Enable gradient checkpointing (saves memory)
+    # For LoRA, use PEFT's method; for others, use standard method
+    if config.weight_bridge_mode == "lora_only":
+        # PEFT models need gradient_checkpointing enabled on base model
+        # and require use_reentrant=False for proper gradient flow
+        if hasattr(model, "enable_input_require_grads"):
+            model.enable_input_require_grads()
+        model.gradient_checkpointing_enable(gradient_checkpointing_kwargs={"use_reentrant": False})
+    else:
+        model.gradient_checkpointing_enable()
+    
    model.train()

    return model, tokenizer