IA
TRL: delta sync baja 1,2 GB a 35 MB por step en RL asincrónico
Hugging Face liberó un PR en TRL que codifica solo los pesos que cambiaron como safetensors disperso y los sube a un Hub Bucket. El trainer y el rollout dejan de necesitar el mismo data center.
Hugging Face Blog