Saltar al contenido
Etiqueta

#rl asincronico

1 nota publicada

TRL: delta sync baja 1,2 GB a 35 MB por step en RL asincrónico
IA

TRL: delta sync baja 1,2 GB a 35 MB por step en RL asincrónico

Hugging Face liberó un PR en TRL que codifica solo los pesos que cambiaron como safetensors disperso y los sube a un Hub Bucket. El trainer y el rollout dejan de necesitar el mismo data center.

Hugging Face Blog

Etiquetas relacionadas

Otros temas que aparecen junto a #rl asincronico en nuestra cobertura editorial.