
IA
Solvita duplica la exactitud de LLMs en programación competitiva
El framework agentivo de Han Li y 12 coautores convierte señales de éxito y fracaso en actualizaciones de aprendizaje por refuerzo sobre redes de conocimiento entrenables.
arXiv cs.AI