IA
LGMT mide cuán frágil es el razonamiento real de los LLMs
Un equipo liderado por Zenghui Zhou propone un test 'oracle-free' basado en lógica de primer orden que detecta fallos ocultos en seis modelos estado del arte invisibles a los benchmarks tradicionales.
arXiv cs.AI