Etiqueta

#benchmarks ia

1 nota publicada

GPT-5.5 y Opus 4.7 cometen los mismos tres errores en ARC-AGI-3
IA

GPT-5.5 y Opus 4.7 cometen los mismos tres errores en ARC-AGI-3

Un análisis de 160 partidas detectó tres patrones recurrentes que explican por qué ambos modelos siguen bajo el 1% del benchmark.

The Decoder