Empleados de Anthropic aseguran que Claude Mythos también puede resolver lo que OpenAI calificó como su "hito matemático con IA". OpenAI refutó hace poco la conjetura de Erdős sobre distancias unitarias, un problema abierto en geometría combinatoria desde 1946. El ingeniero de Anthropic Sholto Douglas escribió en X que Mythos resuelve la conjetura con una "prueba simple y elegante", una señal de "overhang serio" en descubrimientos matemáticos asistidos por IA.

¿Cómo abordó el problema el equipo de Anthropic?

El equipo usó un sistema de prueba construido después de que la IA resolviera el problema Erdős #1196: instancias aisladas de Claude Code con acceso a Mythos reciben el enunciado, desarrollan caminos de solución, y luego una instancia resume y distribuye esos caminos a otras instancias trabajando de forma independiente.

Mythos eligió frecuentemente una ruta distinta a la del modelo de OpenAI. El matemático Daniel Litt calificó el resultado como "un poco peor" que el de OpenAI, pero Mythos también encontró por su cuenta la solución de OpenAI. Anthropic publicó una versión de la demostración preparada por Opus 4.7.

¿Qué otros laboratorios reclaman avances en Erdős?

Google DeepMind anunció hace poco que un sistema asistido por IA resolvió nueve problemas Erdős, aunque su enfoque se apoya en el lenguaje formal de demostraciones Lean, lo que resulta menos impactante desde la mirada del purismo LLM. Por otro lado, hay que recordar que Claude Code es también un harness agéntico, no un LLM puro.

El ritmo al que distintos laboratorios reclaman ahora resoluciones a problemas Erdős sugiere que el límite entre tarea técnica y descubrimiento matemático se está moviendo más rápido de lo que muchos modeladores anticipaban. La conjetura de las distancias unitarias había permanecido abierta durante 79 años antes de esta racha de soluciones, todas concentradas en cuestión de semanas.

¿Qué significa "overhang serio"?

En el lenguaje habitual de los laboratorios de IA, overhang describe la brecha entre lo que un modelo puede hacer y lo que se está usando para hacer. Cuando un investigador dice que hay "overhang serio" en descubrimientos matemáticos asistidos por IA, está diciendo que las capacidades latentes en modelos como Mythos u Opus 4.7 superan ampliamente las pruebas que normalmente se ejecutan sobre ellos: si se les da el problema correcto y el harness correcto, producen demostraciones nuevas.

Para investigadores en matemática aplicada y combinatoria, la implicancia es directa: el cuello de botella ya no es la capacidad de razonamiento del modelo, sino el diseño del experimento que lo desafía.