OpenAI dice que GPT-next refutó un problema de Erdős por menos de USD 1

Un modelo de propósito general, sin asistente formal tipo Lean, descartó una conjetura de geometría discreta abierta desde 1946 con un cómputo estimado en 32 horas.

Publicado el 21 de mayo de 2026 · 06:34 p. m.3 min de lectura

Al grano

OpenAI dice que un modelo de propósito general, mencionado como GPT 5.6, refutó un caso del problema de distancias unitarias de Erdős de 1946.

La corrida tomó alrededor de 32 horas y costó menos de USD 1.000, según el documento técnico abierto publicado por la compañía.

El sistema no usa asistentes formales como Lean: el razonamiento corre íntegramente en el LLM y la verificación queda a posteriori.

Por qué importa

Refutar no es demostrar, y el resultado todavía debe pasar revisión humana. Pero el dato relevante no es la matemática, es el costo: USD 1.000 de cómputo pone esta clase de razonamiento al alcance de un grupo de investigación promedio en cualquier universidad chilena. Si la reproducibilidad se sostiene, en un par de años veremos papers de tesis usando LLMs de razonamiento como herramienta de exploración, no como anécdota.

OpenAI anunció que un modelo interno de razonamiento extendido refutó una creencia de larga data sobre el problema de las distancias unitarias en el plano, una pregunta de geometría discreta planteada por Paul Erdős en 1946. La compañía estimó el costo total de la corrida en menos de USD 1.000 y un tiempo de cómputo de alrededor de 32 horas, con un modelo que circulaba en la comunidad bajo el nombre tentativo GPT 5.6.

El detalle clave es que el resultado lo produjo un LLM de propósito general, no un sistema especializado en demostración formal estilo AlphaProof o Lean. Investigadores de OpenAI subrayaron que esto sugiere que el razonamiento extendido podría generalizar más allá del dominio matemático, una propiedad que ya se había insinuado con el resultado oro del modelo en la Olimpiada Internacional de Matemática 2025.

¿Qué es el problema de las distancias unitarias?

Erdős preguntó en 1946 cuál es la cantidad máxima de pares de puntos a distancia exactamente 1 que puede haber en un conjunto de n puntos del plano. El problema parece simple pero conecta con combinatoria, geometría algebraica y teoría de incidencias, y su cota superior óptima permanece abierta ocho décadas después. El modelo de OpenAI no resolvió la conjetura completa, pero refutó un caso particular que la comunidad daba por cierto.

Los autores de la carta técnica subrayan un matiz importante.

"Esto es una refutación, no una demostración, lo que habría sido más impresionante, pero igualmente apunta hacia lo que viene", señalan en el documento abierto publicado por OpenAI.

El modelo produjo 125 páginas de salida razonada, y una sección específica, bautizada en redes como "el momento de la página 39", concentró la atención técnica: muestra al sistema construyendo una configuración geométrica explícita que contradice la cota conjeturada.

¿En qué se distingue de AlphaProof?

Cuando DeepMind presentó AlphaProof en 2024, el sistema combinaba un LLM con un verificador formal en Lean: cada paso debía pasar por el chequeador para ser válido. El modelo de OpenAI, en cambio, no usa un asistente formal: la cadena de razonamiento se sostiene únicamente en el LLM, y los humanos revisan el resultado a posteriori. Según comentarios de investigadores citados por Latent Space, esa diferencia es relevante porque sugiere que la capacidad de razonamiento profundo no depende de un solucionador externo.

La carta técnica de OpenAI compara explícitamente el approach con métodos tradicionales de búsqueda combinatoria y argumenta que el modelo encontró la configuración refutadora en un espacio de búsqueda que sería intratable por fuerza bruta.

¿Cuánto cuesta hacer esto y por qué importa?

El dato del costo bajo USD 1.000 es central: implica que el modelo no necesitó un cluster de inferencia masivo durante días, sino una corrida acotada. Si el número es preciso y reproducible, baja la barrera para que grupos de investigación con presupuestos modestos puedan intentar problemas matemáticos abiertos usando LLMs de razonamiento. La comparación con corridas anteriores es ilustrativa: AlphaProof en su versión IMO 2024 requería tiempos de cómputo significativamente mayores y verificación formal posterior.

Para investigadores chilenos y latinoamericanos esto abre una ventana concreta: el costo de USD 1.000 está dentro del rango de un fondo concursable mediano (Anillo, Fondecyt Iniciación), y no exige hardware local. Aún falta saber cuándo OpenAI dará acceso público a este modelo de razonamiento extendido, pero el precedente sugiere que la próxima generación de investigación matemática asistida por IA podría descentralizarse rápidamente.

¿Es esto el inicio de "matemática automatizada"?

No. La comunidad matemática ya avisó dos cosas. Primero, una refutación de un caso particular no es lo mismo que demostrar la conjetura completa ni resolver el problema general de Erdős. Segundo, el resultado todavía debe pasar revisión por pares: si la configuración geométrica producida por el modelo es correcta, debería ser verificable manualmente por matemáticos humanos en cuestión de semanas. Si no lo es, el episodio se convertirá en otra anécdota sobre alucinaciones sofisticadas en LLMs.

Lo que sí marca el resultado es un cambio en el tipo de tareas que los modelos de razonamiento extendido pueden abordar: no solo problemas de competencia escolar (IMO, Putnam) con soluciones conocidas, sino preguntas de investigación abiertas donde nadie sabía la respuesta de antemano.

OpenAI dice que GPT-next refutó un problema de Erdős por menos de USD 1

Al grano

Por qué importa

¿Qué es el problema de las distancias unitarias?

¿En qué se distingue de AlphaProof?

¿Cuánto cuesta hacer esto y por qué importa?

¿Es esto el inicio de "matemática automatizada"?

Seguir leyendo

ChatGPT 5.5 Pro produce un paper matemático nivel doctorado en horas

OpenAI refuta una conjetura de Erdős sin resolver desde 1946

GPT-5.5 cuesta 49 a 92 por ciento más que su predecesor

Científico jefe de OpenAI: el avance de IA fue "sorprendentemente lento"

→Al grano

✦Por qué importa

¿Qué es el problema de las distancias unitarias?

¿En qué se distingue de AlphaProof?

¿Cuánto cuesta hacer esto y por qué importa?

¿Es esto el inicio de "matemática automatizada"?

Seguir leyendo

ChatGPT 5.5 Pro produce un paper matemático nivel doctorado en horas

OpenAI refuta una conjetura de Erdős sin resolver desde 1946

GPT-5.5 cuesta 49 a 92 por ciento más que su predecesor

Científico jefe de OpenAI: el avance de IA fue "sorprendentemente lento"

Al grano

Por qué importa