Un benchmark técnico publicado por OpenAI sobre genómica reveló, casi sin querer, que la línea ChatGPT Pro de la generación GPT-5.6 podría dividirse en tres modelos paralelos. La tabla del paper incluye filas para "GPT-5.6 Luna Pro", "Terra Pro" y "Sol Pro", todas etiquetadas como corridas "Pro (Extended)". Si el cambio llega al producto final, sería el mayor rediseño de ChatGPT Pro desde el lanzamiento del plan.

¿Cómo estaba organizado GPT-5.6 hasta ahora?

OpenAI presentó oficialmente la generación GPT-5.6 a fines de junio, dividida en tres modelos: Sol para tareas más complejas, Terra para cargas empresariales de alto volumen y Luna para consultas cotidianas rápidas y más baratas. Las variantes Pro no formaron parte del anuncio inicial. En el modelo comercial vigente, "Pro" siempre fue un único tier top: un modelo, más caro que el resto y ubicado un escalón por encima de todo.

Eso es exactamente lo que estaría cambiando. El paper enumera tres Pro paralelos que espejan la línea estándar: uno rápido, uno de alto volumen y uno de máximo rendimiento. Si se confirma, los usuarios Pro elegirán entre velocidad, throughput y máxima capacidad de razonamiento según la tarea.

¿Qué muestran los números del benchmark?

En la prueba de genómica, Sol Pro alcanzó un pass rate del 31,5%, convirtiéndose en el modelo más fuerte entre los 60 evaluados. Superó al Sol estándar (28,7%) y al mejor puntaje no OpenAI, Claude Opus 4.8 con 16,0%. El pass rate mide cuántas veces el modelo completa el análisis multi-etapa sin errores y llega a la respuesta correcta final.

Cuando se compara cada tier estándar en su máximo setting de razonamiento contra su variante Pro, la ganancia es dispar:

  • Luna Pro sube unos 7 puntos sobre Luna estándar
  • Terra Pro llega a 28,5%, casi empatando al Sol estándar (28,7%)
  • Sol Pro apenas gana menos de 3 puntos sobre Sol estándar

La lectura interesante: el compute extra sirve más para modelos débiles que para los ya potentes. Un Terra Pro rinde casi como el flagship Sol estándar, lo que sugiere que un cliente con presupuesto podría acceder a rendimiento premium usando el tier de alto volumen si OpenAI decide ofrecer las variantes.

¿Llegan estas variantes a ChatGPT?

El paper no lo aclara. Los nombres aparecen sólo en la tabla del benchmark. Todo lo que sabemos es que OpenAI corrió las variantes Pro internamente para medir techos de rendimiento en genómica. Si terminarán viéndose en la interfaz de ChatGPT Pro o si eran un experimento interno para el paper, sigue siendo una incógnita.

Otro detalle llama la atención: el paper reporta el uso promedio de tokens como proxy del costo de cómputo para los modelos estándar. Sol al máximo setting consume alrededor de 33.200 tokens por corrida. Para las variantes Pro, ese número no aparece. Los autores dicen que no hubo contabilidad comparable disponible, pero la lectura más razonable es que OpenAI simplemente no quiere compartir esas cifras públicamente.

¿Qué implica para el mercado?

Si el split se materializa en producto, ChatGPT Pro dejaría de ser un plan de un modelo por unos USD 200 mensuales y pasaría a ser una familia de tres. Eso abre la puerta a nuevos esquemas de precio y a una segmentación más fina entre usuarios técnicos, empresariales y de máxima gama. También abre una comparación directa con Anthropic y Google, que ya operan con familias multi-modelo. La próxima señal a mirar es si en las release notes de ChatGPT aparecen selectores para "Pro (velocidad)", "Pro (volumen)" o "Pro (máximo)".