El podcast Latent Space dedica su último episodio a una conversación de casi dos horas con Evan Feinberg, co-fundador de Genesis Molecular AI, y Sergey Edunov, su CTO. Edunov llegó a Genesis después de haber liderado el entrenamiento de Llama 2 y el pretraining de Llama 3 en Meta. Físico antes que investigador de IA, se declaró listo para dejar la física después de años entrenando LLMs. Y entonces conoció a Genesis.

¿Por qué la investigación de difusión más interesante no está en los LLMs?

La tesis de Feinberg y Edunov es contraintuitiva. La arquitectura Transformer que sostiene a los LLMs modernos no ha cambiado de forma fundamental desde el paper Attention is all you need. Algunas variantes fueron muy útiles, como mixture-of-experts, que habilitó el paradigma de modelos gigantes. Pero conceptualmente, poco emocionante.

En cambio, la predicción de estructura 3D ha sido un hervidero de innovación.

"Tuvimos que esperar a que se creara el primitivo correcto, y ese primitivo resultó ser la difusión. En realidad, parte de la investigación de difusión más innovadora que está ocurriendo en nuestro campo hoy sucede en predicción de estructura 3D." — Evan Feinberg

El modelo más reciente de Genesis, PEARL (Place Every Atom at the Right Location), captura la flexibilidad de las proteínas. Modela no solo dónde se ubica el ligando, sino también cómo se acomoda la proteína para encajarlo mejor de lo que cualquiera de las dos partes podría lograr sola. El campo sabía que faltaba, pero recién ahora hay herramientas para modelarlo.

¿Qué hace tan difícil descubrir un fármaco?

Los números lo explican rápido. Existen aproximadamente 10^60 moléculas pequeñas con propiedades tipo fármaco en el universo. Nunca vas a poder buscarlas todas.

"Es como buscar una aguja en un pajar, donde todo excepto tu aguja es muy, muy peligroso." — Sergey Edunov

Y hay más. El desafío real no es encontrar una molécula que se una fuerte al blanco. Hay que optimizar simultáneamente propiedades ADMET (Absorción, Distribución, Metabolismo, Excreción y Toxicidad), unas 30 propiedades que suelen entrar en tensión mutua. Un buen binder tiende a ser graso; una molécula grasa suele ser insoluble; si es insoluble, no entra al torrente sanguíneo y no llega a donde debe actuar.

Descubrimiento agéntico: SAPPHIRE

Los avances generativos de Genesis los llevaron, según sostienen, más allá del umbral donde los loops agénticos de descubrimiento de fármacos pasan a ser posibles. Su sistema interno, con nombre en clave SAPPHIRE, itera como lo haría un químico humano: observa y razona sobre poses, formula hipótesis, lee literatura, usa herramientas internas y genera candidatos para la siguiente iteración. Combinado con la alianza automatizada de laboratorio que Genesis mantiene con Incyte, se acerca la posibilidad de agentes de descubrimiento operando 24/7 sin supervisión humana entre ciclo y ciclo.

Crisis de benchmarks: el favorito de todos es slop

Uno de los puntos más provocadores del episodio: el campo académico del co-folding fijó como métrica de buena pose el umbral de 2 Angstroms de RMSD. Feinberg no matiza: ese umbral es malo. Incluso engañoso.

"Si tu modelo se queda en 1,8 o 1,9 Angstroms de RMSD, eso es slop, muy probablemente." — Evan Feinberg

Un ejemplo simple: los enlaces de hidrógeno, responsables de muchas de las interacciones más importantes en sistemas proteína-ligando, tienen solo 0,6 Å de rango de validez. Para modelarlos correctamente hay que estar bastante por debajo de los 2 Å. La comunidad, dice Feinberg, quedó atrapada en el benchmark porque los académicos que desarrollaron los métodos no eran usuarios. Ya asoman metodologías nuevas como lDDT para co-folding, pero la conversación pública sigue anclada al viejo umbral. El reporte técnico de PEARL en arXiv (2510.24670) desarrolla el argumento en detalle.

PEARL destrona el ranking en OpenBind

El punch line del episodio es el resultado sobre OpenBind, un benchmark reciente con 802 co-complejos nunca antes vistos sobre el target EV-A71. Este target parece diseñado para castigar a los métodos clásicos: cuando un ligando se une al sitio principal, la proteína se cierra sobre el propio camino de entrada del ligando. Ese fenómeno, llamado encaje inducido o induced fit, es notoriamente difícil de modelar sin correr simulaciones de dinámica molecular largas.

PEARL lo resolvió sin recurrir a simulaciones extensas. En las distintas métricas de evaluación, quedó no solo adelante, sino bastante por delante de cualquier modelo público.

"Donde PEARL fue excepcionalmente bueno es en descubrir cómo mover este loop. Somos básicamente correctos en todas las poses." — Sergey Edunov

Aún más relevante: el resultado se logró sin fine-tuning y sin datos de entrenamiento del target ni de homólogos. La estructura PDB de referencia se publicó después del corte de entrenamiento de PEARL.

Comparativa: PEARL vs alternativas cerradas

ActorCoberturaEstado del códigoNota
Genesis Molecular (PEARL)co-foldingCerradoLidera OpenBind zero-shot
Isomorphic Labs (Alphabet)co-foldingCerradoPublicaciones internas
Deep Originco-foldingCerradoProgreso comparable
Métodos clásicos dockingstaticAbiertoFalla con induced fit

Como notan los autores del podcast, ninguno de los tres líderes actuales publica el código, lo que impide comparaciones honestas cara a cara.

¿Qué implica para el campo?

Feinberg cierra con un mensaje para la academia: cuando ya se demostró que algo se puede hacer, ejecutar se vuelve más fácil. La clave no fue solo el modelo de difusión, sino la integración estrecha entre machine learning, cómputo a gran escala y aplicaciones reales de descubrimiento de fármacos. Estructuras que la academia tradicional no favorece.

¿Cambia el paisaje del descubrimiento de fármacos para LatAm?

Sí, pero indirectamente. Chile no tiene compañías de descubrimiento de fármacos con estos volúmenes de cómputo, pero sí tiene centros como el CMM de la Universidad de Chile y grupos activos en la PUCV que trabajan en química computacional y biofísica. Que un modelo público en arXiv como PEARL demuestre umbrales antes considerados inalcanzables abre espacio para experimentación local: replicar métricas, adaptar pipelines a targets endémicos regionales (por ejemplo, agentes antichagásicos) y postular a fondos internacionales usando el nuevo estado del arte como línea base.