Microsoft envió una actualización a su modelo MAI de generación de imágenes. MAI-Image-2.5 se ubica actualmente en el tercer puesto del leaderboard text-to-image de Arena, según informó el equipo MAI. Eso lo deja a la par de Nano Banana 2 de Google, aunque todavía un paso claro por detrás de Image-2 de OpenAI.
Microsoft lo describe como el modelo MAI de imagen más potente hasta la fecha, con avances significativos sobre MAI-Image-2 en renderizado de texto dentro de las imágenes, ilustraciones estilizadas y visuales comerciales. La compañía afirma que el modelo sigue los prompts con mayor precisión y produce iluminación, profundidad y relaciones espaciales más consistentes que la versión anterior.
¿Para qué casos de uso lo posiciona Microsoft?

Microsoft está empujando MAI-Image-2.5 para usos profesionales como fotografía de producto y diseño de marca. Según el ranking de Arena, el modelo supera con claridad a sus predecesores en las ocho categorías evaluadas, con énfasis en renderizado de texto, retratos y motivos comerciales.
La apuesta no es sorprendente. Microsoft ya posicionó Designer (su herramienta consumer basada en modelos MAI) como reemplazo de la línea Office Clip Art tradicional, y Foundry abre la API para que estudios externos integren el modelo a pipelines productivos. La fotografía de producto, en particular, es un mercado donde los costos por sesión rondan entre USD 50 y USD 500 por SKU según el rubro, y un modelo generativo competitivo de Arena top-3 baja ese ticket a centavos por inferencia.
¿Cuándo y dónde está disponible?
MAI-Image-2.5 ya está disponible para pruebas en Arena y se desplegará en MAI Playground y Azure AI Foundry dentro de las próximas dos semanas.
Comparativa rápida: dónde se ubica en el ecosistema text-to-image
| Modelo | Posición Arena | Origen |
|---|---|---|
| Image-2 | #1 | OpenAI |
| MAI-Image-2.5 | #3 (empate) | Microsoft |
| Nano Banana 2 | #3 (empate) | |
| MAI-Image-2 | inferior a #3 | Microsoft (versión previa) |
La fotografía de la izquierda en la imagen de portada muestra el avance del modelo en renderizado de texto: los carteles internos aparecen con tipografía consistente y sin la habitual deformación de glifos que cargaban los generadores hasta 2024.
¿Qué implica para los estudios creativos en LatAm?
Para los estudios de diseño chilenos que ya pagan licencia de Adobe Firefly, la llegada de MAI-Image-2.5 a Foundry significa una alternativa integrable nativamente al stack Azure dentro de las próximas dos semanas. Foundry expone APIs facturables por inferencia, lo que cambia el cálculo de costos frente a las suscripciones mensuales fijas de competidores. El otro frente abierto es Nano Banana 2 de Google, disponible en Vertex AI con facturación equivalente, lo que deja a la región LatAm con tres opciones text-to-image de gama profesional con SLA empresarial.
Si la cadencia se mantiene, MAI-Image-3 podría aparecer durante el segundo semestre de 2026 con foco en consistencia entre planos para campañas multi-pieza, el principal cuello de botella que sigue diferenciando producción humana de generativa.
Fuente: Microsoft, vía Arena.




