Punto clave de esta nota

MAI-Image-2.5 de Microsoft se ubica tercero en el leaderboard text-to-image de Arena.

Punto clave de esta nota

El modelo empata con Google Nano Banana 2 pero sigue detrás del Image-2 de OpenAI.

Punto clave de esta nota

Microsoft promete mejoras claras frente a MAI-Image-2 en renderizado de texto, retratos y visuales comerciales.

Microsoft MAI-Image-2.5 empata con Nano Banana 2 en Arena

El nuevo modelo de Microsoft sube al tercer puesto del leaderboard text-to-image de Arena con mejoras claras en renderizado de texto y visuales comerciales, aún detrás de OpenAI Image-2.

Publicado el 29 de mayo de 2026 · 12:04 p. m.2 min de lectura

Al grano

MAI-Image-2.5 de Microsoft se ubica tercero en el leaderboard text-to-image de Arena.
El modelo empata con Google Nano Banana 2 pero sigue detrás del Image-2 de OpenAI.
Microsoft promete mejoras claras frente a MAI-Image-2 en renderizado de texto, retratos y visuales comerciales.

Por qué importa

Microsoft logra ubicarse a la par del modelo de Google que dominó el último benchmark global de imagen generativa, confirmando que la brecha entre frontiers comerciales se estrecha. Image-2 de OpenAI sigue marcando el techo, pero el segundo escalón ya no es exclusivo de Google. Para usuarios de Azure Foundry, MAI-Image-2.5 acelera la fotografía de producto sin depender de APIs externas, un argumento serio frente a la fragmentación creativa actual.

Microsoft envió una actualización a su modelo MAI de generación de imágenes. MAI-Image-2.5 se ubica actualmente en el tercer puesto del leaderboard text-to-image de Arena, según informó el equipo MAI. Eso lo deja a la par de Nano Banana 2 de Google, aunque todavía un paso claro por detrás de Image-2 de OpenAI.

Microsoft lo describe como el modelo MAI de imagen más potente hasta la fecha, con avances significativos sobre MAI-Image-2 en renderizado de texto dentro de las imágenes, ilustraciones estilizadas y visuales comerciales. La compañía afirma que el modelo sigue los prompts con mayor precisión y produce iluminación, profundidad y relaciones espaciales más consistentes que la versión anterior.

¿Para qué casos de uso lo posiciona Microsoft?

Microsoft está empujando MAI-Image-2.5 para usos profesionales como fotografía de producto y diseño de marca. Según el ranking de Arena, el modelo supera con claridad a sus predecesores en las ocho categorías evaluadas, con énfasis en renderizado de texto, retratos y motivos comerciales.

La apuesta no es sorprendente. Microsoft ya posicionó Designer (su herramienta consumer basada en modelos MAI) como reemplazo de la línea Office Clip Art tradicional, y Foundry abre la API para que estudios externos integren el modelo a pipelines productivos. La fotografía de producto, en particular, es un mercado donde los costos por sesión rondan entre USD 50 y USD 500 por SKU según el rubro, y un modelo generativo competitivo de Arena top-3 baja ese ticket a centavos por inferencia.

¿Cuándo y dónde está disponible?

MAI-Image-2.5 ya está disponible para pruebas en Arena y se desplegará en MAI Playground y Azure AI Foundry dentro de las próximas dos semanas.

Comparativa rápida: dónde se ubica en el ecosistema text-to-image

Modelo	Posición Arena	Origen
Image-2	#1	OpenAI
MAI-Image-2.5	#3 (empate)	Microsoft
Nano Banana 2	#3 (empate)	Google
MAI-Image-2	inferior a #3	Microsoft (versión previa)

La fotografía de la izquierda en la imagen de portada muestra el avance del modelo en renderizado de texto: los carteles internos aparecen con tipografía consistente y sin la habitual deformación de glifos que cargaban los generadores hasta 2024.

¿Qué implica para los estudios creativos en LatAm?

Para los estudios de diseño chilenos que ya pagan licencia de Adobe Firefly, la llegada de MAI-Image-2.5 a Foundry significa una alternativa integrable nativamente al stack Azure dentro de las próximas dos semanas. Foundry expone APIs facturables por inferencia, lo que cambia el cálculo de costos frente a las suscripciones mensuales fijas de competidores. El otro frente abierto es Nano Banana 2 de Google, disponible en Vertex AI con facturación equivalente, lo que deja a la región LatAm con tres opciones text-to-image de gama profesional con SLA empresarial.

Si la cadencia se mantiene, MAI-Image-3 podría aparecer durante el segundo semestre de 2026 con foco en consistencia entre planos para campañas multi-pieza, el principal cuello de botella que sigue diferenciando producción humana de generativa.

Fuente: Microsoft, vía Arena.

Microsoft MAI-Image-2.5 empata con Nano Banana 2 en Arena

Al grano

Por qué importa

¿Para qué casos de uso lo posiciona Microsoft?

¿Cuándo y dónde está disponible?

Comparativa rápida: dónde se ubica en el ecosistema text-to-image

¿Qué implica para los estudios creativos en LatAm?

Seguir leyendo

GPT-5.6 será el modelo preferido de Microsoft 365 Copilot

Microsoft Frontier Company: USD 2.500M y 6.000 ingenieros para IA

Nano Banana 2 Lite genera imágenes en 4s por USD 0,034 el millar

Microsoft saca a OpenAI y Anthropic de Copilot para bajar costos

→Al grano

✦Por qué importa

¿Para qué casos de uso lo posiciona Microsoft?

¿Cuándo y dónde está disponible?

Comparativa rápida: dónde se ubica en el ecosistema text-to-image

¿Qué implica para los estudios creativos en LatAm?

Seguir leyendo

GPT-5.6 será el modelo preferido de Microsoft 365 Copilot

Microsoft Frontier Company: USD 2.500M y 6.000 ingenieros para IA

Nano Banana 2 Lite genera imágenes en 4s por USD 0,034 el millar

Microsoft saca a OpenAI y Anthropic de Copilot para bajar costos

Al grano

Por qué importa