xAI publicó Grok 4.3, un modelo más barato y más capaz orientado a tareas prácticas. El lanzamiento incluye además una nueva herramienta de generación de imágenes basada en agentes.
El desarrollador de xAI Eric Jiang señaló que Grok 4.3 está construido para developers y empresas, con foco en velocidad, costo bajo y llamadas a herramientas. El modelo ejecuta de forma autónoma búsqueda web, búsqueda en X, código Python y file search (RAG), y puede generar planillas Excel, PDFs y presentaciones PowerPoint.
Grok 4.3 corre a 100 tokens por segundo y tiene una ventana de contexto de un millón de tokens. El precio es de USD 1,25 por millón de tokens de entrada y USD 2,50 por millón de tokens de salida, con conocimiento actualizado hasta diciembre de 2025. El razonamiento ahora viene integrado por defecto: Grok 4.3 "piensa" antes de responder cada solicitud, y esos tokens de razonamiento se facturan al mismo precio que los de salida normales. El modelo está disponible vía OpenRouter, la API de xAI y el agente Hermes.
¿Cómo se compara Grok 4.3 con GPT-5.5 y Claude?
Según el servicio independiente Artificial Analysis, Grok 4.3 obtuvo 53 puntos en el Intelligence Index. Eso lo deja apenas sobre Muse Spark y los modelos medianos de Anthropic, cuatro puntos arriba del Grok 4.20 anterior, y bastante por detrás de los modelos insignia de OpenAI y Anthropic.

Los costos de entrada bajaron cerca de un 40 por ciento y los de salida un 60 por ciento respecto a Grok 4.20. Eso ubica al modelo en lo que Artificial Analysis llama frontera de Pareto, donde el rendimiento y el costo se alinean mejor. Una corrida completa de benchmark cuesta USD 395, comparada con USD 3.959 para GPT-5.5 y USD 4.811 para Claude Opus 4.7.

En GDPval-AA, un benchmark que mide el rendimiento de la IA en tareas reales del trabajo del conocimiento, el puntaje Elo de Grok 4.3 saltó 321 puntos hasta los 1.500. Eso lo deja sobre Gemini 3.1 de Google, aunque GPT-5.5 de OpenAI sigue liderando por 276 puntos Elo.
Otros benchmarks son menos generosos. Andon Labs, que pone a modelos de IA a operar una máquina expendedora de snacks, reportó retrocesos en tareas de agentes autónomos, señalando que el modelo a veces se queda inactivo en lugar de actuar.
"Parece tener problemas de narcolepsia, prefiriendo dormir varios días seguidos antes que tomar acciones", escribió Andon Labs.
Val's AI lo ubica primero en CaseLaw y primero en CorpFin, pero el modelo se complica en benchmarks generales de código y problemas matemáticos difíciles, donde queda en el puesto 13.
¿Qué hace el nuevo Agent Mode de Grok Imagine?
xAI también liberó Agent Mode para Grok Imagine, ahora en beta dentro de la interfaz web de Grok. En lugar de funcionar a partir de prompts únicos, el modo gestiona proyectos creativos más largos. Un agente de IA planifica, genera, edita y revisa contenido en un workspace abierto, que xAI dice sirve para cosas como una película de un minuto, una serie de manga o historias de producto.
Agent Mode es accesible a través de la interfaz web de Grok y se activa en el campo de entrada en la esquina inferior izquierda. Se requiere cuenta paga.




