
Waymo libera Reference Driver: modelo de cómo reacciona el humano al vol
El proyecto ReD, con la Universidad Técnica de Delft, simula la sorpresa cognitiva del conductor para fijar un benchmark común de evitación de colisiones para autos autónomos.
Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

El proyecto ReD, con la Universidad Técnica de Delft, simula la sorpresa cognitiva del conductor para fijar un benchmark común de evitación de colisiones para autos autónomos.

El método trata al documento de habilidades como peso entrenable, propone ediciones acotadas y solo conserva los cambios que pasan validación.

Un paper de seguridad interno y una llamada del CEO Andy Jassy a la administración Trump precipitaron la orden de control de exportación que dejó a Anthropic sin Fable 5 ni Mythos 5 para extranjeros.

Artificial Analysis estrenó el primer benchmark multi-vendor que mide rendimiento concurrente de agentes de IA en cargas reales de coding, con resultados normalizados por acelerador y por megawatt.

Nathan Lambert advierte que Anthropic introdujo intervenciones invisibles que degradan el modelo cuando detecta usuarios construyendo competencia de modelos frontera.

Moonshot AI libera un modelo de pesos abiertos de un billón de parámetros enfocado en programación a USD 0,95 entrada y USD 4 salida por millón de tokens.

El nuevo tope de gama de Anthropic lidera el Artificial Analysis Intelligence Index con 64,9 puntos, pero su corrida completa de benchmarks bordea los USD 10.000, el doble que Opus 4.8.

Apple presentó en WWDC 2026 una Siri rediseñada sobre Google Gemini, una nueva generación de Apple Intelligence y un iOS 27 que llega a todos los iPhone desde el 11 en adelante.

La empresa recibió una directiva de export control citando seguridad nacional y un supuesto jailbreak. Anthropic argumenta que la vulneración es menor y contradice principios de proceso justo.

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.

iOS 27 acelera apps 30%, fotos 70% y AirDrop 80%; Mac OS Golden Gate corta soporte Intel; Tim Cook se despide y John Ternus asume el 1 de septiembre como nuevo CEO.

La nueva Siri llega a iPhone, iPad, Mac, Apple Watch y Vision Pro con Apple Foundation Models construidos con Google. Edita fotos con Spatial Reframing y marca imágenes IA con SynthID oculto.

Llega a la API y a los planes Pro, Max, Team y Enterprise: gratis hasta el 22 de junio, USD 10/50 por millón de tokens y bloqueo automático en ciberseguridad, biología y química.

Un estudio del equipo de seguridad de Anthropic mostró que Mythos Preview construyó 8 cadenas de escalada de privilegios en Windows en menos de un día, a USD 2.000 cada una.

El modelo experimental de pesos abiertos genera 256 tokens en paralelo y supera a Gemma 4 en velocidad, aunque pierde calidad en los benchmarks de Google.

La integración con vLLM aceleró normalización, cuantización fusionada y scaled_mm en H100, mientras que B200 sigue limitado por el backend GEMM de Triton sobre Blackwell.

Siri renace como Siri AI con motor de Apple Intelligence construido junto a Google. iOS 27, macOS 27 Golden Gate y Safari suman funciones con IA en toda la línea.

El modelo text-to-image de 3.800 millones de parámetros iguala a rivales 20 veces más grandes. La clave: 800 millones de captions de 100 palabras generados por GPT-4.1.

El desarrollador con acceso público al modelo lo somete a tareas de coding, conocimiento general y agentes. Veredicto inicial: probablemente el modelo más grande hasta ahora.

Nuevas salvaguardas permiten desplegar un modelo que la empresa antes consideraba demasiado peligroso para liberar. Precio: USD 10 input y USD 50 output por millón de tokens.

Google DeepMind, junto a socios estratégicos, abre una convocatoria de hasta USD 10 millones para investigar la seguridad y estabilidad de sistemas de IA multi-agente.

Google DeepMind y NVIDIA optimizan la generación de texto paralela, logrando mayor throughput y menores costos operativos para aplicaciones empresariales de IA.

Google DeepMind publica un modelo experimental MoE de 26B parámetros bajo Apache 2.0 que genera bloques de 256 tokens en paralelo, alcanzando 1.000 tok/s en una NVIDIA H100.