
NVIDIA Auto-FL: agentes IA para acelerar el aprendizaje federado
El sistema combina mutaciones acotadas, un ledger reproducible y recuperación basada en literatura para iterar estrategias FL más rápido en CIFAR-10 y modelos médicos VLM.
60 notas publicadas

Arduino plantea agentes locales, LLMs compactos y workflows de IA orquestados sobre el UNO Q, que combina Debian Linux con un STM32 en tiempo real en una misma placa.

El nuevo modelo Mixture-of-Experts de NVIDIA promete mayor velocidad, eficiencia en contextos largos y una arquitectura diseñada para flujos de trabajo complejos.

COMPUTEX 2026 y Microsoft Build traen sandboxing nativo con Microsoft eXecution Containers, tensor parallelism en llama.cpp y nuevos modelos Hermes y Holo 3.1 para agentes locales sobre PCs RTX.

Cadence, Dassault Systèmes, Siemens y Synopsys integran el blueprint abierto de NVIDIA para automatizar workflows de CAE y EDA en chips, automóviles y aeroespacial.

Jensen Huang se unió a la keynote de Satya Nadella en Microsoft Build para anunciar RTX Spark, DGX Station, Nemotron 3 Ultra en Foundry, Claude en GB300 Blackwell y OpenShell en Copilot.

La compañía noruega lanzó un agente entrenado sobre su SDK y datos de nRF Cloud que se integra con Claude Code, Cursor o GitHub Copilot vía MCP, con menor costo de tokens que un LLM genérico.

NVIDIA simplifica el despliegue de agentes autónomos locales con NemoClaw, ofreciendo hasta 2.6x más velocidad en inferencia y soporte para clústeres multi-nodo.

TSMC acelera 20-50% la litografía computacional con cuLitho; Foxconn recorta 80% el análisis de causa raíz con MoMClaw; Pegatron baja 67% el deploy de inspección visual con Cosmos.

El Agent Toolkit publica skills en GitHub y skills.sh para que coding agents orquesten datos sintéticos, simulación y deploy sobre Cosmos 3, Isaac, Omniverse, Alpamayo y Jetson.

El blueprint conecta NemoClaw, AI-Q y los modelos Nemotron sobre DGX Station para que Advantech, Foxconn, Pegatron y Wistron operen plantas enteras desde un único agente.

DGX Station for Windows, OpenShell sobre primitivas de seguridad de Microsoft, NemoClaw multiplataforma y 2x rendimiento en llama.cpp con multi-token prediction.

La nueva capa de software de DSX agrupa DSX Exchange, MaxLPS, NICo, NVSentinel, Run:ai, Dynamo y más herramientas open source para operar fábricas IA multitenant a escala gigawatt.

El nuevo procesador servidor de NVIDIA combina 88 cores Olympus, hasta 1,2 TB/s de LPDDR5X y la fábrica de coherencia SCF para sostener sandbox agéntico 1,8x más rápido que arquitecturas x86.

El nuevo modelo de video generativo Omni y la familia 3.5 Flash llegan a la app Gemini, AI Mode en Search, YouTube Shorts y al harness Antigravity para agentes a escala.

Anthropic mantiene los precios de Opus 4.7 (USD 5/USD 25 por millón de tokens), suma control de esfuerzo en claude.ai, workflows dinámicos en Claude Code y modo rápido tres veces más barato.

El nuevo modelo llega solo 41 dias despues de Opus 4.7 y suma una herramienta en research preview para coordinar cientos de subagentes dentro de Claude Code.

Gemini Omni para video generativo, Gemini 3.5 Flash con foco en agentes, agentes de información en Search, Daily Brief, anteojos Android XR y expansión de SynthID marcaron la keynote.

El CEO de Google y Alphabet conversó con Nilay Patel tras Google I/O 2026 sobre Gemini, los agentes, Google Zero y el camino a la AGI.

Wired reconstruye cómo Anthropic con Claude Code Opus 4.5 y Peter Steinberger con OpenClaw (366.000 stars en GitHub) detonaron el cambio más subestimado del software, según Thomas Reardon.

Tras seis meses probando coding agents en su proyecto tinygrad, el hacker se alinea con LeCun y Marcus: 'son modelos estadísticos que imitan código, no que lo entienden'.

El framework combina Gemini 3.1 Pro con el compilador Lean para demostrar conjeturas abiertas hace décadas, a un costo de inferencia de pocos cientos de dólares por problema.

El asistente conversacional usa Gemini 3.1 Flash-Lite por defecto, suma plugins de gráficos, generación de imágenes y sandbox de código, y también corre contra modelos locales en LM Studio.

Una nueva categoría experimental llamada Agentic Browsing mide si los sitios exponen llms.txt, accessibility tree y la API WebMCP. Airbnb apenas pasa una de tres pruebas.

AutoTTS deja que un agente de código busque por sí mismo las reglas del test-time scaling y produce una estrategia que iguala a self-consistency con un tercio del costo en tokens.

Con 35 personas atendiendo a 3 millones de usuarios y data centers propios con payback de 3 meses, Jake Cooper construye una alternativa a los hyperscalers para la era de los agentes.

Desde prompt engineering y RAG hasta SFT, LoRA y RLVR con GRPO: una guia tecnica para decidir cuando cada metodo agrega valor sin disparar el costo.

El add-in beta crea presentaciones desde notas, documentos o imágenes y edita slides existentes, pero la propia OpenAI recomienda guardar copias antes de usarlo.

Sundar Pichai presentó un nuevo Search con IA, agentes que trabajan 24/7, un carrito universal de compras y Gemini Omni para video generativo con conciencia física.

El recorte sobre DeepSeek V4 Pro lleva el output a USD 0,87 por millon de tokens y consolida la guerra de precios que la oferta china abrio contra OpenAI y Anthropic.

Un primer relato publicado por el blog oficial de Espressif documenta el paso a paso de un usuario sin experiencia previa que arma un indicador de temperatura con LED, IA y mucho trial-and-error.

Project Glasswing, la operacion ofensiva de Anthropic con unos 50 socios (Cloudflare, Mozilla, Oracle), encuentra vulnerabilidades criticas mas rapido de lo que se pueden cerrar.

Pulsar ambas teclas Command envía el contenido completo de la ventana activa al asistente de programación, incluyendo el texto que queda fuera del scroll visible.

El uso intensivo de agentes consume hasta 1000 veces más tokens que un LLM convencional y obliga a Microsoft, Meta y Amazon a moderar herramientas como Claude Code.

Un giro narrativo de Greg Brockman, el cierre del equipo de modelos de AI21 y el primer equipo de harness en DeepSeek apuntan al mismo movimiento: el modelo dejó de ser el producto.

El nuevo modelo del equipo Qwen, exclusivo de la API de Alibaba Cloud, completó 432 tests de kernel y 1.158 tool calls sin intervención humana, logrando un speedup promedio de 10x.

El CEO Ivan Burazin explica cómo la empresa pasó de hospedar entornos de desarrollo humano a operar 850.000 sandboxes diarios en bare metal para agentes autónomos.

NVIDIA detalla cinco prácticas para medir agentes en producción: trayectorias completas, precisión de tool calls y eficiencia, más allá del benchmark estático del modelo base.

El agente IA debutó en octubre pasado para detectar y reparar vulnerabilidades; ahora se abre a expertos externos en plena ola de IA aplicada a seguridad.

La app agéntica de codificación suma escritorio rediseñado, agentes en background y voz nativa apoyados en Gemini 3.5 Flash; el plan Ultra superior baja de USD 250 a USD 200.

Jensen Huang asegura que el chip Vera, presentado en marzo, es el primer CPU diseñado para IA agentic y ya acumula ventas por USD 20B este año.

El asistente personal anunciado en I/O 2026 corre sobre Google Cloud, llega la próxima semana a suscriptores AI Ultra y se construye encima de Antigravity para tareas largas sin supervisión.

Google AI Ultra (USD 200/mes) suma una función experimental que combina Genie 3 con Street View para generar entornos caminables desde un pin en el mapa, solo en Estados Unidos por ahora.

La herramienta de línea de comandos da acceso a Android Studio a OpenAI Codex, Antigravity y otros agentes externos, reconociendo que muchos desarrolladores ya no usan el IDE de Google.

Construido con Gemini, el sistema usa una coalición de agentes para generar, debatir y refinar hipótesis científicas, según un paper publicado en Nature.

Google presenta su modelo más potente para coding y agentes autónomos: 4× más rápido que la frontera previa (12× en versión optimizada), ya por defecto en la app de Gemini y AI Mode en Search.

Combinar percepción, SLAM, razonamiento y planificación en una capa orquestadora permite a los robots salir de la fábrica controlada al mundo real, dice The Robot Report.

El primer release de la familia es 3.5 Flash, líder en agentes y coding sobre su antecesor Pro, con velocidad cuatro veces mayor que otros modelos frontier.

El modelo más rápido en su clase de inteligencia consume tantos tokens en tareas de agentes que supera incluso al Gemini 3.1 Pro en costo total.

La china Deepseek monta un equipo "Harness" en Beijing para construir su propio agente de programación, en competencia directa con los productos de Anthropic, OpenAI y Cursor.

El blueprint expone un servidor de investigación profunda como skill enchufable para Claude Code, Codex y OpenCode, manteniendo los datos sensibles dentro de la red corporativa.
Stainless, fundada en 2022, ya generaba todos los SDKs oficiales de Anthropic en TypeScript, Python, Go, Java y Kotlin, además de servidores MCP. Con la compra, ese equipo pasa a ser interno.

El nuevo agente personal de Google llega en beta la próxima semana al plan AI Ultra de 100 dólares mensuales, con permisos para leer Gmail, Calendar y la tarjeta de crédito del usuario.

Coding agentic con orquestación multiagente, comandos por voz y exportación a AI Studio. La nueva versión usa Gemini 3.5 Flash y compite directo con Cursor y Claude Code.

Google DeepMind anunció la familia Gemini 3.5 con foco en agentes y acción. El primer modelo, Flash, sale ya y supera al anterior Pro en Terminal-Bench, GDPval-AA y MCP Atlas.

Instructivos portables auditados por SkillSpector y firmados con OpenSSF Model Signing para extender agentes IA con CUDA-X, AI Blueprints y cuOpt sin perder cadena de custodia.

El modelo de seguridad probó más de 50 repositorios de Cloudflare en Project Glasswing y compiló pruebas de concepto funcionales por su cuenta.

El keynote del 19 de mayo trajo el nuevo Gemini Omni para video generativo, un rediseño Neural Expressive de la app, baja del plan Ultra y un competidor de Anthropic Mythos llamado CodeMender.

Anthropic deja correr la ejecución de herramientas en infraestructura del cliente y abre canales cifrados hacia APIs y bases de datos internas, pero el loop del agente sigue en sus servidores.

El equipo Multi-X de Oppo abre el código de un agente que combina cámara, pantalla y voz directo en el teléfono, y solo llama a la nube como combustible para razonamiento complejo.
Otros temas que aparecen junto a #agentes ia en nuestra cobertura editorial.