IA

Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

Subtemas:Agentes IA147 Nvidia111 Anthropic105 LLM87 Openai78 Open Source71 Claude56 Gemini52

560 notas publicadas · Página 8 de 24

NVIDIA MCG: model cards automáticas con GPT-OSS-120B

El toolkit Model Card Generator de NVIDIA construye documentación completa en formato Model Card++ a partir del código fuente, con 91% de completitud y 76% de precisión en menos de un minuto.

NVIDIA Developer30 may

torch.profiler explicado: cómo leer trazas en PyTorch desde cero

Hugging Face abre una serie de tres partes sobre profiling con PyTorch, empezando por matmul más bias en bf16 sobre una NVIDIA A100 80GB.

Hugging Face29 may

General Compute compra USD 300M en SambaNova SN50 para inferencia

El nuevo neocloud levantó USD 15 millones a una valuación post-money de USD 60 millones y promete 600 a 700 tokens por segundo, contra los 250 típicos de las GPU.

TechCrunch AI29 may

Amazon estrena Project Nara y tres series IA en Prime Video

El GenAI Creators' Fund financia los pilotos producidos en cinco semanas, mientras la plataforma AWS conecta modelos propios y de terceros con Maya, Blender, Nuke y Adobe Suite.

The Decoder29 may

Apple prepara nueva app Siri y rediseño en iOS 27

Renders filtrados por Bloomberg muestran la nueva experiencia Siri integrada al Dynamic Island, búsqueda Spotlight reforzada con Gemini y una app standalone con historial y upload.

TechCrunch AI29 may

Microsoft MAI-Image-2.5 empata con Nano Banana 2 en Arena

El nuevo modelo de Microsoft sube al tercer puesto del leaderboard text-to-image de Arena con mejoras claras en renderizado de texto y visuales comerciales, aún detrás de OpenAI Image-2.

The Decoder29 may

StepFun lanza Step 3.7 Flash, VLM MoE de 198B en NVIDIA

El modelo Mixture-of-Experts con 11B parámetros activos, contexto 256K y entrada multimodal nativa corre en NVIDIA NIM, TensorRT-LLM, vLLM y SGLang.

NVIDIA Developer29 may

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

De ScheduleStream a SEAL: las nuevas piezas que NVIDIA Research presentó en la conferencia ICRA buscan robots que generalicen y se adapten fuera del laboratorio.

NVIDIA Blog29 may

Anthropic lanza Claude Opus 4.8 con Dynamic Workflows

El nuevo modelo llega solo 41 dias despues de Opus 4.7 y suma una herramienta en research preview para coordinar cientos de subagentes dentro de Claude Code.

TechCrunch AI29 may

NVIDIA gastará USD 150 mil millones al año en Taiwán

Jensen Huang reveló en Taipei que la cuenta anual con proveedores liderados por TSMC pasó de USD 10-15 mil millones hace tres años a 150 mil millones, y anunció cuadruplicar el personal local a 4.000.

The Decoder29 may

Google I/O 2026: 12 anuncios clave en Gemini, Search y XR

Gemini Omni para video generativo, Gemini 3.5 Flash con foco en agentes, agentes de información en Search, Daily Brief, anteojos Android XR y expansión de SynthID marcaron la keynote.

Google AI Blog29 may

ESMFold2: BioHub abre 1,1B de estructuras de proteínas bajo MIT

El equipo de Alex Rives, ahora en BioHub, lanzó la segunda generación de ESMFold con state of the art en interacciones de anticuerpos y un atlas de 6.800 millones de secuencias bajo licencia MIT.

Latent Space28 may

TRL: delta sync baja 1,2 GB a 35 MB por step en RL asincrónico

Hugging Face liberó un PR en TRL que codifica solo los pesos que cambiaron como safetensors disperso y los sube a un Hub Bucket. El trainer y el rollout dejan de necesitar el mismo data center.

Hugging Face28 may

NVIDIA CompileIQ: auto-tuning evolutivo para kernels CUDA

El framework integrado en CUDA 13.3 usa algoritmos genéticos para optimizar el compilador GPU por workload, en vez de aplicar heurísticas universales.

NVIDIA Developer28 may

CrowdStrike y Google desactivan botnet contra devs OSS

La operación contra Glassworm cortó cuatro canales C2 que usaban Solana, BitTorrent, Google Calendar y VPS para envenenar más de 300 repositorios en GitHub.

TechCrunch28 may

Reachy Mini ahora conversa 100% offline con tu hardware

Hugging Face publicó el stack speech-to-speech cascade con Silero, Parakeet-TDT, Qwen3-TTS y llama.cpp para correr el robot sin enviar audio a la nube.

Hugging Face28 may

Blackwell HGX B200 marca récord STAC-AI en finanzas

El benchmark STAC-AI LANG6 con Llama 3.1 8B y 70B muestra hasta 2,8x más rendimiento por GPU frente a Hopper en cargas de inferencia con documentos EDGAR.

NVIDIA Developer28 may

PyTorch Compile y kernel fusion: hasta 10x más rápido

El compilador Inductor agrupa operaciones dependientes en un solo kernel Triton, eliminando lanzamientos extra y tráfico de memoria intermedio.

PyTorch Blog28 may

TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU

El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.

PyTorch Blog28 may

ITBench-AA: ningun frontier LLM supera 50% en tareas SRE

El primer benchmark IBM-Artificial Analysis para agentes en operaciones IT de empresa coloca a Claude Opus 4.7 al frente con 47%, seguido por GPT-5.5 con 46% y Qwen3.7 Max con 42%.

Hugging Face28 may

NVIDIA Dynamo Snapshot: arranque 21x mas rapido en Kubernetes

El sistema con CRIU mas cuda-checkpoint baja el cold-start de un gpt-oss-120b al limite fisico de memoria, evitando que GPUs facturadas queden ociosas durante el scale-up.

NVIDIA Developer28 may

Una semana grabando tareas domésticas para entrenar humanoides

Cocinar, lavar ropa y ordenar pueden convertirse en datos para entrenar a los robots del futuro, si el lector está preparado para las consecuencias del nuevo gig work en primera persona.

Wired27 may

CUDA Tile llega a C++: kernels GPU sin gestionar hilos

Con CUDA 13.3, NVIDIA habilita el modelo de programación por tiles en C++ y promete que el compilador se haga cargo de la paralelización, los tensor cores y el movimiento de memoria.

NVIDIA Developer27 may

Pichai habla con The Verge sobre IA, el futuro de la búsqueda y la web

El CEO de Google y Alphabet conversó con Nilay Patel tras Google I/O 2026 sobre Gemini, los agentes, Google Zero y el camino a la AGI.

The Verge27 may