Saltar al contenido

IA

Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

560 notas publicadas · Página 8 de 24
NVIDIA MCG: model cards automáticas con GPT-OSS-120B

NVIDIA MCG: model cards automáticas con GPT-OSS-120B

El toolkit Model Card Generator de NVIDIA construye documentación completa en formato Model Card++ a partir del código fuente, con 91% de completitud y 76% de precisión en menos de un minuto.

NVIDIA Developer
torch.profiler explicado: cómo leer trazas en PyTorch desde cero

torch.profiler explicado: cómo leer trazas en PyTorch desde cero

Hugging Face abre una serie de tres partes sobre profiling con PyTorch, empezando por matmul más bias en bf16 sobre una NVIDIA A100 80GB.

Hugging Face
General Compute compra USD 300M en SambaNova SN50 para inferencia

General Compute compra USD 300M en SambaNova SN50 para inferencia

El nuevo neocloud levantó USD 15 millones a una valuación post-money de USD 60 millones y promete 600 a 700 tokens por segundo, contra los 250 típicos de las GPU.

TechCrunch AI
Amazon estrena Project Nara y tres series IA en Prime Video

Amazon estrena Project Nara y tres series IA en Prime Video

El GenAI Creators' Fund financia los pilotos producidos en cinco semanas, mientras la plataforma AWS conecta modelos propios y de terceros con Maya, Blender, Nuke y Adobe Suite.

The Decoder
Apple prepara nueva app Siri y rediseño en iOS 27

Apple prepara nueva app Siri y rediseño en iOS 27

Renders filtrados por Bloomberg muestran la nueva experiencia Siri integrada al Dynamic Island, búsqueda Spotlight reforzada con Gemini y una app standalone con historial y upload.

TechCrunch AI
Microsoft MAI-Image-2.5 empata con Nano Banana 2 en Arena

Microsoft MAI-Image-2.5 empata con Nano Banana 2 en Arena

El nuevo modelo de Microsoft sube al tercer puesto del leaderboard text-to-image de Arena con mejoras claras en renderizado de texto y visuales comerciales, aún detrás de OpenAI Image-2.

The Decoder
StepFun lanza Step 3.7 Flash, VLM MoE de 198B en NVIDIA

StepFun lanza Step 3.7 Flash, VLM MoE de 198B en NVIDIA

El modelo Mixture-of-Experts con 11B parámetros activos, contexto 256K y entrada multimodal nativa corre en NVIDIA NIM, TensorRT-LLM, vLLM y SGLang.

NVIDIA Developer
NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

De ScheduleStream a SEAL: las nuevas piezas que NVIDIA Research presentó en la conferencia ICRA buscan robots que generalicen y se adapten fuera del laboratorio.

NVIDIA Blog
Anthropic lanza Claude Opus 4.8 con Dynamic Workflows

Anthropic lanza Claude Opus 4.8 con Dynamic Workflows

El nuevo modelo llega solo 41 dias despues de Opus 4.7 y suma una herramienta en research preview para coordinar cientos de subagentes dentro de Claude Code.

TechCrunch AI
NVIDIA gastará USD 150 mil millones al año en Taiwán

NVIDIA gastará USD 150 mil millones al año en Taiwán

Jensen Huang reveló en Taipei que la cuenta anual con proveedores liderados por TSMC pasó de USD 10-15 mil millones hace tres años a 150 mil millones, y anunció cuadruplicar el personal local a 4.000.

The Decoder
Google I/O 2026: 12 anuncios clave en Gemini, Search y XR

Google I/O 2026: 12 anuncios clave en Gemini, Search y XR

Gemini Omni para video generativo, Gemini 3.5 Flash con foco en agentes, agentes de información en Search, Daily Brief, anteojos Android XR y expansión de SynthID marcaron la keynote.

Google AI Blog
ESMFold2: BioHub abre 1,1B de estructuras de proteínas bajo MIT

ESMFold2: BioHub abre 1,1B de estructuras de proteínas bajo MIT

El equipo de Alex Rives, ahora en BioHub, lanzó la segunda generación de ESMFold con state of the art en interacciones de anticuerpos y un atlas de 6.800 millones de secuencias bajo licencia MIT.

Latent Space
TRL: delta sync baja 1,2 GB a 35 MB por step en RL asincrónico

TRL: delta sync baja 1,2 GB a 35 MB por step en RL asincrónico

Hugging Face liberó un PR en TRL que codifica solo los pesos que cambiaron como safetensors disperso y los sube a un Hub Bucket. El trainer y el rollout dejan de necesitar el mismo data center.

Hugging Face
NVIDIA CompileIQ: auto-tuning evolutivo para kernels CUDA

NVIDIA CompileIQ: auto-tuning evolutivo para kernels CUDA

El framework integrado en CUDA 13.3 usa algoritmos genéticos para optimizar el compilador GPU por workload, en vez de aplicar heurísticas universales.

NVIDIA Developer
CrowdStrike y Google desactivan botnet contra devs OSS

CrowdStrike y Google desactivan botnet contra devs OSS

La operación contra Glassworm cortó cuatro canales C2 que usaban Solana, BitTorrent, Google Calendar y VPS para envenenar más de 300 repositorios en GitHub.

TechCrunch
Reachy Mini ahora conversa 100% offline con tu hardware

Reachy Mini ahora conversa 100% offline con tu hardware

Hugging Face publicó el stack speech-to-speech cascade con Silero, Parakeet-TDT, Qwen3-TTS y llama.cpp para correr el robot sin enviar audio a la nube.

Hugging Face
Blackwell HGX B200 marca récord STAC-AI en finanzas

Blackwell HGX B200 marca récord STAC-AI en finanzas

El benchmark STAC-AI LANG6 con Llama 3.1 8B y 70B muestra hasta 2,8x más rendimiento por GPU frente a Hopper en cargas de inferencia con documentos EDGAR.

NVIDIA Developer
PyTorch Compile y kernel fusion: hasta 10x más rápido

PyTorch Compile y kernel fusion: hasta 10x más rápido

El compilador Inductor agrupa operaciones dependientes en un solo kernel Triton, eliminando lanzamientos extra y tráfico de memoria intermedio.

PyTorch Blog
TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU

TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU

El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.

PyTorch Blog
ITBench-AA: ningun frontier LLM supera 50% en tareas SRE

ITBench-AA: ningun frontier LLM supera 50% en tareas SRE

El primer benchmark IBM-Artificial Analysis para agentes en operaciones IT de empresa coloca a Claude Opus 4.7 al frente con 47%, seguido por GPT-5.5 con 46% y Qwen3.7 Max con 42%.

Hugging Face
NVIDIA Dynamo Snapshot: arranque 21x mas rapido en Kubernetes

NVIDIA Dynamo Snapshot: arranque 21x mas rapido en Kubernetes

El sistema con CRIU mas cuda-checkpoint baja el cold-start de un gpt-oss-120b al limite fisico de memoria, evitando que GPUs facturadas queden ociosas durante el scale-up.

NVIDIA Developer
Una semana grabando tareas domésticas para entrenar humanoides

Una semana grabando tareas domésticas para entrenar humanoides

Cocinar, lavar ropa y ordenar pueden convertirse en datos para entrenar a los robots del futuro, si el lector está preparado para las consecuencias del nuevo gig work en primera persona.

Wired
CUDA Tile llega a C++: kernels GPU sin gestionar hilos

CUDA Tile llega a C++: kernels GPU sin gestionar hilos

Con CUDA 13.3, NVIDIA habilita el modelo de programación por tiles en C++ y promete que el compilador se haga cargo de la paralelización, los tensor cores y el movimiento de memoria.

NVIDIA Developer
Pichai habla con The Verge sobre IA, el futuro de la búsqueda y la web

Pichai habla con The Verge sobre IA, el futuro de la búsqueda y la web

El CEO de Google y Alphabet conversó con Nilay Patel tras Google I/O 2026 sobre Gemini, los agentes, Google Zero y el camino a la AGI.

The Verge