
NVIDIA MCG: model cards automáticas con GPT-OSS-120B
El toolkit Model Card Generator de NVIDIA construye documentación completa en formato Model Card++ a partir del código fuente, con 91% de completitud y 76% de precisión en menos de un minuto.
Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

El toolkit Model Card Generator de NVIDIA construye documentación completa en formato Model Card++ a partir del código fuente, con 91% de completitud y 76% de precisión en menos de un minuto.
Hugging Face abre una serie de tres partes sobre profiling con PyTorch, empezando por matmul más bias en bf16 sobre una NVIDIA A100 80GB.

El nuevo neocloud levantó USD 15 millones a una valuación post-money de USD 60 millones y promete 600 a 700 tokens por segundo, contra los 250 típicos de las GPU.

El GenAI Creators' Fund financia los pilotos producidos en cinco semanas, mientras la plataforma AWS conecta modelos propios y de terceros con Maya, Blender, Nuke y Adobe Suite.

Renders filtrados por Bloomberg muestran la nueva experiencia Siri integrada al Dynamic Island, búsqueda Spotlight reforzada con Gemini y una app standalone con historial y upload.

El nuevo modelo de Microsoft sube al tercer puesto del leaderboard text-to-image de Arena con mejoras claras en renderizado de texto y visuales comerciales, aún detrás de OpenAI Image-2.

El modelo Mixture-of-Experts con 11B parámetros activos, contexto 256K y entrada multimodal nativa corre en NVIDIA NIM, TensorRT-LLM, vLLM y SGLang.

De ScheduleStream a SEAL: las nuevas piezas que NVIDIA Research presentó en la conferencia ICRA buscan robots que generalicen y se adapten fuera del laboratorio.

El nuevo modelo llega solo 41 dias despues de Opus 4.7 y suma una herramienta en research preview para coordinar cientos de subagentes dentro de Claude Code.

Jensen Huang reveló en Taipei que la cuenta anual con proveedores liderados por TSMC pasó de USD 10-15 mil millones hace tres años a 150 mil millones, y anunció cuadruplicar el personal local a 4.000.

Gemini Omni para video generativo, Gemini 3.5 Flash con foco en agentes, agentes de información en Search, Daily Brief, anteojos Android XR y expansión de SynthID marcaron la keynote.

El equipo de Alex Rives, ahora en BioHub, lanzó la segunda generación de ESMFold con state of the art en interacciones de anticuerpos y un atlas de 6.800 millones de secuencias bajo licencia MIT.
Hugging Face liberó un PR en TRL que codifica solo los pesos que cambiaron como safetensors disperso y los sube a un Hub Bucket. El trainer y el rollout dejan de necesitar el mismo data center.

El framework integrado en CUDA 13.3 usa algoritmos genéticos para optimizar el compilador GPU por workload, en vez de aplicar heurísticas universales.

La operación contra Glassworm cortó cuatro canales C2 que usaban Solana, BitTorrent, Google Calendar y VPS para envenenar más de 300 repositorios en GitHub.
Hugging Face publicó el stack speech-to-speech cascade con Silero, Parakeet-TDT, Qwen3-TTS y llama.cpp para correr el robot sin enviar audio a la nube.

El benchmark STAC-AI LANG6 con Llama 3.1 8B y 70B muestra hasta 2,8x más rendimiento por GPU frente a Hopper en cargas de inferencia con documentos EDGAR.

El compilador Inductor agrupa operaciones dependientes en un solo kernel Triton, eliminando lanzamientos extra y tráfico de memoria intermedio.

El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.

El primer benchmark IBM-Artificial Analysis para agentes en operaciones IT de empresa coloca a Claude Opus 4.7 al frente con 47%, seguido por GPT-5.5 con 46% y Qwen3.7 Max con 42%.

El sistema con CRIU mas cuda-checkpoint baja el cold-start de un gpt-oss-120b al limite fisico de memoria, evitando que GPUs facturadas queden ociosas durante el scale-up.

Cocinar, lavar ropa y ordenar pueden convertirse en datos para entrenar a los robots del futuro, si el lector está preparado para las consecuencias del nuevo gig work en primera persona.

Con CUDA 13.3, NVIDIA habilita el modelo de programación por tiles en C++ y promete que el compilador se haga cargo de la paralelización, los tensor cores y el movimiento de memoria.

El CEO de Google y Alphabet conversó con Nilay Patel tras Google I/O 2026 sobre Gemini, los agentes, Google Zero y el camino a la AGI.