Etiqueta

#observabilidad

4 notas publicadas

NVIDIA libera GPU Usage Monitor para clusters Kubernetes

El nuevo stack open source bajo Apache 2.0 integra DCGM Exporter, Prometheus y Grafana en un solo Helm chart para detectar GPUs ociosas y pods Pending en minutos.

NVIDIA Developer23 may

NCCL Inspector con Prometheus: dashboards en vivo para entrenar LLMs

El modo Prometheus de NCCL 2.30 expone métricas GPU-a-GPU como series temporales para Grafana, sin el archivo JSON intermedio que se usaba para análisis offline.

NVIDIA Developer10 may

Agent Shield, capa open source para auditar el tráfico de los agentes

El proyecto, publicado en GitHub, intercepta peticiones HTTP, WebSocket y SSE entre la CLI del agente y la red para frenar fugas de secretos y rutear modelos.

Dev.to AI tag29 abr

InsightFinder recauda USD 15M para detectar fallas en agentes de IA

La plataforma fundada por Helen Gu utiliza machine learning para diagnosticar y prevenir problemas en modelos de IA, combinando datos, infraestructura y agentes.

TechCrunch AI26 abr

Etiquetas relacionadas

Otros temas que aparecen junto a #observabilidad en nuestra cobertura editorial.

#Agentes IA2 #Open Source2 #Nvidia2 #Insightfinder1 #Mlops1 #Machine Learning1 #dlp1 #Coding Agent1