Saltar al contenido
Etiqueta

#ibm

3 notas publicadas

ITBench-AA: ningun frontier LLM supera 50% en tareas SRE
IA

ITBench-AA: ningun frontier LLM supera 50% en tareas SRE

El primer benchmark IBM-Artificial Analysis para agentes en operaciones IT de empresa coloca a Claude Opus 4.7 al frente con 47%, seguido por GPT-5.5 con 46% y Qwen3.7 Max con 42%.

Hugging Face

Etiquetas relacionadas

Otros temas que aparecen junto a #ibm en nuestra cobertura editorial.