
IA
ITBench-AA: ningun frontier LLM supera 50% en tareas SRE
El primer benchmark IBM-Artificial Analysis para agentes en operaciones IT de empresa coloca a Claude Opus 4.7 al frente con 47%, seguido por GPT-5.5 con 46% y Qwen3.7 Max con 42%.
Hugging Face