
Cómo el Proyecto Maven enseñó al ejército de EE.UU. a amar la IA
Un nuevo libro de Katrina Manson revela cómo el Proyecto Maven pasó de analizar imágenes de drones a coordinar más de mil bombardeos en un solo día durante el ataque a Irán.
9 notas publicadas

El nuevo modelo SOTA supera a su predecesor en visión, programación y tareas complejas, manteniendo los precios de API a pesar de su mayor potencia.

La nueva herramienta experimental utiliza el modelo Opus 4.7 para transformar descripciones de texto en prototipos funcionales, presentaciones y sistemas de diseño editables.

El acuerdo, que supera la capitalización combinada de los últimos tres años, consolida a Google como principal respaldo financiero de la empresa creadora de Claude.

Cambios en razonamiento, caché y longitud de respuesta se combinaron durante semanas para degradar la calidad del agente sin ser detectados por los equipos internos.

BankerToolBench evalúa GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro en tareas reales de banca de inversión, y la mitad de los outputs falla incluso como borrador inicial.

La nueva capa de memoria guarda lecciones entre sesiones, mantiene los archivos inspeccionables y permite migrarlos a otro proveedor sin lock-in.

El nuevo modelo insignia de Anthropic mejora drásticamente en tareas de código, pero reduce deliberadamente sus capacidades de ciberseguridad durante el entrenamiento.

A pesar de que el Pentágono clasifica a la empresa como un riesgo de seguridad, la agencia de vigilancia electrónica ya opera Mythos Preview.