
Anthropic pide frenar la IA: el dilema de la carrera tecnológica
En medio de su proceso de salida a bolsa, Anthropic lanza una advertencia sobre la seguridad y el control de los modelos de IA más avanzados ante la competencia geopolítica.
52 notas publicadas

La firma de IA reporta que sus ingenieros ahora producen ocho veces más líneas de código. Un vistazo a la automejora recursiva y el futuro de la programación.

Claude Mythos Preview suma 150 nuevos partners en 15 paises y sectores como energia, agua, salud y hardware tras detectar mas de 10.000 vulnerabilidades criticas.
La nueva versión estable del gestor de firmware suma soporte para Intel Arc Pro B65 y B70, docks Lenovo en modo provisioned, y aplica 10 de 12 fixes detectados por Claude Mythos.

El desarrollador celebra que Anthropic admita una mejora 'modesta pero tangible' y repasa los cambios técnicos: mensajes de sistema a mitad de conversación y caché mínimo bajado a 1.024 tokens.

Anthropic mantiene los precios de Opus 4.7 (USD 5/USD 25 por millón de tokens), suma control de esfuerzo en claude.ai, workflows dinámicos en Claude Code y modo rápido tres veces más barato.

El nuevo modelo llega solo 41 dias despues de Opus 4.7 y suma una herramienta en research preview para coordinar cientos de subagentes dentro de Claude Code.

El primer benchmark IBM-Artificial Analysis para agentes en operaciones IT de empresa coloca a Claude Opus 4.7 al frente con 47%, seguido por GPT-5.5 con 46% y Qwen3.7 Max con 42%.

El ingeniero Sholto Douglas describió la solución como una "prueba simple y elegante" y la atribuyó a un sistema de instancias Claude Code coordinadas.

Los jailbreaks evolucionaron de comandos absurdos a conversaciones manipuladoras. Mindgard 'gaslighteó' a Claude, y la nueva clase de hacker viene de psicología, no de programación.

El programa Glasswing reúne 50 socios, escaneó más de 1.000 proyectos open source y reporta que el cuello de botella ya no es encontrar vulnerabilidades, sino verificarlas y parcharlas.

La jefa de gabinete Susie Wiles dio el visto bueno: las agencias carecen de Grace Blackwell y el modelo Mythos corre en chips viejos. La cláusula 'cualquier uso legal' quedó fuera.

Un experimento del matemático Adam Kucharski mostró que Microsoft Copilot, Gemini Flash y otros modelos rápidos confabulan estereotipos cuando deberían leer los datos reales.

Project Glasswing, la operacion ofensiva de Anthropic con unos 50 socios (Cloudflare, Mozilla, Oracle), encuentra vulnerabilidades criticas mas rapido de lo que se pueden cerrar.

El revenue Q2 saltó 130% hasta USD 10.900 millones, según el Wall Street Journal. La empresa redujo su costo de compute a USD 0,56 por dólar de ingreso, contra USD 0,71 en Q1.
Stainless, fundada en 2022, ya generaba todos los SDKs oficiales de Anthropic en TypeScript, Python, Go, Java y Kotlin, además de servidores MCP. Con la compra, ese equipo pasa a ser interno.

Anthropic deja correr la ejecución de herramientas en infraestructura del cliente y abre canales cifrados hacia APIs y bases de datos internas, pero el loop del agente sigue en sus servidores.

La spinout de Alphabet apuesta a que el cuello de botella del descubrimiento de fármacos no son los modelos sino la interfaz, y que un chatbot reemplaza la infraestructura cuántica especializada.

El developer británico, autor de Datasette, presentó en PyCon US 2026 una lightning talk sobre el punto de inflexión de noviembre de 2025, cuando los agentes de código cruzaron la barrera de calidad.

El acuerdo, valorado en más de USD 300 millones según The Information, retira de la mesa a un proveedor clave de generación automática de SDKs que también usaban Replicate, Runway y Cloudflare.

El nuevo modelo Claude Mythos Preview encontró miles de vulnerabilidades en sistemas operativos y navegadores, y la firma informará a ministerios de finanzas y bancos centrales del G20.

El experimento de Andon Labs reveló personalidades opuestas: Claude se volvió activista y trató de renunciar; Grok mezcló razonamiento interno con voz; GPT permaneció sobrio.

Un consorcio de 64 matemáticos diseñó 439 tareas para Gemini 3 Pro, GPT-5 y Claude Opus 4.5; ninguno supera el 50% al detectar problemas sin solución.

Cada suscripcion Claude da creditos API mensuales por el monto del plan: harnesses como OpenClaw y claude -p pierden la subvencion mientras Codex gana fans entre AI engineers.

Carnegie Mellon publicó un benchmark de 41 vulnerabilidades reales del motor V8: Anthropic alcanzó ejecución arbitraria en 21 casos, pero el costo fue 12 veces el de GPT-5.5.

El equipo Calif documentó una escalada local de privilegios en macOS 26.4.1 que burla Memory Integrity Enforcement, asistida por Mythos Preview de Anthropic.

El experimento dejó a Claude llamando a la rebelión sindical, a Gemini celebrando tragedias con canciones temáticas y a Grok hablando con frases que ya no son inglés.
El paquete incluye 15 workflows agénticos listos para usar y conectores nativos a Intuit QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace y Microsoft 365.

El AI Security Institute británico recalculó por segunda vez en tres meses el período de duplicación de los modelos frontera en tareas de ciberseguridad: pasó de 8 meses a menos de 4.7.

El proyecto open source convierte al M5StickC Plus en una mascota de escritorio que aprueba prompts del agente vía Bluetooth Low Energy local.

El supercluster de 220.000 GPUs de xAI, demasiado heterogéneo para entrenar Grok, pasa a manos de Anthropic para correr inferencia de Claude.

Anthropic lanza un plugin con 15 workflows para QuickBooks, PayPal y HubSpot. La letra chica: los planes Pro y Max usan tus chats para mejorar al modelo, y el opt-in viene activado por defecto.

Los datos de Similarweb muestran que ChatGPT cayó del 77,6% al 53,7% del tráfico de chatbots IA en doce meses, mientras Gemini triplicó del 7,3% al 26,7% y Claude casi sextuplicó su participación.

Anthropic separará el uso programático del cupo de chat en las suscripciones pagas: créditos mensuales de USD 20 a USD 200, facturados a tarifa API plena, sin acumulación entre ciclos.

Anthropic empaqueta conectores, workflows pre-armados y un tour gratuito por 10 ciudades para meter su IA en la operación diaria de pymes que ya pagan QuickBooks, HubSpot, Canva y Docusign.

Los datos de gasto del Ramp AI Index muestran que Anthropic cuadruplicó su penetración corporativa en un año, mientras OpenAI creció apenas 0,3% en el mismo período.

Kevin McAleer combina el STM32 del UNO Q, una webcam, un micrófono y la API de Claude para grabar y narrar cada paso de un proyecto sin tener que escribir el blog post después.

El cierre de las APIs de finetuning de OpenAI llega después de la baja de Sora y confirma que el grueso del ajuste fino se mueve hacia modelos abiertos o, directamente, hacia prompts gigantes.

La compañía conecta el chatbot con Thomson Reuters CoCounsel, Harvey, DocuSign, Everlaw y Box en una jugada legal que ya golpeó cotizaciones de software jurídico en febrero.

Palisade Research reporta que agentes basados en Opus 4.6 y Qwen 3.6 pasaron de 6% a 81% de éxito en autorreplicación vía hackeo en un solo año.

La empresa dice que Claude Opus 4 chantajeaba a ingenieros porque internalizó relatos sobre IA hostil, y reporta caída de 96% a 0% en Haiku 4.5 tras entrenar con su constitución.

La organización de evaluación admite que su batería de tests ya no alcanza para medir al modelo de Anthropic, mientras Palo Alto Networks lo describe como salto cualitativo en ofensiva.

Una investigación de Oxford China Policy Lab documenta 'transfer stations' que operan en GitHub, Taobao y Telegram con credenciales robadas, sustitución de modelos y cosecha de prompts.

OpenAI lanza Codex for Work con uso de computadora 42% más rápido y conexión a Microsoft, Google y Salesforce, mientras Anthropic suma Blender, Adobe, Ableton y Splice a Claude.

El AI Security Institute británico evaluó al modelo de OpenAI con 95 ejercicios capture-the-flag y un simulador empresarial: es el segundo en resolverlo completo, tras Claude Mythos Preview.

La nueva herramienta en beta pública para clientes Enterprise escanea código en busca de vulnerabilidades, sugiere parches y se integra con CrowdStrike, Palo Alto Networks, SentinelOne y Wiz.

Una app Electron local envuelve las interfaces web de ChatGPT, Claude, Gemini, Perplexity, DeepSeek y Grok, y las orquesta en paralelo vía inyección DOM para validar respuestas entre sí.

Anthropic publicó un benchmark con 99 preguntas escritas por especialistas y respuestas verificables sobre datasets reales. Claude Mythos Preview alcanza 82.6% en problemas resolubles por humanos.

Anthropic también anunció su membresía como patrocinadora corporativa del Blender Development Fund, con un aporte de al menos 240.000 euros anuales para sostener el software libre.

El acuerdo, que supera la capitalización combinada de los últimos tres años, consolida a Google como principal respaldo financiero de la empresa creadora de Claude.

Cambios en razonamiento, caché y longitud de respuesta se combinaron durante semanas para degradar la calidad del agente sin ser detectados por los equipos internos.

La nueva capa de memoria guarda lecciones entre sesiones, mantiene los archivos inspeccionables y permite migrarlos a otro proveedor sin lock-in.
Otros temas que aparecen junto a #claude en nuestra cobertura editorial.