Fable apagado: cómo EEUU bloqueó la IA de Anthropic

TL;DR:

El 12 de junio de 2026, el Departamento de Comercio de EEUU ordenó a Anthropic suspender el acceso a Claude Fable 5 y Mythos 5, solo tres días después de su lanzamiento.
El pretexto oficial fue una vulnerabilidad de "jailbreak" —pero el conflicto real lleva 18 meses: Anthropic se negó a ayudar al Pentágono con armas autónomas y vigilancia masiva de ciudadanos.
Por primera vez en la historia, un gobierno bloqueó un modelo de IA de frontera mediante controles de exportación, creando un precedente global de consecuencias impredecibles.

El apagón que nadie esperaba

A las 5:21 de la tarde del viernes 12 de junio de 2026, Dario Amodei, CEO de Anthropic, recibió una carta del Secretario de Comercio de Estados Unidos, Howard Lutnick. Era tajante.

La carta ordenaba suspender, de forma inmediata, el acceso a los dos modelos más avanzados de la compañía —Claude Fable 5 y Claude Mythos 5— para cualquier "persona extranjera", ya sea dentro o fuera del territorio estadounidense. Eso incluía a los propios empleados extranjeros de Anthropic.

Solo habían pasado 72 horas desde el lanzamiento de Fable 5.

La única forma práctica de cumplir la orden era deshabilitar los modelos por completo para todos los usuarios del planeta. Lo que Anthropic describió como una medida "draconiana" fue ejecutada en horas. Millones de usuarios —empresas, investigadores, desarrolladores de todo el mundo— se encontraron con un mensaje de error donde antes había un modelo de inteligencia artificial de vanguardia.

Era la primera vez en la historia que un gobierno bloqueaba un modelo de IA de frontera mediante controles de exportación.

Fable 5 y Mythos 5: qué se apagó exactamente

Para entender la magnitud del evento, hay que distinguir claramente los dos modelos suspendidos —algo que la cobertura mediática confundió repetidamente.

Claude Mythos 5 es el modelo "fundacional" o "desnudo". Anthropic lo describió como extremadamente competente en ciberseguridad ofensiva —tan capaz que en abril de 2026 la propia compañía advirtió que era "demasiado bueno para piratear sistemas" para ser lanzado al público general. Solo estuvo disponible para un grupo selecto de corporaciones tecnológicas estadounidenses a través del programa Project Glasswing, diseñado para que esas empresas detectaran y parchearan vulnerabilidades en sus propios sistemas críticos. Una herramienta defensiva que resultó demasiado afilada para manos no supervisadas.

Claude Fable 5 fue el producto comercial. Lanzado el 9 de junio, utiliza el mismo motor que Mythos pero con "salvaguardas" —guardrails— que bloquean activamente los prompts que intenten explotar sus capacidades ofensivas. En promedio, estos filtros se activan en menos del 5% de las sesiones. Cuando detectan una solicitud relacionada con ciberseguridad ofensiva, química peligrosa o extracción de capacidades internas, la consulta es redirigida automáticamente a Claude Opus 4.8, un modelo menos potente.

Anthropic invirtió miles de horas en pruebas internas y externas —incluyendo agencias de EEUU y Reino Unido— para validar esas salvaguardas. Nunca encontraron un "jailbreak universal". Pero admitieron algo que se convertiría en munición política: "la resistencia perfecta al jailbreak probablemente no es alcanzable para ningún proveedor actual".

Ahí estaba la grieta. Y alguien decidió usarla.

El detonante oficial: el jailbreak que nadie puede verificar

El gobierno de EEUU no proporcionó detalles técnicos públicos sobre su directiva. Pero Anthropic dedujo, con base en comunicaciones previas, que la orden se basó en la existencia de un método de evasión de las salvaguardas de Fable 5.

Existen dos versiones de los hechos.

La versión del gobierno, representada por el exasesor David Sacks, es que EEUU encontró evidencia de una vulnerabilidad real, informó a Anthropic, pidió que la corrigiera o retirara el modelo, y Anthropic se negó. En redes sociales, Sacks lo resumió directamente: "el gobierno dijo que arreglaran el problema, y ellos dijeron que no".

La versión de Anthropic es más matizada. La empresa reconoce que existían vulnerabilidades menores, pero sostiene que eran conocidas y que otros modelos —incluyendo GPT-5.5 de OpenAI— podían identificar la misma información sin necesidad de técnicas especiales. Según Anthropic, lo que el gobierno presentó como evidencia fue una "demostración verbal" de un jailbreak "estrecho y no universal", y ese hallazgo no justificaba retirar un producto ya en el mercado.

La situación se complicó por un factor adicional: en menos de 48 horas del lanzamiento, un investigador conocido como Pliny the Liberator publicó en GitHub y en X (Twitter) el system prompt completo de Fable 5. Aunque no está claro cómo usar esa información para un ciberataque masivo, expuso la arquitectura interna de seguridad del modelo ante cualquier actor con malas intenciones.

Y hay un tercer actor en la ecuación que conviene no ignorar: Amazon. Según información surgida durante el conflicto, Anthropic sugirió que la investigación que alarmó al gobierno provino de ingenieros de Amazon —que es, paradójicamente, tanto un inversor masivo en Anthropic como un rival comercial directo, con su propio modelo de IA llamado Nova. Un conflicto de intereses que el gobierno pareció decidido a no examinar.

La historia detrás: 18 meses de guerra silenciosa

El apagón de junio de 2026 no fue un incidente aislado. Fue la culminación de un conflicto que comenzó a principios de 2025 entre Anthropic y la administración Trump.

La campaña contra la "IA Woke"

Desde el regreso de Trump a la Casa Blanca, los funcionarios comenzaron a atacar a Anthropic en términos culturales y políticos. Claude fue etiquetado públicamente como "IA Woke" —código político para una IA que se niega a cumplir ciertas órdenes por razones éticas. El CEO Dario Amodei fue calificado de "lunático ideológico" por miembros del gabinete.

Esta animadversión no era retórica vacía. Tenía consecuencias prácticas y medibles.

El ultimátum del Pentágono: armas autónomas o nada

El choque más agudo antes de junio ocurrió cuando el Departamento de Defensa intentó incorporar los modelos de Anthropic a sus operaciones. Las negociaciones colapsaron por dos líneas rojas que Anthropic se negó a cruzar:

Vigilancia doméstica masiva de ciudadanos estadounidenses sin supervisión independiente.
Sistemas de armas totalmente autónomos —drones y robots militares capaces de decidir matar sin intervención humana en el proceso.

Anthropic publicó un comunicado formal rechazando estos usos. La respuesta del gobierno fue inmediata y calculada.

A principios de marzo de 2026, el Secretario de Defensa Pete Hegseth designó a Anthropic como "Supply Chain Risk" —riesgo en la cadena de suministro. Es una etiqueta habitualmente reservada para adversarios extranjeros o para empresas que instalan malware en sistemas críticos. Nunca antes había sido aplicada a una empresa tecnológica estadounidense.

La consecuencia práctica era clara: los contratistas militares quedaban obligados a dejar de usar Claude. Anthropic se convirtió en la primera compañía estadounidense en ser designada riesgo nacional —un honor dudoso que ninguna empresa de Silicon Valley habría querido.

La reacción judicial: el gobierno pierde en los tribunales

Anthropic demandó al gobierno federal. Y ganó, al menos temporalmente.

El 26 de marzo de 2026, la jueza federal Rita Lin bloqueó la designación de "riesgo de suministro" mediante una orden preliminar, calificando las acciones del Pentágono como un intento de "castigar a Anthropic por su discurso". La jueza señaló además que el gobierno había operado bajo el principio de "tweet primero, abogado después", priorizando las redes sociales sobre los procedimientos legales establecidos.

El fallo era una victoria legal para Anthropic. Pero la guerra política continuó.

La confesión involuntaria

La ironía mayor llegó en forma de confesión: el propio presidente Trump admitió que el Pentágono necesitaría seis meses para dejar de usar la IA de Anthropic sin dañar sus operaciones militares.

El gobierno que había etiquetado a Anthropic como amenaza nacional dependía de ella para funcionar. Los servicios de inteligencia y defensa habían usado activamente Claude durante todo 2025 —según documentos judiciales— sin ninguna queja registrada.

La doble moral de Washington

El patrón que emerge de la documentación disponible describe una contradicción sistemática.

Por un lado, la administración acusó a Anthropic de producir "IA Woke", rechazó sus contratos por negarse a eliminar salvaguardas éticas, la etiquetó como riesgo nacional y, finalmente, ordenó apagar sus modelos más avanzados.

Por otro lado, los servicios de inteligencia de EEUU usaron Claude activamente durante todo 2025. La CIO del Departamento de Defensa escribió en X que "algunas cosas son más importantes que los ingresos... America First", mientras que internamente reconocían que Claude era indispensable para sus operaciones.

Y cuando el Pentágono presionó para eliminar las restricciones sobre armas autónomas y vigilancia masiva, no lo hizo por preocupación genuina por la seguridad ciudadana. Lo hizo porque quería acceso irrestricto a la tecnología más poderosa disponible —sin condiciones éticas de ningún tipo.

Nótese también lo que no ocurrió: GPT-5.5 de OpenAI, que ofrece capacidades comparables, no recibió ninguna sanción. La diferencia entre OpenAI y Anthropic en este conflicto no es técnica —es política.

La pregunta central: ¿miedo o represalia?

Evaluar la evidencia disponible obliga a una conclusión matizada.

La causa regulatoria/seguridad nacional es real: la directiva fue firmada por el Secretario de Comercio, se apoya en la Export Control Reform Act de 2018, y existe un precedente normativo para controlar tecnología dual que pueda ser usada como arma cibernética. Esta es la causa primaria con mayor probabilidad (~80-90%).

La causa técnica (el jailbreak) tiene una probabilidad moderada (~50%). Había vulnerabilidades menores —eso nadie lo niega. El gobierno las conoció, actuó. Pero la gravedad real de esas vulnerabilidades es disputada, y el hecho de que modelos comparables de la competencia no recibieran el mismo tratamiento sugiere que el jailbreak fue el pretexto, no la razón.

La causa política —represalia por el rechazo al Pentágono, consecuencia de la guerra cultural contra la "IA Woke", posible influencia de Amazon como competidor— tiene evidencia circunstancial pero consistente, y explica por qué Anthropic fue el objetivo y no OpenAI o Google.

La respuesta más honesta es: ambas cosas. El jailbreak abrió la ventana legal. La política preexistente decidió saltar por ella.

Las consecuencias globales: la cortina de hierro de la IA

Lo que hizo el gobierno de EEUU tiene consecuencias que trascienden a Anthropic y al ciclo de noticias de la semana.

Por primera vez en la historia, un modelo de software no está disponible para ingenieros en India, Europa, Asia o Latinoamérica simplemente por su nacionalidad. Los propios empleados extranjeros de Anthropic —muchos de ellos investigadores de primer nivel mundial— quedaron excluidos de acceder a los modelos que ayudaron a construir.

Savinder Puri, de Zensar Technologies, lo describió con precisión: "La tecnología era accesible democráticamente. Hoy ya no lo es".

Los riesgos que introduce esta decisión son concretos y medibles:

Fuga de talento: Los mejores ingenieros de IA a nivel mundial no son, en su mayoría, ciudadanos estadounidenses. Si EEUU impone restricciones de acceso por nacionalidad, corre el riesgo de empujar ese talento hacia jurisdicciones menos restrictivas —o directamente hacia China, que no tiene este tipo de escrúpulos.

Fragmentación de internet: Esta decisión establece el primer precedente real de lo que ya se conoce como la "AI Iron Curtain" —una cortina de hierro tecnológica que divide el acceso a la IA de frontera según criterios geopolíticos, no técnicos.

Incertidumbre para inversores: Anthropic busca una OPV valorada en más de un billón de dólares. No poder lanzar productos al mercado global —o tener que retirarlos a los tres días del lanzamiento— cuestiona esa valoración y cualquier modelo de negocio construido sobre escala internacional.

Precedente constitucional: La jueza Rita Lin ya advirtió que el gobierno podría estar violando la Primera Enmienda al castigar a Anthropic por su postura ideológica. Si este precedente se consolida, afectará a cualquier empresa tecnológica que se niegue a colaborar con demandas gubernamentales que considere éticamente inaceptables.

Puedes profundizar en los riesgos técnicos concretos de estos modelos en nuestro análisis sobre los riesgos de seguridad en agentes de IA de código, y entender mejor el contexto de por qué Mythos fue diseñado como fue en nuestra cobertura previa sobre Claude Mythos y la potencia que asusta.

El problema de fondo: nadie controla del todo estas herramientas

Hay una verdad incómoda que subyace a todo este conflicto.

El economista de Oxford Maximilian Kasy la formuló con claridad: los modelos de lenguaje grande funcionan mejor de lo que "deberían", y los propios científicos que los construyen no comprenden completamente por qué. Los modelos tienen miles de millones de parámetros que interactúan de formas impredecibles. No es ingeniería clásica —es alquimia sofisticada que funciona por prueba y error, no por teoría completa.

Si ni siquiera Anthropic puede garantizar al 100% que no existe un jailbreak para Fable 5 —porque no comprende del todo la emergencia cognitiva de su propio modelo— la pregunta inevitable es: ¿cómo puede el gobierno certificar que es seguro o inseguro?

La directiva de junio es, en este sentido, una admisión implícita de algo que Washington prefiere no decir en voz alta: que el Estado no confía en que las empresas privadas —ni en ellos mismos— sepan controlar lo que han creado.

Nuestra opinión: un choque de soberanías, no de seguridad

El apagón de Fable no es una historia sobre un error técnico. Es una historia sobre quién tiene el poder de decidir cómo se usa la IA más poderosa del mundo.

Anthropic construyó su empresa sobre una propuesta ética explícita: la IA Constitucional. Sus modelos tienen límites porque sus fundadores —muchos de ellos ex investigadores de OpenAI que salieron precisamente por preocupaciones sobre seguridad y alineamiento— creen genuinamente que los límites son necesarios para que la tecnología sea beneficiosa a largo plazo.

La administración Trump construyó una propuesta política igualmente explícita: la supremacía tecnológica y militar de EEUU no puede verse frenada por los escrúpulos éticos de una empresa privada. Si el modelo más poderoso del mundo puede hackear sistemas enemigos, el Estado quiere acceso a esa capacidad —sin mediación ética.

El problema es que ambas posiciones son, en cierta medida, comprensibles. Un modelo con capacidad ofensiva de ciberseguridad en manos de actores maliciosos representa un riesgo real. Y una empresa que se niega a colaborar con el gobierno de defensa de su propio país navega en aguas políticamente tormentosas.

Pero el contexto importa enormemente. El gobierno que presionó a Anthropic para eliminar salvaguardas sobre armas autónomas y vigilancia masiva, que la etiquetó como riesgo nacional cuando se negó, y que luego confesó depender de ella para sus operaciones militares, no tiene credibilidad moral para argumentar que el apagón de Fable fue puramente por seguridad.

La evidencia disponible —los 18 meses de conflicto previo, el tratamiento diferencial respecto a OpenAI, el papel de Amazon, la confesión sobre la dependencia del Pentágono— sugiere que el jailbreak fue la ventana legal. La represalia política, la mano que la abrió.

Lo que queda después del apagón es una pregunta sin respuesta fácil: ¿puede la IA más poderosa del mundo ser desarrollada con principios éticos cuando el Estado que la alberga exige lo contrario?

La historia de Anthropic en 2026 no tiene un héroe nítido ni una solución simple. Tiene, en cambio, la textura de todos los grandes conflictos tecnológicos de la historia: el momento en que la herramienta se vuelve tan poderosa que los viejos equilibrios de poder ya no alcanzan para contenerla.

Fuentes

Tincho Fuentes — Periodista tecnológico e investigador 🚀