Los relatos de la IA se rompieron desde adentro
Cuatro veces esta semana, las partes más comprometidas con un relato sobre la IA actuaron en su contra. El director ejecutivo de OpenAI dijo que su pronóstico sobre el reemplazo del trabajo de oficina estuvo "bastante errado". Un agente autónomo de programación llegó al núcleo regulado de Goldman Sachs y la NASA. Google y Nvidia respaldaron la capa de enrutamiento neutral entre laboratorios. Una herramienta gratuita le sacó las barreras de seguridad a los modelos de pesos abiertos de Meta y Google en menos de diez minutos. Cada quiebre vino desde adentro del relato que quebró.
El jefe de OpenAI se desdijo del relato del trabajo de oficina
La lectura defendible durante 24 meses fue que la IA comprimiría primero, y de manera visible, el trabajo de oficina de nivel inicial. La bibliografía era específica: el discurso público repetido de Sam Altman, las proyecciones de Goldman y McKinsey de 2023-24 que ponían en riesgo decenas de millones de empleos administrativos, los recortes que Klarna y Salesforce atribuyeron a la IA, y una hoja de ruta de OpenAI que combinaba capacidad de los modelos con despliegue de agentes. Un operador con experiencia que planificara contrataciones o inversiones de capital para 2026 tomando el calendario de Altman al pie de la letra habría adelgazado sus equipos de analistas junior y precomprado licencias corporativas anticipándose a una curva de reemplazo pronunciada.
En un evento del Commonwealth Bank of Australia en Sídney, el 26 de mayo, Altman dijo que había estado "bastante errado" sobre el ritmo de eliminación del trabajo de oficina, le dijo al público que estaba "encantado de equivocarme" y reconoció que esperaba que a esta altura ya hubiera ocurrido más reemplazo del trabajo administrativo de nivel inicial (según Euronews y el Straits Times, 26 de mayo). El desdicho llegó en el mismo viaje en el que OpenAI le vendía capacidad a empresas australianas. El director ejecutivo de la compañía cuyos productos debían impulsar el reemplazo admite ahora en público que ese reemplazo es más lento de lo que dijo, en la sala de los clientes que compran apostando a lo contrario.
Los operadores cuyos planes para 2026 incorporaron un reemplazo al ritmo de la curva de Altman deberían reajustar dos cosas. Los planes de capital humano que recortaron equipos junior dando por hecho una sustitución inminente por agentes van a quedar cortos de gente cuando esa sustitución no aparezca como estaba pronosticada. Los planes de inversión que justificaron el gasto en plataformas de IA con una aritmética de costo laboral que el propio director ejecutivo del laboratorio acaba de desconocer deberían volver a fundamentarse en ganancias de producción o de ingresos, antes que en reducción de personal. Como argumentamos el 11 de mayo en el reemplazo por IA se volvió específico, el reemplazo nunca fue uniforme; esta semana la empresa que vendía la versión uniforme dejó de sostenerla.
El agente de programación llegó al núcleo regulado
Durante 2025, la lectura defendible sobre los agentes de programación era que apenas pasaban de una demo. Cursor y Copilot servían de complemento; Devin era una pieza de marketing. El cumplimiento normativo, las pistas de auditoría y los ciclos de revisión en industrias reguladas (servicios financieros, aeroespacial, automotriz, banca) mantenían a los agentes autónomos fuera del circuito de producción. Los equipos de compras de las empresas más grandes modelaban la programación con IA como una partida de herramientas para desarrolladores, no como un proveedor que firmara contratos corporativos directos a gran escala. Hace 12 meses, la mirada era que cerrar la brecha entre "asistente útil" e "ingeniero autónomo en el que confía Goldman" llevaría dos o tres años más.
Cognition levantó más de 1000 millones de dólares el 27 de mayo, con una valuación previa al financiamiento de 25.000 millones, en una ronda coliderada por Lux Capital, General Catalyst y 8VC, con Founders Fund y Ribbit Capital en el sindicato (según TechCrunch y The Next Web, 27 de mayo). Los ingresos anualizados pasaron de 37 millones de dólares en mayo de 2025 a 492 millones en mayo de 2026, y la empresa apunta a 1000 millones anualizados este año. Entre los clientes informados figuran Goldman Sachs, Mercedes-Benz, la NASA, Santander y varias dependencias del gobierno de Estados Unidos. Cognition además dijo que cerca del 89 a 90% de su propio código ahora lo escribe Devin. Hace ocho meses la misma compañía valía 10.200 millones después del financiamiento; la valuación más que se duplicó mientras la línea de ingresos se multiplicó por 13.
Los proveedores de herramientas para desarrolladores que venden "IA en tu IDE" como la categoría corporativa deberían releer la lista de clientes: Goldman, la NASA, Mercedes y Santander no compraron un autocompletado más rápido, compraron un agente. Las consultoras que cotizan la adopción de programación con IA como un programa de integración de seis trimestres deberían mirar lo directo que fue Cognition al firmar estos contratos. Los operadores que dirigen sus propias organizaciones de ingeniería deberían poner a prueba la lectura de el reemplazo por IA se volvió específico (el empleo total de programadores se sostuvo mientras crecía la carga de integración) frente a la posibilidad de que sea ahora la capa de integración la que se comprime. Movida: presupuestar contra la compra directa de agentes por parte de tu director de informática; el comité de herramientas para desarrolladores ya no es quien compra.
Google y Nvidia compraron la capa neutral entre laboratorios
Durante dos años, la arquitectura de IA corporativa defendible fue: elegí un laboratorio, integrá su API y construí defensas yendo a fondo con un solo conjunto de tecnologías. Los laboratorios alentaban esto con descuentos por uso, niveles para usuarios avanzados y funciones exclusivas. La distribución pertenecía al laboratorio; el enrutamiento era un problema del lado del cliente que resolvía un equipo de ingeniería. Hace seis meses, la mirada era que las capas de agregación y enrutamiento seguirían siendo infraestructura de nicho para desarrolladores, útil para aficionados que comparaban modelos en paralelo e irrelevante para las compras corporativas. Google, OpenAI y Anthropic eran las plataformas; los agregadores, envoltorios finos.
El 26 de mayo, OpenRouter cerró una Serie B de 113 millones de dólares con una valuación de 1300 millones, liderada por CapitalG (el fondo de crecimiento de Alphabet), con participación de NVentures (el brazo de inversión de Nvidia), Snowflake Ventures, Databricks Ventures, ServiceNow Ventures y MongoDB Ventures, junto con los inversores previos Andreessen Horowitz y Menlo Ventures (según TechCrunch y BusinessWire, 26 de mayo). El volumen semanal de tokens alcanzó los 25 billones, una suba de 5 veces en seis meses, repartido entre más de 400 modelos y cerca de 8 millones de usuarios. La estructura de capital lo dice todo: el propio fondo de crecimiento de Google y el brazo de inversión de Nvidia hoy ocupan un lugar en la mesa de accionistas de la capa que les permite a las empresas esquivarlos, y Snowflake, Databricks, ServiceNow y MongoDB la financian al lado de ellos.
Los laboratorios de frontera cuyo precio corporativo daba por hecho el bloqueo a un solo proveedor deberían rehacer sus modelos frente a una capa de enrutamiento que sus mayores respaldadores ahora financian. Los negocios de envoltorio cuya defensa era "integramos un modelo a fondo" deberían mirar la superficie de 400 modelos de OpenRouter y preguntarse qué agregan que el enrutador no haga. Los equipos de compras de las empresas medianas deberían tratar el enrutamiento multimodelo como la arquitectura por defecto, antes que como una cobertura. Esto afina la lectura de nuestra pieza del 6 de mayo, el modelo no era la ventaja: hasta los propios inversores de los laboratorios hoy monetizan la distancia entre el comprador y el laboratorio.
La seguridad de los pesos abiertos cayó en menos de diez minutos
La posición defendible hace 12 meses sobre la seguridad de la IA de pesos abiertos era que Llama, de Meta, y Gemma, de Google, salían con un entrenamiento de alineación lo bastante serio como para frenar un mal uso real. El comportamiento de rechazo, los ejercicios de red team y las restricciones constitucionales se tomaban como capas de seguridad legítimas, una fricción suficiente para fines de política pública y para las propias fichas de seguridad publicadas por los laboratorios. Los reguladores de la Unión Europea y de Estados Unidos escribieron reglas que se apoyaban en este supuesto. Las empresas que construían sobre pesos abiertos tomaban la postura de seguridad publicada como parte de una garantía heredada. La posición que surgía de las comunicaciones públicas de ambas compañías era que una publicación responsable de pesos abiertos era una vara alcanzable.
El 25 de mayo, el Financial Times, junto con el grupo de investigación en seguridad de IA Alice, publicó una investigación que muestra que una herramienta gratuita de GitHub llamada Heretic le saca la alineación de seguridad a Llama 3.3, de Meta, y a Gemma 3, de Google, en menos de diez minutos en una notebook común, mediante una técnica llamada abliteration (ablación selectiva) que apunta a las vías aisladas de comportamiento de rechazo que crea el entrenamiento de alineación. El autor de la herramienta le dijo al diario que le quitó las barreras a Gemma 4 a los 90 minutos de su publicación. La escala de despliegue citada: cerca de 3500 variantes de modelos intervenidos distribuidas por los repositorios de modelos, con 13 millones de descargas acumuladas. Las respuestas de los modelos modificados incluyen categorías que los originales rechazaban (recetas de armas biológicas, generación de malware, material de abuso sexual infantil).
Los equipos de política de Meta y Google tienen ahora un número publicado y replicado que contradice las afirmaciones de seguridad que vienen haciendo ante los reguladores de Bruselas, Washington y Londres. Las empresas que adoptaron Llama o Gemma sobre la premisa de que estaban "alineados de forma responsable" deberían tratar la ficha de seguridad publicada como marketing, no como control. Las aseguradoras cibernéticas que fijan primas sobre despliegues de pesos abiertos deberían recalcularlas. Como argumentamos en defensibilidad en la era de la IA, las ventajas competitivas sostenibles que duran se construyen en secuencia y se ganan; no se eligen de un menú. Movida: tratar al modelo base de pesos abiertos como materia prima; la capa de seguridad ahora es problema de la organización que lo despliega.
Los cuatro, leídos juntos
Un mismo patrón atraviesa los cuatro. En cada caso, la parte más interesada en mantener vivo el relato anterior (el CEO del laboratorio, la categoría de herramientas para desarrolladores, el laboratorio de modelos, el editor de pesos abiertos) actuó en su contra. Sam Altman desmintió su propio pronóstico laboral frente a clientes que pagan. Cognition se quedó con el núcleo regulado que los proveedores de solo-complemento daban por inalcanzable durante tres años. Google y Nvidia pusieron capital en la capa de enrutamiento que los desintermedia. La postura de seguridad de Meta y Google cayó en menos de diez minutos, con una herramienta de trece millones de descargas. La pregunta del operador para junio es más acotada que de costumbre: por cada relato sobre la IA del que dependa tu plan para 2026, nombrá a la parte que todavía lo defiende de forma activa. Si la respuesta es "las mismas partes que quebraron las historias de esta semana", el plan necesita una segunda fuente.