El modelo se volvió un costo real

05 de jun de 2026Lo que la IA rompió

Legal Pricing Defensibilidad Modelos Estrategia

La capa del modelo se está volviendo un commodity que se cobra por uso, y esta semana cuatro empresas reordenaron el valor de sus negocios alrededor de ese hecho. Una herramienta de programación que cobraba una tarifa mensual fija empezó a facturar por token. El mayor financista de un laboratorio de frontera lanzó sus propios modelos para dejar de pagarle a ese laboratorio. Un modelo chino igualó a Occidente en calidad a una fracción del precio. Y los laboratorios mismos empezaron a meterse en el mercado legal que antes le dejaban a otros.

Las herramientas de programación con IA de tarifa plana empezaron a cobrar por uso

Durante tres años, la lectura defendible fue que la asistencia de programación con IA era un costo fijo y previsible. GitHub Copilot vendía licencias de US$10 a US$39 por mes, y los rivales copiaron el modelo. Los líderes de ingeniería presupuestaban las herramientas de IA como cualquier software por puesto: dotación por un precio fijo, proyectable a un año. La promesa de que la IA acelera a cada programador venía con un compromiso implícito: esa productividad estaba incluida en una línea de suscripción estable.

El 1 de junio GitHub retiró el modelo de Premium Request de tarifa plana de Copilot y pasó todos los planes a facturación por uso, midiendo tokens de entrada, de salida y en caché como "AI Credits" a un centavo cada uno, según el anuncio de la propia GitHub ese día. El precio base de cada puesto se mantuvo, pero los usuarios más intensos lo sintieron de inmediato. TechCrunch informó el 30 de mayo que los programadores que corrían sesiones agénticas largas veían facturas multiplicarse por diez o cincuenta, con casos documentados que pasaban de US$50 a US$3.000 por mes. El autocompletado de código siguió siendo gratis; lo que ahora lleva medidor son las corridas autónomas del agente, de varias horas.

Quien haya presupuestado las herramientas de desarrollo con IA como software fijo por puesto debería reabrir el modelo. El costo de un equipo de programación agéntica ahora crece con cuánto trabajan los agentes, ya no con la dotación de personas, y los equipos que se tomaron más al pie de la letra la promesa del "programador diez veces más productivo" son los que el nuevo medidor castiga más fuerte. Los revendedores que marcaban un sobreprecio sobre un puesto fijo se quedaron sin nada para marcar. La jugada para un líder de ingeniería este trimestre: modelá tu decil superior de usuarios agénticos en vez de tu puesto promedio, y tratá la inferencia como un insumo de costo variable, igual que ya tratás la nube.

Microsoft se construyó su propia salida de OpenAI

El supuesto más defendible en la IA corporativa era que la IA de Microsoft es la de OpenAI. Microsoft había puesto más de US$13 mil millones en el laboratorio durante los tres años previos, había cableado sus modelos a través de Azure y había construido Copilot encima de ellos. La lectura para cualquier operador era que la sociedad era el cimiento: si elegías Microsoft, elegías los modelos de OpenAI con el papeleo corporativo alrededor, y Microsoft no tenía motivo para armar su propia infraestructura de frontera.

En su conferencia Build del 2 de junio, Microsoft lanzó siete modelos propios entrenados con datos licenciados comercialmente, sin destilación de los sistemas de OpenAI, según CNBC ese día. El insignia, un modelo de razonamiento llamado MAI-Thinking-1, corre sobre una arquitectura dispersa con una ventana de contexto lo bastante amplia como para leer un documento de 600 páginas de una sola pasada. El director ejecutivo Satya Nadella planteó la lógica como "opcionalidad": la empresa puede correr sus propios modelos en su propia nube, dejar de pagarle a un tercero y trasladar el ahorro a los desarrolladores a medida que sube el precio de los modelos líderes.

Dos grupos deberían prestar atención. Las empresas que se estandarizaron en Azure justamente para garantizarse acceso a modelos de frontera ahora tienen una plataforma cuyo dueño está construyendo activamente sustitutos de aquello por lo que vinieron. Y el laboratorio mismo acaba de ver cómo su mayor distribuidor e inversor lanzaba una alternativa propia y les decía a los desarrolladores que será más barata. La lección de fondo es la que el corpus viene rondando desde el modelo no era la ventaja: un modelo es infraestructura intercambiable. Si la empresa que firmó el cheque más grande a un laboratorio de frontera se está armando su propia salida, dar por permanente a tu proveedor de modelos es la apuesta más arriesgada.

El modelo capaz más barato ahora viene de China

Durante dos años, la cómoda lectura occidental fue que Estados Unidos fijaba los dos números que importan en IA: el piso de precio y el techo de capacidad. Se daba por sentado que los laboratorios chinos estaban faltos de capital, dependían de silicio estadounidense que ya no podían comprar con libertad y venían una generación atrasados en calidad. Un operador que elegía un proveedor de IA podía tratar razonablemente "mejor modelo" y "modelo estadounidense" como la misma decisión, y archivar los lanzamientos chinos de pesos abiertos como copias baratas, aptas para experimentos pero no para producción.

Dos cosas que pasaron esta semana rompen esa lectura. DeepSeek se acercó a su primera ronda de financiamiento externo, de unos US$7.400 millones, financiada casi por completo dentro de China y no por capital occidental, según el South China Morning Post y Reuters el 4 de junio. Su último modelo ahora corre sobre silicio doméstico de Huawei en vez de los chips de Nvidia que las reglas de exportación de EE.UU. ponen cada vez más fuera de alcance. En calidad, la brecha se achica: el modelo de pesos abiertos Kimi K2.6, de Moonshot, hoy figura entre los pocos más potentes del mundo, cerrados o abiertos, mientras que el mejor modelo abierto estadounidense, lanzado esa misma semana, queda detrás, 54 contra 48 en el índice independiente de Artificial Analysis. Estados Unidos conserva una ventaja clara solo en velocidad bruta de inferencia.

Los operadores expuestos son los que apoyan su precio en que los modelos estadounidenses sean a la vez los mejores y la única opción seria. Los laboratorios de EE.UU. que cobran un sobreprecio por escasez ahora quedan por debajo de un modelo abierto capaz a una fracción del precio por token, y ese sobreprecio se volvió a achicar esta semana, algo que ya señalamos cuando el sobreprecio de la IA se redujo. La ventaja de costo funciona también como ventaja de soberanía. La Ley de IA de la Unión Europea entra en plena aplicación el 2 de agosto, y la Comisión Europea aprovechó el 3 de junio para publicar un paquete de soberanía tecnológica que favorece el código abierto y el despliegue en las propias instalaciones. Un modelo barato, capaz y de licencia abierta que corre dentro de tus propias paredes es exactamente lo que hoy quiere una empresa alemana o francesa regulada. La jugada: asumí que hay un modelo casi de frontera disponible a costo marginal casi nulo desde fuera de EE.UU., y revisá los números de cualquier plan que se haya fijado sobre la escasez de los modelos estadounidenses.

Los laboratorios de frontera se quedan con la vertical legal ellos mismos

La visión asentada sobre cómo llegaría la IA a los servicios profesionales era una torta de capas. Los laboratorios de frontera venderían modelos horizontales; una capa de software especializado envolvería esos modelos para cada profesión, de contratos a litigios y cumplimiento, y le vendería el resultado a los estudios; y los laboratorios se mantendrían fuera del negocio de las aplicaciones, porque construir productos verticales implicaba contratar expertos del rubro y hacerse cargo de flujos de trabajo engorrosos que preferían dejarles a sus socios. La tecnología legal, un mercado global de más de US$5 mil millones en 2026, era la vidriera de esa división del trabajo.

Se quebró el 1 de junio, cuando OpenAI lanzó formalmente una vertical legal y contrató a Jason Boehmig para dirigirla, según Artificial Lawyer y Law.com ese día. Boehmig cofundó Ironclad, una de las empresas de contratos con IA más reconocidas, un negocio construido sobre los modelos de OpenAI y a la vez ex cliente de OpenAI; su título declarado es ahora "construir IAG para el derecho". La contratación sigue al lanzamiento por parte de Anthropic de un producto legal dedicado, con socios establecidos de datos jurídicos, y a una movida comparable de Microsoft. El patrón son tres laboratorios de frontera que deciden, con semanas de diferencia entre sí, construir ellos mismos la aplicación legal en vez de venderles las piezas a alguien que la construya.

La parte expuesta es precisa: la capa de software vertical que tomó un modelo de frontera, lo envolvió para una profesión y llamó "ventaja" a ese envoltorio. Cuando el laboratorio puede contratar a tu fundador y reconstruir tu producto con acceso privilegiado al modelo de base, "integramos el mejor modelo para abogados" deja de ser una posición defendible. Es la misma fractura que golpeó a las herramientas para analistas bancarios sobre las que escribimos en el desplazamiento por IA se volvió concreto, que ahora llega al derecho, y alcanzará a cada profesión con ingresos suficientes para interesarle a un laboratorio. La jugada: si tu producto es un envoltorio vertical delgado, tratá al laboratorio como competidor, no como proveedor, y movete hacia los datos propios, el flujo de trabajo regulado y las relaciones con clientes que no puede copiar con facilidad.

Leé las cuatro juntas

Las cuatro fracturas riman. En cada una, un activo antes estratégico, el acceso a un modelo capaz, quedó reordenado hacia commodity: tarifado al programador, construido de manera interna para esquivar la factura, abaratado desde China o salteado por el laboratorio que sube a la vertical de arriba. El acceso crudo a un modelo se está volviendo un servicio básico, y el margen se le está drenando. La ventaja durable, como argumentamos en defensibilidad en la era de la IA, está en la capa que un modelo más barato no puede convertir en commodity: el flujo de trabajo, los datos propios, la estructura de costos, la relación regulada. Para un operador, la pregunta para la segunda mitad de 2026 es directa. En tu propio negocio, ¿qué estás cobrando que una factura por uso, un modelo chino abierto o un laboratorio entrando en tu vertical podría borrar para fin de año? Si la respuesta honesta es "el acceso a un buen modelo", estás vendiendo lo único por lo que el mercado acaba de decidir que no va a seguir pagando un sobreprecio.