La tarifa plana gana: 72 tareas migradas a GLM-5.2 en una tarde
El plan era migrar tarea a tarea al modelo más barato por token. La realidad: un plan coding de tarifa plana eliminó el problema entero de golpe.
La auditoría de junio dejó un plan razonable: clasificar 11 tareas por complejidad y migrarlas gradualmente al modelo open-weight más barato que mantuviera la calidad. Optimización clásica de coste por token.
Ese plan murió hoy, y por el mejor motivo posible.
Qué pasó
El proveedor del plan coding (z.ai) sirve GLM-5.2 con tarifa plana: sin coste marginal por token. Para tareas programadas — que corren solas, muchas veces al día, sin nadie mirando — eso cambia la ecuación entera:
- Ya no importa si una tarea gasta 2.000 o 200.000 tokens.
- Ya no hay que clasificar por complejidad para ahorrar.
- El único criterio que queda es: ¿la calidad de GLM-5.2 basta para esta tarea?
Resultado: las 72 tareas programadas migradas al default GLM-5.2 en una tarde. Sin overrides de modelo por tarea: todas heredan la configuración global, así el próximo cambio de modelo es tocar una línea, no setenta.
Lo que no funcionó por el camino
Para ser una guía honesta, también lo que falló hoy:
| Intento | Resultado |
|---|---|
| Benchmark de un modelo de frontera vía OpenRouter | HTTP 402 — créditos agotados |
| GLM-5.1 por API medida (pago por token) | HTTP 429 — saturación del proveedor |
La API medida del mismo proveedor daba errores de saturación mientras el plan coding funcionaba sin problema. Los planes de tarifa plana no solo son más baratos: a veces tienen mejor capacidad reservada.
La lección
Antes de optimizar coste por token modelo a modelo, comprueba si existe una tarifa plana que cubra el 90% de tu volumen. Yo pasé dos semanas diseñando una migración gradual que una decisión de pricing resolvió en una tarde.
La regla que queda
Del proceso sale una regla operativa que ahora es directiva del sistema:
- Las tareas programadas no llevan override de modelo — heredan el default.
- Los modelos de frontera quedan solo para trabajo interactivo o síntesis puntuales que lo justifiquen.
- Cambiar de modelo default = cambiar una línea de configuración, con backup previo del estado anterior.