Durante dos décadas, el playbook freemium de SaaS fue simple: regala el producto core, cierra los features avanzados detrás de tiers de pago, optimiza el funnel de conversión. El coste marginal de un usuario gratis era negligible. Las matemáticas de conversión podían ser flojas. La mayoría de empresas SaaS exitosas siguieron este playbook.
Los productos AI lo rompen. Como argumentó Vikas Kansal en su análisis en Lenny's Newsletter: "En AI, cada vez que un usuario gratis le da a Enter, tus GPUs disparan y tu efectivo se quema". Los usuarios gratis en AI no son coste marginal cero. Son coste marginal real. El playbook freemium clásico lleva a las empresas AI a la quiebra antes de que la conversión pueda alcanzar.
Por qué el playbook SaaS se rompe para AI
Tres desajustes estructurales:
1. El coste marginal no es cero
Un usuario gratis SaaS te cuesta unos centavos en almacenamiento y bandwidth. Un usuario gratis AI corriendo 50 queries LLM al día te cuesta varios dólares en cómputo. Multiplica por miles de usuarios gratis y el coste es real.
2. El tier gratis se vuelve demasiado capaz
Para atraer usuarios, el tier gratis tiene que ser útil. En SaaS, útil era mensajería gratis o gestión de proyectos básica. En AI, útil significa regalar una capacidad poderosa. Los usuarios obtienen lo que necesitan del tier gratis y nunca sienten la presión de actualizar.
3. El churn es más alto que en SaaS
Las suscripciones AI tienen churn relativamente más alto que el SaaS tradicional. Los usuarios se registran para un caso de uso, obtienen el valor y churnan. Las matemáticas de lifetime value que justificaban el freemium SaaS no aplican.
Los tres pilares de monetización AI que funcionan
Pilar 1: Limita la intensidad de uso
En lugar de limitar features, limita cuánto puede usar el producto el usuario. Esto alinea precio con coste (más uso = más coste GPU = tier más alto).
Ejemplo: Google rediseñó sus ofertas AI en tiers Plus, Pro y Ultra, con cada tier ofreciendo más uso de las mismas capacidades. Los features son similares; el volumen es el diferenciador.
Patrón de implementación:
- Tier gratis: uso suficiente para validar el producto (digamos, 20 queries al día)
- Primer tier de pago: suficiente para uso individual regular (200 queries al día)
- Tier más alto: suficiente para power use o equipo pequeño (2.000 queries al día)
- Empresa: ilimitado o basado en contrato
Pilar 2: Cobra por outcomes
Cobra por el resultado que el usuario obtiene, no por el acto de preguntar. Esto es pricing basado en outcome.
Ejemplo: Intercom cobra $0.99 por ticket resuelto usando su agente AI. El cliente paga solo cuando el agente hace el trabajo que antes costaba 7 minutos de labor humana. El pricing se alinea con el valor entregado.
Dejamos de vender "respuestas" y empezamos a vender "horas".
El pricing basado en outcome es más difícil de montar pero produce retención dramáticamente mejor porque el precio se siente justo al usuario. No están pagando por cómputo que no usaron. Están pagando por outcomes que sí recibieron.
Pilar 3: Limita las modalidades de cómputo más pesadas
Algunas capacidades AI son caras (generación de imagen a alta calidad, generación de video, razonamiento de contexto largo). Otras son baratas (texto corto, clasificación). Limita las caras detrás de tiers más altos.
Ejemplo: Midjourney usa Fast Mode (acceso prioritario a GPU) vs Relax Mode (en cola, más lento) para limitar prioridad de cómputo. Los usuarios pueden usar el producto en el tier gratis o bajo con Relax Mode. Si quieren Fast Mode, pagan por prioridad. El cómputo coincide con el precio.
Patrón de implementación: identifica qué 20% de tus capacidades AI consume el 80% de tu cómputo. Pon esas detrás de tiers más altos. Mantén las capacidades baratas accesibles para convertir usuarios.
Diseñar el ecosistema de monetización
Los tres pilares no funcionan aislados. Funcionan juntos como ecosistema:
- Catalizadores de conversión: momentos en el journey del usuario donde se dan cuenta de que necesitan el siguiente tier (alcanzaron el límite de uso, quieren una modalidad más poderosa, quieren cómputo prioritario)
- Estrategias de retención: componentes basados en outcome que reducen el arrepentimiento de suscripción (los usuarios sienten el valor por el que pagaron)
- Optimización de costes: hacer match entre lo que cobras y lo que te cuesta entregar, para que los márgenes se mantengan sostenibles
| Pilar | Mecanismo | Ejemplo |
|---|---|---|
| Intensidad de uso | Tiers basados en volumen | Google Plus/Pro/Ultra |
| Outcomes | Cobrar por outcome entregado | Intercom $0.99 por resolución |
| Modalidades de cómputo | Limitar capacidades caras | Midjourney Fast vs Relax |
Los catalizadores de conversión que diseñar
Una vez la estructura de precios está fijada, diseña los momentos que empujan a los usuarios a actualizar:
El momento de alcanzar el límite
Cuando un usuario está a mitad de tarea y choca con un límite de uso. La fricción es real y la actualización es contextual. Asegúrate de que la notificación del límite sea inmediata y el camino de actualización sea de un click.
La realización de modalidad
Cuando un usuario quiere algo que el tier más barato no puede hacer (contexto largo, video, generación rápida de imagen). La actualización no es un genérico "desbloquea más"; es "obtén esta capacidad específica que acabas de intentar usar".
El momento de uso por pares
Cuando los usuarios descubren que sus colegas o pares usan el tier más alto. Por esto el pricing basado en equipo convierte mejor que el individual en B2B: una actualización desbloquea comportamiento visible a todos en la org.
Qué no funciona en freemium AI
- Pruebas basadas en tiempo. Las pruebas de 14 días tenían sentido en SaaS donde la conversión ocurría probando el producto completo. En AI, los usuarios exploran por una hora y o sacan valor o no. Las pruebas basadas en tiempo desperdician cómputo.
- Limitar features sin limitar uso. Si tu tier gratis tiene la capacidad core pero limita features avanzados, los usuarios obtienen la mayoría del valor sin pagar. Limita por uso, no por feature.
- Tiers gratis generosos para crecer market share. En SaaS esto funcionaba porque el crecimiento podía superar los costes. En AI, el crecimiento amplifica costes. Los tiers gratis generosos en AI bancarrotean la empresa.
- Pricing anual upfront para suscripciones AI. El churn más alto significa que compromisos más largos desajustan con la realidad de uso. Mensual con pricing basado en uso encaja mejor.
El modelo híbrido que está emergiendo
La mayoría de productos AI exitosos están convergiendo en un híbrido: un tier gratis fino (uso limitado de capacidades baratas), un tier de suscripción (volumen de uso + acceso a más modalidades) y componentes basados en outcome para acciones de alto valor (por resolución, por documento analizado, por imagen generada a calidad premium).
El patrón coincide con la estructura de costes. El pricing coincide con el valor. El usuario siente que la factura es justa. La empresa se mantiene solvente. Cada pierna del híbrido apoya a las otras.
Para llevar
El playbook freemium SaaS asumía coste marginal por usuario cercano a cero, churn bajo y diferenciación alta de features. AI rompe los tres. El patrón de reemplazo usa tres pilares: limita la intensidad de uso, cobra por outcomes, limita modalidades de cómputo caras. Diseña catalizadores de conversión en los momentos de alcanzar el límite, realización de modalidad y uso por pares. Evita pruebas basadas en tiempo, tiers gratis generosos y pricing anual estilo SaaS. Las empresas que aciertan esto construyen negocios AI sostenibles. Las que copian el playbook SaaS terminan escribiendo post-mortems reflexivos sobre cómo su economía unitaria nunca funcionó.


