El EDPB finalizó nuevas guías de anonimización este abril, la primera actualización mayor desde la opinión del grupo de trabajo Artículo 29 de 2014. Para SaaS que construye analytics, datasets de ML o outputs de investigación, esto importa: datos verdaderamente anónimos escapan del RGPD por completo. Los seudónimos no. La mayoría trata ambos igual y paga overhead RGPD por los dos.

El estándar 2026 de anonimización

El EDPB consolidó tres tests. Un dataset es anónimo solo si los tres fallan:

  1. Singling out: ¿puedes aislar un individuo en los datos?
  2. Linkability: ¿puedes joinear con otro dataset para identificar?
  3. Inferencia: ¿puedes deducir un atributo con alta probabilidad?

Si alguno pasa, el dato es como mucho seudónimo y sigue dentro del RGPD.

Datos típicos SaaS que NO son anónimos

DatasetPor qué falla
User IDs hashed en logs de eventosLinkable por correlación de sesión
Métricas agregadas con cohortes pequeñas (n < 10)Singling out trivial
Fingerprints de comportamiento (timing, clicks)Linkability por la misma huella
K-anonimización con k < 5 efectivoAtaques de inferencia funcionan

Lo que SÍ pasa como anonimización 2026

  • Privacidad diferencial con presupuesto epsilon documentado bajo 1.0
  • Datos sintéticos de modelo entrenado en reales con pruebas de privacidad
  • Agregación fuerte con cohortes > 100 y redondeo al 10 más cercano
  • Muestreo aleatorio sin claves de una población grande que rompa linkability

Cualquier cosa más débil es seudonimización: salvaguarda RGPD, pero no salida del RGPD.

El beneficio operativo

Si tu pipeline produce output verdaderamente anónimo:

  • El output no es dato personal; no se necesita consentimiento ni base legal para tratamientos posteriores
  • Puedes compartirlo con sub-encargados sin expandir alcance DPA
  • Puedes retenerlo indefinidamente

Esa es la zanahoria. El palo: los reguladores en 2026 son más sofisticados. Reclamar anonimización sin la disciplina de los tres tests es bandera roja en auditorías.

El error más común: tratar dato como anónimo porque la tabla no tiene columna nombre. El nombre no es el único identificador. Hash de email, IPs, device IDs, hash de cookie, patrones de comportamiento, todos cuentan.

Cómo documentar anonimización en tu política

Añade una sección que distinga:

  • Datos que recogemos (personales)
  • Datos que derivamos (seudónimos, alcance RGPD)
  • Datos que anonimizamos para research/analytics (fuera RGPD, método documentado)

Documenta el método públicamente. "Usamos k-anonimato con k=50 y cohortes ≥100" es más creíble que "anonimizamos datos".

El framing del EDPB en las nuevas guías es nítido: la anonimización es un resultado, no una etiqueta. El dataset es anónimo o no lo es, sin importar lo que diga el README.

Conclusión

La anonimización real es ventaja competitiva en 2026. Expande lo que tu SaaS puede hacer con datos sin expandir exposición RGPD. La disciplina de los tres tests es el ticket de entrada; sin ello, las reclamaciones de anonimización son teatro.

Para documentar flujos de datos por categoría (personal, seudónimo, anónimo) en tu política con el lenguaje legal correcto, prueba Termerly gratis.