Diferencias entre datos agregados anonimizados, datos desidentificados y datos anónimos

Escrito por Carles Durá Santonja | 12/07/23

El uso de datos resulta vital para las empresas, instituciones y entes públicos, sea para la toma de decisiones acertadas o para llevar a cabo estudios científicos, económicos o sociales.

Sin embargo, para hacer uso de datos (almacenarlos, compartirlos, analizarlos…), es necesario proteger la información personal para garantizar la privacidad del individuo.

En consecuencia, es necesario que las empresas, las organizaciones y demás entes obligados a garantizar el cumplimiento de las normativas de privacidad puedan reconocer las diferencias entre los datos agregados anonimizados, datos desidentificados y datos anónimos.

Algunos de estos datos se encuentran dentro del alcance de las normativas de protección de datos, otros no están sujetos a estas leyes o reglamentos. Por lo que es necesario despejar dudas y eliminar creencias erróneas sobre el tipo de datos que se está procesando.

 

 

Qué son los datos agregados, datos desidentificados y datos anónimos

Para comprender la diferencia entre los datos agregados anonimizados, los datos desidentificados y los datos anónimos es preciso conocer la definición de cada uno. Aunque puedan tener muchos aspectos similares, son datos diferentes que no deben confundirse, sobre todo cuando contienen información personal

 

Datos agregados anonimizados

Los datos agregados son aquellos que se presentan sólo en un conjunto, como en una especie de resumen. Son datos individuales que se han recopilado y se combinan para mostrarse en grupos y comunicar alguna información global.

Normalmente la información agregada es utilizada para detectar tendencias, llevar a cabo comparaciones u observar comportamientos que, de manera aislada, sería imposible de conocer.

Por ejemplo, al realizarse una encuesta sobre las preferencias entre uno u otro candidato político, será información agregada el conjunto de valores que muestran cuál es el candidato más popular.

Sin embargo, a estos datos se pueden aplicar ciertos filtros para obtener información más detallada, como qué candidato es el más popular en cada región o la cantidad de votos destinados a cada político según la edad del votante. En este caso, la información agregada puede llegar a revelar detalles significativos de las personas y los datos no garantizarían la privacidad.

Por esto, generalmente, cuando los datos presentan información personal, antes de la agregación se someten a un proceso de anonimización que elimina los valores que puedan servir para identificar o asociar a cada individuo. En este caso se habla de datos agregados anonimizados.

Pero los datos agregados anonimizados no deben confundirse con los datos desidentificados. La clave está en saber que la anonimización es un proceso que imposibilita la reidentificación del individuo titular, por lo que no se consideran datos personales y no estarán sujetos a los requerimientos del RGPD.

 

Contenido relacionado:

¿Por qué todas las empresas deberían usar un anonimizador de datos?

 

Datos desidentificados

Los datos desidentificados son aquellos datos a los que se les ha eliminado la información personal, con el fin de proteger la privacidad de los individuos, pero garantizando la utilidad de los datos para su uso.

Los datos que se eliminan son aquellos que sirven como identificadores únicos de los individuos, por ejemplo, el nombre, el correo electrónico, el domicilio o la fecha de nacimiento.

Sin embargo, pueden existir riesgos de la identificación de la persona, porque la desidentificación solo logra eliminar aquellos identificadores obvios o directos (nombres, edad…), pero los indirectos permanecen.

Además, no existe un consenso mundial sobre qué datos son realmente un identificador personal. Por ejemplo, ¿Son las direcciones IP datos personales?

La principal diferencia entre los datos desidentificados y los datos anonimizados es que los primeros pueden contener información adicional que permita asociar o reidentificar al individuo.

 

Datos anónimos

En los datos anónimos es imposible llegar a identificar o asociar a las personas titulares. Son datos que nunca han contenido información personal, por lo tanto, no están sujetos a las regulaciones sobre la protección a la privacidad.

Estos datos son ideales, porque se pueden procesar, almacenar, analizar y compartir sin llevar a cabo ningún procedimiento para su protección.


 

 

¿Por qué es importante la protección de datos y cuándo hay que utilizar cada una de estas técnicas?

El Reglamento General de Protección de Datos RGPD de la Unión Europea, la Ley de Portabilidad y Responsabilidad HIPAA o la Ley de Protección de la Privacidad del Consumidor CPPA son textos legales específicos que exigen a las empresas y organizaciones la aplicación de técnicas o procedimientos para la protección de datos personales.

Pero, garantizar la protección de datos va más allá del cumplimiento de las normativas legales.

En primer lugar, proteger los datos personales es la manera de proteger el derecho fundamental que tiene el ciudadano de mantener su privacidad.

En segundo lugar, proteger los datos significa evitar sanciones y mejorar la imagen de la organización o de la empresa.

En este contexto es importante conocer cuándo se deben aplicar las técnicas de agregación de identificación y anonimización. Aunque puedan presentar sus riesgos de no garantizar por completo la privacidad, sí ofrecen cierto grado de protección.

  • Si se desea estar exento de la aplicación del GRDP, deben utilizarse datos anonimizados. Por supuesto, siempre que se garantice que los datos son información anónima y que no existe riesgo de asociación directa o indirecta con el individuo titular, ni riesgo de la reidentificación del individuo.

    De lo contrario no se denominan datos anonimizados sino datos seudonimizados. En esta última técnica se genera dos grupos de información: la seudonimizada y otro grupo de valores que permite revertir el proceso de anonimización.

  • La agregación no es suficiente para garantizar la protección de datos. Si se requiere visualizar la información globalizada para trabajos de análisis, es imprescindible utilizar datos agrupados anonimizados.

 

Lectura recomendada:

Las mejores herramientas y técnicas de anonimización de datos

 

 

Herramientas que ayudan el enmascaramiento de datos

La anonimización o seudonimización de datos es una de las técnicas de enmascaramiento que se utiliza muy frecuentemente para proteger la información personal siguiendo los preceptos de las normativas europeas.

Las herramientas que ayudan al enmascaramiento deben tener la capacidad automática de detectar los datos personales directos e indirectos y aplicar diversas técnicas preconfiguradas de enmascaramiento.

Además, deben contar con algoritmos cifrados estrictos que eviten la ingeniería inversa del enmascaramiento y permitan adecuarse a las normativas a nivel internacional. Es la única manera de reducir los riesgos y minimizar la responsabilidad del uso de los datos.

Para garantizar la protección de información personal, explore Masker. Nuestra solución para la anonimización de datos.

 

Contenido relacionado:

Cómo evitar problemas de privacidad de datos en Europa

 

 

Conozca todo sobre Masker, la solución de Pangeanic para la anonimización de datos

En Pangeanic hemos desarrollado Masker, un software de enmascaramiento de datos, cuyo algoritmo es impulsado por la Inteligencia Artificial y trabaja bajo los estándares de privacidad a nivel mundial. De esta forma puede brindarle a su empresa una anonimización efectiva y completamente segura.

Masker puede detectar automáticamente los datos personales, se cataloguen como directos o como indirectos.

Además, permite el preajuste del tipo de enmascaramiento, el nivel de agresividad de la desidentificación y, si se desea, también se puede configurar la reversibilidad de la anonimización, para un proceso completamente personalizado.

Si desea reducir los riesgos al almacenar y compartir información personal o sensible, contáctenos.