Anonimización Multilingue con Masker de Pangeanic

La anonimización de todo tipo de documentos y bases de datos se ha vuelto necesaria para las empresas de diferentes sectores que quieren cumplir con las normativas de protección de datos de los diferentes países. Esto hace necesaria la anonimización en diferentes idiomas, ¿puede hacerse? Hoy en día, las empresas necesitan los datos personales ya que son información crucial para la toma de decisiones para las organizaciones y administraciones . Por eso, es importante respetar la privacidad y protección de datos de las personas con las que se trata, y no perder su confianza.

Para resolver este problema, surge la anonimización, un término cada vez más popular. En los últimos años, este concepto se ha desarrollado y vuelto una herramienta indispensable para todas aquellas empresas que tratan con datos personales si quieren evitar las multas y cumplir con las normativas de protección de datos del país donde realiza su actividad. Empresas trabajan en desarrollar y buscar mejoras constantes para facilitar su uso y accesibilidad cumpliendo con todas las condiciones de seguridad. Lo que dictan las normativas es contar con los datos personales pertinentes para proporcionar los servicios y una vez el cliente deja de ser necesario, y tras pasar el periodo mínimo de mantenimiento de la información por razones legales, es conveniente eliminar sus datos, es decir, anonimizarlos. La mayoría de las empresas en la actualidad cuentan con medidas de seguridad, aun así, muchas han sufrido violaciones de seguridad en relación con datos personales y, como consecuencia han tenido represalias monetarias por incumplir las normativas pertenecientes al país donde realiza su actividad. Cada país aplica sus normas, por eso es necesaria la anonimización en diferentes idiomas ya que se precisa en todo el mundo para cumplir con la privacidad de datos. Contar con una herramienta de anonimización que sepa identificar los datos personales en el idioma de origen para poder ocultar la información sin errores es importante para cualquier empresa que trate con datos.

En Pangeanic somos líderes en procesamiento del lenguaje natural y hemos desarrollado nuestro propio software de anonimización de documentos, traducción automática privada de calidad casi humana, clasificación automática de datos, análisis de relevancia y sentimiento, y sumarización. Nuestra actividad empezó en 2005 como empresa de servicios de traducción, y posteriormente, implementamos las tecnologías y crecimos como empresa de tecnologías del lenguaje y procesamiento del lenguaje natural. Llevamos años trabajando en el desarrollo e implementación de mejoras de nuestro software de anonimización llamado Masker, este permite a las organizaciones a nivel global cumplir con las diferentes normativas de protección de datos del país en el que se encuentran ubicadas (RGPD, CCPA, HIPAA, APPI). Además, nuestra plataforma es multilingüe ya que desde nuestros inicios estamos especializados en traducciones y, por lo tanto, estamos familiarizados y especializados en ofrecer servicios multiidiomas. ¿Cómo lo hacemos? Esto es posible gracias a que utilizamos un modelo de Machine Learning que se basa en la estructura Transformers. Esta estructura a su vez está compuesta por unos modelos de atención, los cuales van aprendiendo que partes de la frase son más importantes y deben tenerse en cuenta para anonimizar. Masker cuenta con diferentes idiomas en los que poder anonimizar los datos. El último modelo que hemos entrenado es el de japonés. Este es un idioma importante a tener en cuenta, ya que, en Japón cuentan con la APPI (Act on the Protection of Personal Information). Esta ley que se aplica a todos los operadores comerciales (individuos y entidades) que manejan información personal, este sería un equivalente a las otras leyes existentes mencionadas anteriormente. Masker Pangeanic