Con la llegada del aprendizaje profundo (Deep Learning en inglés), se plantea un supuesto particularmente prometedor en el desarrollo de la inteligencia artificial (IA): ¿qué pasaría si las máquinas fueran capaces de aprender por sí mismas del mismo modo que hacemos las personas?
Entre las promesas más apasionantes del aprendizaje profundo, se halla la capacidad de generar sistemas con altas capacidades predictivas que pueden mejorar sus resultados de forma continua y sin intervención humana.
Si bien hace muy poco esta premisa podía sonar como una utopía futurista, la realidad es que el aprendizaje profundo ya forma parte del día a día de la mayoría de las personas. Así, está teniendo un impacto extraordinario junto con las redes neuronales en una multitud de áreas: desde proporcionar una navegación web más personalizada hasta recibir tratamientos médicos cada vez más precisos.
Hagamos un repaso a todo lo que necesita saber sobre el aprendizaje profundo y las diferentes maneras en las que está transformando las capacidades de las máquinas.
El aprendizaje profundo es una rama de la inteligencia artificial orientada a entrenar redes neuronales profundas para realizar tareas complejas.
Se trata de una subcategoría que ha logrado mayores capacidades y flexibilidad dentro del marco más amplio del aprendizaje automático (Machine Learning en inglés). El funcionamiento básico del aprendizaje profundo se podría resumir de la siguiente manera: en el aprendizaje profundo se realiza una representación del mundo de acuerdo con una jerarquía de conceptos que van desde los más complejos hasta los más simples y desde los más abstractos hasta los más concretos.
Gracias a esto, el aprendizaje profundo aparece hoy en día en multitud de aplicaciones de uso cotidiano, desde el reconocimiento de voz hasta la visión artificial pasando por el procesamiento de lenguaje natural y su aplicación en la traducción automática.
El aprendizaje profundo está provocando cambios muy significativos en nuestras expectativas sobre las máquinas y su funcionamiento. Así, su importancia reside en dotar a los sistemas computacionales de capacidades para ejecutar tareas complejas con un alto grado de precisión dada su capacidad de aprendizaje.
A su vez, su valor reside también en las enormes posibilidades de automatización de procesos que facilita, lo que permite ahorrar tiempo y costos en tareas complejas, por ejemplo, mediante la detección de fraudes en el sector bancario o la segmentación de clientes orientada al marketing y las ventas.
Además, el uso de redes neuronales y aprendizaje profundo está impulsando la innovación tecnológica en una multitud de industrias, desde la médica hasta la manufacturera. Por ejemplo, la consultora McKinsey destacaba recientemente el papel crucial que el aprendizaje automático ha adquirido en el área de diseño de producto.
Lectura recomendada: ¿Cuál es la diferencia entre el aprendizaje automático y el aprendizaje profundo? (Machine Learning vs Deep Learning)
Como ya hemos visto, el aprendizaje profundo es capaz de aprender directamente de los datos de entrada. Para ello, emplea arquitecturas de redes neuronales con múltiples capas.
Este funcionamiento se fundamenta en cómo nuestros cerebros procesan información. En este sentido, el avance del aprendizaje profundo se alimenta de forma constante de los desarrollos en neurociencia y es la unión de ambas disciplinas la que está posibilitando el desarrollo de sistemas altamente sofisticados.
Esta premisa básica se concreta en el siguiente proceso de aprendizaje:
Este proceso puede repetirse una y otra vez, lo que resulta en un aprendizaje continuo que permite realizar predicciones mediante datos nuevos. Además, se pueden poner en marcha estrategias particularmente exitosas como el fine-tuning, que aprovecha un sistema bien entrenado para resolver tareas específicas.
Los sistemas de traducción automática están experimentando de forma paralela una auténtica revolución gracias al uso del aprendizaje profundo y de las redes neuronales.
Se trata de un paso adelante sin precedentes para los servicios de traducción automática más avanzados, que permiten generar traducciones altamente precisas en una gran variedad de combinaciones de idiomas, incluyendo lenguas muy diferentes entre sí (como el español y el chino).
En este sentido, el aprendizaje profundo emplea corpus textuales para aprender a traducir a partir de grandes cantidades de texto que incluyen oraciones en una lengua y sus equivalentes en otra lengua (corpus paralelos).
Algunas características de la traducción automática que han mejorado de forma notable gracias al aprendizaje profundo son:
contexto, que a menudo marca la diferencia entre un texto traducido de forma correcta y otro que contiene imprecisiones o ambigüedades.
El resultado son traducciones automáticas que, si bien requieren de una etapa posterior de posedición, son más fluidas, naturales y precisas de lo que se había logrado hasta ahora.
Quizás le interese: La importancia de la limpieza de datos en la TA y el aprendizaje profundo
Como hemos explicado en la primera sección, el aprendizaje profundo es una subcategoría del aprendizaje automático. No obstante, es posible establecer algunas diferencias entre ambos conceptos:
El aprendizaje automático convencional hace uso de algoritmos para extraer características de un conjunto de datos, a partir de los cuales realiza predicciones, y dispone de una gran capacidad de abstracción. Por otro lado, el aprendizaje profundo emplea arquitecturas de redes neuronales, lo que le permite aprender directamente de los datos. Esto, a su vez, pone en marcha procesos de aprendizaje continuo, de modo que el sistema mejora su rendimiento conforme avanza su uso.
En general, el aprendizaje profundo se enfoca a identificar patrones y características complejas a partir de grandes cantidades de datos. Por su parte, el aprendizaje automático convencional busca construir modelos predictivos.
El aprendizaje profundo implica múltiples capas de procesamiento de información, frente al funcionamiento basado en modelos más simples del aprendizaje automático. En este sentido, la complejidad del uso del aprendizaje profundo conlleva que su avance vaya de la mano con el progreso de los equipos informáticos y sus capacidades de procesamiento.
El aprendizaje automático trabaja con datos estructurados y no estructurados (como imágenes, audio y texto), mientras que el aprendizaje profundo emplea únicamente datos no estructurados. Por su parte, el aprendizaje profundo demanda conjuntos de datos mucho más grandes para su funcionamiento.
El aprendizaje profundo es capaz de identificar patrones complejos y de forma no lineal en los datos, mientras que los patrones típicos del aprendizaje automático son más simples.
El aprendizaje profundo requiere más recursos de hardware y más tiempo de entrenamiento que el aprendizaje automático convencional. No obstante, esta primera fase inicial más larga se ve recompensada durante el testeo de las herramientas, ya que los sistemas de aprendizaje profundo precisan de fases de prueba de menor duración que la mayoría de los sistemas convencionales de aprendizaje automático.
El aprendizaje automático convencional precisa de la supervisión específica de programadores, quienes definen el objeto del aprendizaje para reducir en la medida de lo posible la complejidad de los datos. Gracias al papel que desempeñan, la máquina puede reconocer los patrones con más facilidad. No obstante, avances como los paradigmas zero-shot learning están reduciendo esta necesidad de supervisión.
En cambio, esta supervisión humana se reduce en los procesos de aprendizaje profundo, pues el sistema es capaz de autorregularse en gran medida para definir las categorías y jerarquías que va a emplear para su aprendizaje.
El avance de las herramientas de aprendizaje profundo se enfrenta hoy en día a diversos dilemas respecto a su empleo ético.
Por un lado, los expertos señalan los posibles sesgos de las herramientas que, al aplicarlas, podrían tener un impacto particularmente significativo en la toma de decisiones que afectan a las personas (por ejemplo, durante procesos de contratación). Además, la falta de transparencia en torno a cómo un sistema ha llegado a una conclusión concreta también puede resultar problemática a nivel ético.
Respecto a la privacidad de los datos, el aprendizaje profundo también se encuentra actualmente en una disyuntiva: ¿cómo se puede aprovechar todo el potencial que aportan los datos sin comprometer su privacidad y, además, cumplir con la legislación al respecto?
La realidad es que entrenar un modelo de aprendizaje profundo puede plantear problemas de privacidad si los datos de entrenamiento contienen información personal o confidencial. Si encontrar grandes cantidades de datos relevantes supone ya una tarea compleja en sí, garantizar su privacidad puede suponer un problema añadido.
En este sentido, han aparecido una multitud de herramientas que buscan lograr el equilibrio entre el uso de grandes cantidades de datos y la privacidad. Destacan aquí las técnicas de anonimización de datos.
Creadas para gestionar el gran volumen de datos sensibles que las empresas utilizan y almacenan, estas herramientas hacen uso del procesamiento del lenguaje natural (PLN) para detectar los datos personales en los conjuntos de datos y proceder a su encriptación.
El resultado son conjuntos de datos no identificables que pueden emplearse en procesos de aprendizaje profundo con seguridad y de acuerdo con los requisitos legales. Estas iniciativas, a su vez, se complementan con nuevos enfoques en esta área como la privacidad diferencial, que pone en marcha procesos de captación y análisis de datos sin comprometer el derecho a la privacidad de los titulares.
Respecto a los retos que surgen alrededor del aprendizaje profundo y la privacidad, se espera que el trabajo de los miles de especialistas preocupados por el avance de esta tecnología termine por generar un equilibrio que recoja tanto los beneficios del aprendizaje profundo como la protección de la privacidad y los derechos de los usuarios.