¿Qué es el aprendizaje profundo?


El aprendizaje profundo, una técnica avanzada de inteligencia artificial, se ha vuelto cada vez más popular en los últimos años, gracias a la abundancia de datos y al aumento de la potencia informática. Es la tecnología principal detrás de muchas de las aplicaciones que usamos todos los días, incluida la traducción de idiomas en línea, el etiquetado automático de rostros en las redes sociales, las respuestas inteligentes en su correo electrónico y la nueva ola de modelos generativos. Si bien el aprendizaje profundo no es nuevo, se ha beneficiado mucho de una mayor disponibilidad de datos y avances en la informática.

ChatGPT, el chatbot impulsado por IA que se ha convertido en la aplicación de más rápido crecimiento de todos los tiempos(Se abre en una nueva ventana), funciona con un modelo de aprendizaje profundo que se ha entrenado con miles de millones de palabras recopiladas de Internet. DALL-E, Midjourney y Stable Diffusion, los sistemas de IA que pueden generar imágenes a partir de descripciones de texto, son sistemas de aprendizaje profundo que modelan la relación entre imágenes y descripciones de texto.


Aprendizaje profundo frente a aprendizaje automático

El aprendizaje profundo es un subconjunto del aprendizaje automático, una rama de la inteligencia artificial que configura las computadoras para realizar tareas a través de la experiencia. A diferencia de los sistemas de IA clásicos basados ​​en reglas, los algoritmos de aprendizaje automático desarrollan su comportamiento mediante el procesamiento de ejemplos anotados, un proceso llamado «entrenamiento».

Por ejemplo, para crear un programa de detección de fraudes, entrenaría un algoritmo de aprendizaje automático con una lista de transacciones bancarias y su resultado final (legítimo o fraudulento). El modelo de aprendizaje automático examina los ejemplos y desarrolla una representación estadística de características comunes entre transacciones legítimas y fraudulentas.

Después de eso, cuando proporcione al algoritmo los datos de una nueva transacción bancaria, la clasificará como legítima o fraudulenta según los patrones que haya obtenido de los ejemplos de entrenamiento. Como regla general, cuantos más datos de alta calidad proporcione, más preciso será un algoritmo de aprendizaje automático al realizar sus tareas.

El aprendizaje automático es especialmente útil para resolver problemas donde las reglas no están bien definidas y no se pueden codificar en comandos distintos. Diferentes tipos de algoritmos sobresalen en diferentes tareas.


Aprendizaje profundo y redes neuronales

Si bien los algoritmos clásicos de aprendizaje automático resuelven muchos problemas con los que han luchado los programas basados ​​en reglas, son deficientes para manejar datos blandos como imágenes, videos, archivos de sonido y texto no estructurado.

Por ejemplo, crear un modelo de predicción del cáncer de mama utilizando enfoques clásicos de aprendizaje automático requeriría los esfuerzos de docenas de expertos en el dominio, programadores informáticos y matemáticos, según el investigador de inteligencia artificial y científico de datos Jeremy Howard en el video anterior.

Los investigadores tendrían que hacer mucha ingeniería de funciones, un proceso arduo que programa la computadora para encontrar patrones conocidos en las exploraciones de rayos X y MRI. Después de eso, los ingenieros utilizan el aprendizaje automático además de las características extraídas. Crear un modelo de IA de este tipo lleva años.

Red neuronal artificial

Red neuronal artificial (Crédito: Wikipedia)

Los algoritmos de aprendizaje profundo resuelven el mismo problema utilizando redes neuronales profundas, un tipo de arquitectura de software inspirada en el cerebro humano (aunque las redes neuronales son diferentes de las neuronas biológicas(Se abre en una nueva ventana)). Las redes neuronales son capas sobre capas de variables que se ajustan a las propiedades de los datos en los que se entrenan y se vuelven capaces de realizar tareas como clasificar imágenes y convertir voz en texto.

Las redes neuronales son especialmente buenas para encontrar patrones comunes de forma independiente en datos no estructurados. Por ejemplo, cuando entrena una red neuronal profunda en imágenes de diferentes objetos, encuentra formas de extraer características de esas imágenes. Cada capa de la red neuronal detecta características específicas como bordes, esquinas, rostros, globos oculares, etc.

capas de redes neuronales

Las capas superiores de las redes neuronales detectan características generales. Las capas más profundas detectan objetos reales. (Crédito: arxiv.org)

Las redes neuronales existen desde la década de 1950 (al menos conceptualmente). Pero hasta hace poco, la comunidad de IA los descartaba en gran medida porque requerían grandes cantidades de datos y potencia informática. En los últimos años, la disponibilidad y la asequibilidad de los recursos informáticos, de almacenamiento y de datos han llevado a las redes neuronales a la vanguardia de la innovación en IA.

Hoy en día, existen varios tipos de arquitecturas de aprendizaje profundo, cada una adecuada para diferentes tareas. Las redes neuronales convolucionales (CNN) son especialmente buenas para capturar patrones en imágenes. Las redes neuronales recurrentes (RNN) son buenas para procesar datos secuenciales como voz, texto y notas musicales. Las redes neuronales gráficas (GNN) pueden aprender y predecir las relaciones entre los datos gráficos, como las redes sociales y las compras en línea.

Una arquitectura de aprendizaje profundo que se ha vuelto muy popular recientemente es el transformador(Se abre en una nueva ventana), utilizado en modelos de lenguaje grande (LLM) como GPT-4 y ChatGPT. Los transformadores son especialmente buenos en tareas de lenguaje y pueden entrenarse con grandes cantidades de texto sin procesar.


¿Para qué se utiliza el aprendizaje profundo?

Hay varios dominios en los que el aprendizaje profundo está ayudando a las computadoras a abordar problemas que antes no tenían solución:

Visión por computador

La visión por computadora es la ciencia del uso de software para dar sentido al contenido de imágenes y videos. Esta es una de las áreas en las que el aprendizaje profundo ha progresado mucho. Más allá del cáncer de mama, los algoritmos de procesamiento de imágenes de aprendizaje profundo pueden detectar otros tipos de cáncer(Se abre en una nueva ventana) y ayudar a diagnosticar otras enfermedades(Se abre en una nueva ventana).

Pero este tipo de aprendizaje profundo también está arraigado en muchas de las aplicaciones que usa todos los días. Face ID de Apple utiliza la visión por computadora para reconocer su rostro, al igual que Google Photos para varias funciones, como la búsqueda de objetos y escenas, así como la corrección de imágenes. Facebook usó el aprendizaje profundo para etiquetar automáticamente a las personas en las fotos que carga, antes de que esa función se cerrara en 2021.

El aprendizaje profundo también ayuda a las empresas de redes sociales a identificar y bloquear automáticamente el contenido cuestionable, como la violencia y la desnudez. Y, por último, el aprendizaje profundo está desempeñando un papel muy importante al permitir que los vehículos autónomos den sentido a su entorno.

Reconocimiento de voz y habla

Cuando dice un comando a su altavoz inteligente Amazon Echo o al Asistente de Google, los algoritmos de aprendizaje profundo convierten su voz en comandos de texto. Varias aplicaciones en línea también utilizan el aprendizaje profundo para transcribir archivos de audio y video. La aplicación de teclado de Google, Gboard, utiliza el aprendizaje profundo para ofrecer una transcripción de voz en tiempo real en el dispositivo que se escribe mientras habla.

Procesamiento y generación de lenguaje natural

Procesamiento del lenguaje natural (PNL), la ciencia de extraer el significado del texto no estructurado, ha sido un punto crítico histórico para el software clásico. Definir todos los diferentes matices y significados ocultos del lenguaje escrito con reglas informáticas es prácticamente imposible. Pero las redes neuronales entrenadas en grandes cuerpos de texto pueden realizar con precisión muchas tareas de PNL.

El servicio de traducción de Google vio un aumento repentino en el rendimiento(Se abre en una nueva ventana) cuando la empresa cambió al aprendizaje profundo. Los parlantes inteligentes usan NLP de aprendizaje profundo para comprender los diversos matices de los comandos, como las diferentes formas en que puede preguntar por el clima o las direcciones.

El aprendizaje profundo también es muy eficiente para generar texto significativo, también llamado generación de lenguaje natural (NLG). Smart Reply y Smart Compose de Gmail utilizan el aprendizaje profundo para generar respuestas relevantes a sus correos electrónicos y sugerencias para completar sus oraciones. Un modelo de generación de texto desarrollado por OpenAI creó largos extractos de texto coherente.

Modelos de lenguaje grande (LLM) como ChatGPT de OpenAI, puede realizar una amplia gama de tareas, que incluyen resumir texto, responder preguntas, escribir artículos y generar código de software. Los LLM se están integrando en una amplia gama de aplicaciones, incluidas aplicaciones de correo electrónico y mensajería corporativa, aplicaciones de productividad y motores de búsqueda.

Recomendado por Nuestros Editores

Generación de arte

Un campo en el que el aprendizaje profundo se ha vuelto muy útil recientemente es la generación de imágenes. Modelos como DALL-E y Stable Diffusion pueden crear impresionantes imágenes a partir de descripciones textuales. Microsoft ya está usando DALL-E en varios productos, incluido Designer. Adobe también está utilizando modelos generativos en varias de sus aplicaciones.


bits y bytes

(Crédito: fotografía/Getty Images)

Los límites del aprendizaje profundo

A pesar de todos sus beneficios, el aprendizaje profundo también tiene algunas deficiencias.

Dependencia de datos

En general, los algoritmos de aprendizaje profundo requieren grandes cantidades de datos de entrenamiento para realizar sus tareas con precisión. Desafortunadamente, no hay suficientes datos de capacitación de calidad para crear modelos de aprendizaje profundo que puedan responder a muchos tipos de problemas.

explicabilidad

Las redes neuronales desarrollan su comportamiento de formas extremadamente complicadas, incluso sus creadores luchan por comprender sus acciones. La falta de interpretabilidad hace que sea extremadamente difícil solucionar errores y corregir errores en los algoritmos de aprendizaje profundo.

Sesgo algorítmico

Los algoritmos de aprendizaje profundo son tan buenos como los datos con los que se entrenan. El problema es que los datos de entrenamiento a menudo contienen sesgos ocultos o evidentes, y los algoritmos heredan estos sesgos. Por ejemplo, un algoritmo de reconocimiento facial entrenado principalmente en imágenes de personas blancas funcionará con menos precisión para las personas que no son blancas.

Falta de generalización

Los algoritmos de aprendizaje profundo son buenos para realizar tareas enfocadas pero malos para generalizar su conocimiento. A diferencia de los humanos, un modelo de aprendizaje profundo entrenado para jugar StarCraft no podrá jugar un juego similar, por ejemplo, WarCraft.

Además, el aprendizaje profundo es deficiente en el manejo de datos que se desvían de sus ejemplos de entrenamiento, también conocidos como «casos extremos». Esto puede volverse peligroso en situaciones como los autos sin conductor, donde los errores pueden tener consecuencias fatales.


¿Qué es el signo de interrogación ai?

(Crédito: Getty)

El futuro del aprendizaje profundo

En 2019, los pioneros del aprendizaje profundo recibieron el Premio Turing, el equivalente en informática al Premio Nobel. Pero el trabajo sobre el aprendizaje profundo y las redes neuronales está lejos de terminar. Se están realizando varios esfuerzos para mejorar el aprendizaje profundo.

Algunos trabajos interesantes incluyen modelos de aprendizaje profundo que son explicables o abiertos a la interpretación, redes neuronales que pueden desarrollar su comportamiento con menos datos de entrenamiento y modelos de IA de borde, algoritmos de aprendizaje profundo que pueden realizar sus tareas sin depender de un gran recurso de computación en la nube.

Y aunque el aprendizaje profundo es actualmente la técnica de inteligencia artificial más avanzada, no es el destino final de la industria de la IA. La evolución del aprendizaje profundo y las redes neuronales podría darnos arquitecturas totalmente nuevas.

Este robot de IA fue creado para ser tu mejor amigo

¡Obtenga nuestras mejores historias!

Matricularse en ¿Qué hay de nuevo ahora? para recibir nuestras mejores historias en su bandeja de entrada todas las mañanas.

Este boletín puede contener publicidad, ofertas o enlaces de afiliados. Suscribirse a un boletín informativo indica su consentimiento a nuestros Términos de uso y Política de privacidad. Puede darse de baja de los boletines en cualquier momento.





Source link-38