Tabla de Contenidos
- Ideas de Proyectos de Aprendizaje Profundo
- Ideas de proyectos de Aprendizaje Profundo: Nivel de principiantes
- Clasificación de imágenes con el conjunto de datos CIFAR-10
- Sistema de seguimiento visual
- Sistema de detección facial
- Ideas de proyectos de aprendizaje profundo: Nivel Intermedio
- Sistema de Reconocimiento de Dígitos
- Chatbot
- Sistema de clasificación de géneros musicales
- Sistema de detección de somnolencia
- Generador de leyendas de imágenes
- Coloración de fotos antiguas B&W
- Ideas de Proyectos de Aprendizaje Profundo – Nivel Avanzado
- Detector
- WaveGlow
- OpenCog
- DeepMimic
- IBM Watson
- Google Brain
- El algoritmo de detección de cáncer de pulmón de 12 Sigma
- Conclusión
Ideas de Proyectos de Aprendizaje Profundo
Aunque es un nuevo avance tecnológico, el alcance del Aprendizaje Profundo se está expandiendo exponencialmente. La tecnología Deep Learning pretende imitar la red neuronal biológica, es decir, del cerebro humano. Si bien los orígenes del Deep Learning se remontan a la década de 1950, es sólo con el avance y la adopción de la Inteligencia Artificial y el Machine Learning que salió a la luz. Por lo tanto, si usted es un principiante de ML, lo mejor que puede hacer es trabajar en algunas ideas de proyectos de aprendizaje profundo.
Nosotros, aquí en upGrad, creemos en un enfoque práctico como el conocimiento teórico por sí solo no será de ayuda en un entorno de trabajo en tiempo real. En este artículo, vamos a explorar algunas ideas interesantes de proyectos de aprendizaje profundo en los que los principiantes pueden trabajar para poner a prueba sus conocimientos. En este artículo, encontrará las mejores ideas de proyectos de aprendizaje profundo para que los principiantes obtengan experiencia práctica en el aprendizaje profundo.
Un subconjunto del aprendizaje automático, el aprendizaje profundo aprovecha las redes neuronales artificiales organizadas jerárquicamente para realizar tareas específicas de ML. Las redes de aprendizaje profundo utilizan el enfoque de aprendizaje no supervisado: aprenden a partir de datos no estructurados o no etiquetados. Las redes neuronales artificiales son como el cerebro humano, con nodos neuronales interconectados para formar una estructura tipo red.
Mientras que los modelos de aprendizaje tradicionales analizan los datos mediante un enfoque lineal, la función jerárquica de los sistemas de aprendizaje profundo está diseñada para procesar y analizar los datos con un enfoque no lineal.
Las arquitecturas de aprendizaje profundo, como las redes neuronales profundas, las redes neuronales recurrentes y las redes de creencias profundas, han encontrado aplicaciones en diversos campos, como el procesamiento del lenguaje natural, la visión por ordenador, la bioinformática, el reconocimiento del habla, el reconocimiento del audio, la traducción automática, el filtrado de redes sociales, el diseño de medicamentos e incluso los programas de juegos de mesa. A medida que se producen nuevos avances en este campo, se ayuda a los expertos en ML y Deep Learning a diseñar proyectos de Deep Learning innovadores y funcionales. Cuantas más ideas de proyectos de aprendizaje profundo intentes, más experiencia ganarás.
Hoy, discutiremos los siete mejores proyectos de Aprendizaje Profundo sorprendentes que nos están ayudando a alcanzar nuevas alturas de logros.
Así que, aquí hay algunas ideas de proyectos de Aprendizaje Profundo en las que los principiantes pueden trabajar:
Ideas de proyectos de Aprendizaje Profundo: Nivel de principiantes
Esta lista de ideas de proyectos de aprendizaje profundo para estudiantes es adecuada para principiantes, y para aquellos que acaban de empezar con el ML en general. Estas ideas de proyectos de aprendizaje profundo te pondrán en marcha con todos los aspectos prácticos que necesitas para tener éxito en tu carrera.
Además, si estás buscando ideas de proyectos de aprendizaje profundo para el último año, esta lista debería ponerte en marcha. Así que, sin más preámbulos, vamos a saltar directamente a algunas ideas de proyectos de aprendizaje profundo que fortalecerán tu base y te permitirán escalar posiciones.
Clasificación de imágenes con el conjunto de datos CIFAR-10
Una de las mejores ideas para empezar a experimentar tú proyectos prácticos de aprendizaje profundo para estudiantes es trabajar en la clasificación de imágenes. CIFAR-10 es un gran conjunto de datos que contiene más de 60.000 imágenes en color (tamaño 32×32) categorizadas en diez clases, en las que cada clase tiene 6.000 imágenes. El conjunto de entrenamiento contiene 50.000 imágenes, mientras que el conjunto de prueba contiene 10.000 imágenes. El conjunto de entrenamiento se dividirá en cinco secciones separadas, cada una con 10.000 imágenes dispuestas aleatoriamente. En cuanto al conjunto de prueba, incluirá 1000 imágenes elegidas al azar de cada una de las diez clases.
En este proyecto, desarrollarás un sistema de clasificación de imágenes que pueda identificar la clase de una imagen de entrada. La clasificación de imágenes es una aplicación fundamental en el campo del aprendizaje profundo, y por lo tanto, obtendrá conocimientos sobre varios conceptos de aprendizaje profundo mientras trabaja en este proyecto.
Sistema de seguimiento visual
Un sistema de seguimiento visual está diseñado para seguir y localizar objetos en movimiento en un marco de tiempo determinado a través de una cámara. Es una herramienta práctica que tiene numerosas aplicaciones, como la seguridad y la vigilancia, las imágenes médicas, la realidad aumentada, el control del tráfico, la edición de vídeo y la comunicación, y la interacción entre el ser humano y el ordenador.
Este sistema utiliza un algoritmo de aprendizaje profundo para analizar fotogramas de vídeo secuenciales, tras lo cual rastrea el movimiento de los objetos objetivo entre los fotogramas. Los dos componentes principales de este sistema de seguimiento visual son:
- Representación y localización de objetivos
- Filtrado y asociación de datos
Sistema de detección facial
Esta es una de las excelentes ideas de proyectos de aprendizaje profundo para principiantes. Con el avance del aprendizaje profundo, la tecnología de reconocimiento facial también ha avanzado enormemente. La tecnología de reconocimiento facial es un subconjunto de la detección de objetos que se centra en la observación de la instancia de objetos semánticos. Está diseñada para rastrear y visualizar rostros humanos dentro de imágenes digitales.
En este proyecto de aprendizaje profundo, aprenderás a realizar el reconocimiento de rostros humanos en tiempo real. Tienes que desarrollar el modelo en Python y OpenCV.
Ideas de proyectos de aprendizaje profundo: Nivel Intermedio
Sistema de Reconocimiento de Dígitos
Como su nombre indica, este proyecto consiste en desarrollar un sistema de reconocimiento de dígitos que pueda clasificarlos basándose en el conjunto de los mismos. Aquí, se utilizará el conjunto de datos MNIST que contiene imágenes (tamaño 28 X 28).
Este proyecto pretende crear un sistema de reconocimiento que pueda clasificar los dígitos que van del 0 al 9 utilizando una combinación de red superficial y red neuronal profunda e implementando la regresión logística. La Regresión Softmax o Regresión Logística Multinomial es la opción ideal para este proyecto. Dado que esta técnica es una generalización de la regresión logística, es apta para la clasificación multiclase, asumiendo que todas las clases son mutuamente excluyentes).
Chatbot
En este proyecto, modelarás un chatbot utilizando la API de IBM Watson. Watson es el mejor ejemplo de lo que la IA puede ayudarnos a conseguir. La idea de este proyecto es aprovechar las capacidades de aprendizaje profundo de Watson para crear un chatbot que pueda relacionarse con los seres humanos como cualquier otro ser humano. Los chatbots son sumamente inteligentes y pueden responder a preguntas o peticiones humanas en tiempo real. Esta es la razón por la que un número creciente de empresas de todos los ámbitos están adoptando chatbots en su infraestructura de atención al cliente.
Este proyecto no es muy difícil. Todo lo que necesitas es tener Python 2/3 en tu máquina, una cuenta de Bluemix y, por supuesto, ¡una conexión a Internet activa! Si deseas escalarlo un poco más, puedes visitar el repositorio de Github y mejorar las características de tu chatbot incluyendo un tablero animado para el coche.
Lee: ¿Cómo hacer un chatbot en Python?
Sistema de clasificación de géneros musicales
Esta es una de las interesantes ideas de proyectos de aprendizaje profundo. Este es un excelente proyecto para nutrir y mejorar sus habilidades de aprendizaje profundo. Crearás un modelo de aprendizaje profundo que utiliza redes neuronales para clasificar el género de la música automáticamente. Para este proyecto, utilizarás un conjunto de datos FMA (Free Music Archive). FMA es una biblioteca interactiva que comprende descargas de audio legales y de alta calidad. Es un conjunto de datos de código abierto y de fácil acceso que es ideal para una gran cantidad de tareas MIR, incluyendo la navegación y la organización de vastas colecciones de música.
Sin embargo, tenga en cuenta que antes de poder utilizar el modelo para clasificar los archivos de audio por género, tendrá que extraer la información relevante de las muestras de audio (como espectrogramas, MFCC, etc.).
Sistema de detección de somnolencia
La somnolencia de los conductores es una de las principales razones detrás de los accidentes de tráfico. Es natural que los conductores que frecuentan rutas largas se adormezcan cuando están al volante. Incluso el estrés y la falta de sueño pueden hacer que los conductores se sientan somnolientos mientras conducen. Este proyecto pretende prevenir y reducir este tipo de accidentes mediante la creación de un agente detector de somnolencia.
Aquí, usarás Python, OpenCV y Keras para construir un sistema que pueda detectar los ojos cerrados de los conductores y alertarlos si alguna vez se quedan dormidos mientras conducen. Incluso si los ojos del conductor están cerrados durante unos segundos, este sistema informará inmediatamente al conductor, evitando así terribles accidentes de tráfico. OpenCV monitorizará y recogerá las imágenes del conductor a través de una cámara web y las introducirá en el modelo de aprendizaje profundo que clasificará los ojos del conductor como ‘abiertos’ o ‘cerrados’.’
Generador de leyendas de imágenes
Esta es una de las ideas de proyectos de aprendizaje profundo en tendencia. Se trata de un proyecto de aprendizaje profundo basado en Python que aprovecha las redes neuronales convolucionales y LTSM (un tipo de red neuronal recurrente) para construir un modelo de aprendizaje profundo que pueda generar subtítulos para una imagen.
Un generador de pies de foto combina tanto técnicas de visión por ordenador como de procesamiento de lenguaje natural para analizar e identificar el contexto de una imagen y describirlos en consecuencia en lenguajes humanos naturales (por ejemplo, inglés, español, danés, etc.). Este proyecto reforzará tus conocimientos sobre CNN y LSTM, y aprenderás a implementarlos en aplicaciones del mundo real como esta.
Coloración de fotos antiguas B&W
Desde hace tiempo, la coloración automatizada de imágenes B&W ha sido un tema candente de exploración en el campo de la visión por ordenador y el aprendizaje profundo. Un estudio reciente afirmaba que si entrenamos una red neuronal utilizando un voluminoso y rico conjunto de datos, podríamos crear un modelo de aprendizaje profundo capaz de alucinar colores dentro de una fotografía en blanco y negro.
En este proyecto de coloreado de imágenes, se utilizará Python y la arquitectura DNN de OpenCV (está entrenada en el conjunto de datos ImageNet). El objetivo es crear una reproducción coloreada de imágenes en escala de grises. Para ello, utilizarás un modelo Caffe preentrenado, un archivo prototxt y un archivo NumPy.
Ideas de Proyectos de Aprendizaje Profundo – Nivel Avanzado
Detector
Detectron es un sistema de software de Facebook AI Research (FAIR) diseñado para ejecutar y ejecutar algoritmos de detección de objetos de última generación. Escrito en Python, este proyecto de aprendizaje profundo se basa en el marco de aprendizaje profundo Caffe2.
Detectron ha sido la base de muchos maravillosos proyectos de investigación, incluyendo Feature Pyramid Networks for Object Detection; Mask R-CNN; Detecting and Recognizing Human-Object Interactions; Focal Loss for Dense Object Detection; Non-local Neural Networks, y Learning to Segment Every Thing, por nombrar algunos.
Detectron ofrece una base de código de alta calidad y alto rendimiento para la investigación de detección de objetos. Incluye más de 50 modelos pre-entrenados y es extremadamente flexible – soporta una rápida implementación y evaluación de nuevas investigaciones.
WaveGlow
Esta es una de las interesantes ideas de proyectos de aprendizaje profundo. WaveGlow es una red generativa basada en el flujo para la síntesis del habla desarrollada y ofrecida por NVIDIA. Puede generar habla de alta calidad a partir de mel-espectrogramas. Combina los conocimientos obtenidos de WaveNet y Glow para facilitar una síntesis de audio rápida, eficiente y de alta calidad, sin necesidad de auto-regresión.
WaveGlow puede implementarse a través de una única red y también entrenarse utilizando una única función de coste. El objetivo es optimizar la probabilidad de los datos de entrenamiento, lo que hace que el procedimiento de entrenamiento sea manejable y estable.
OpenCog
El proyecto OpenCog incluye los componentes principales y una plataforma para facilitar la IA R&D. Su objetivo es diseñar un marco de Inteligencia General Artificial (AGI) de código abierto que pueda capturar con precisión el espíritu de la arquitectura y la dinámica del cerebro humano. El robot de IA, Sophia, es uno de los mejores ejemplos de AGI.
OpenCog también engloba OpenCog Prime – una arquitectura avanzada para la cognición encarnada robótica y virtual que incluye un surtido de componentes que interactúan para dar lugar a una inteligencia general artificial (AGI) equivalente a la humana como fenómeno emergente del sistema en su conjunto.
DeepMimic
DeepMimic es un «aprendizaje profundo por refuerzo guiado por ejemplos de las habilidades de los personajes basados en la física». En otras palabras, es una red neuronal entrenada aprovechando el aprendizaje por refuerzo para reproducir los movimientos capturados por el movimiento a través de un humanoide simulado, o cualquier otro agente físico.
El funcionamiento de DeepMimic es bastante sencillo. En primer lugar, tienes que configurar una simulación de la cosa que deseas animar (puedes capturar a alguien haciendo movimientos específicos y tratar de imitar eso). A continuación, se utilizan los datos de la captura de movimiento para entrenar una red neuronal mediante el aprendizaje por refuerzo. La entrada aquí es la configuración de los brazos y las piernas en diferentes puntos de tiempo, mientras que la recompensa es la diferencia entre lo real y la simulación en puntos de tiempo específicos.
IBM Watson
Uno de los ejemplos más excelentes de Machine Learning y Deep Learning es IBM Watson. El mejor aspecto de IBM Watson es que permite a los científicos de datos y a los ingenieros/desarrolladores de ML colaborar en una plataforma integrada para mejorar y automatizar el ciclo de vida de la IA. Watson puede simplificar, acelerar y gestionar los despliegues de IA, permitiendo así a las empresas aprovechar el potencial tanto del ML como del Deep Learning para impulsar el valor del negocio.
IBM Watson está integrado con Watson Studio para permitir a los equipos multifuncionales desplegar, supervisar y optimizar los modelos de ML/Aprendizaje Profundo de forma rápida y eficiente. Puede generar automáticamente APIs para ayudar a sus desarrolladores a incorporar fácilmente la IA en sus aplicaciones. Además, viene con paneles intuitivos que hacen que los equipos puedan gestionar los modelos en producción sin problemas.
Google Brain
Esta es una de las excelentes ideas de proyectos de aprendizaje profundo. El proyecto Google Brain es una investigación de IA de aprendizaje profundo que comenzó en 2011 en Google. El equipo de Google Brain, dirigido por el becario de Google Jeff Dean, el investigador de Google Greg Corrado y el profesor de la Universidad de Stanford Andrew Ng, tenía como objetivo sacar el aprendizaje profundo y el aprendizaje automático de los confines del laboratorio al mundo real. Diseñaron una de las mayores redes neuronales para el ML, compuesta por 16.000 procesadores informáticos conectados entre sí.
Para probar las capacidades de una red neuronal de este enorme tamaño, el equipo de Google Brain alimentó la red con miniaturas aleatorias de imágenes de gatos procedentes de 10 millones de vídeos de YouTube. Sin embargo, el problema es que no entrenaron al sistema para que reconociera el aspecto de un gato. Pero el sistema inteligente dejó a todos asombrados: se enseñó a sí mismo a identificar a los gatos y, además, ¡ensambló las características de un gato para completar la imagen de un gato!
El proyecto Google Brain demostró con éxito que las redes neuronales basadas en software pueden imitar el funcionamiento del cerebro humano, en el que cada neurona se entrena para detectar objetos concretos. Cómo los algoritmos de aprendizaje profundo están transformando nuestra vida cotidiana
El algoritmo de detección de cáncer de pulmón de 12 Sigma
12 Sigma ha desarrollado un algoritmo de IA que puede reducir los errores de diagnóstico asociados al cáncer de pulmón en sus primeras etapas y detectar los signos de cáncer de pulmón mucho más rápido que los enfoques tradicionales.
Según Xin Zhong, cofundador y director general de Sigma Technologies, normalmente las prácticas convencionales de detección del cáncer tardan en detectarlo. Sin embargo, el sistema de algoritmos de IA de 12 Sigma puede reducir el tiempo de diagnóstico, lo que permite mejorar la tasa de supervivencia de los pacientes con cáncer de pulmón.
En general, los médicos diagnostican el cáncer de pulmón examinando cuidadosamente las imágenes de la tomografía computarizada para comprobar si hay pequeños nódulos y clasificarlos como benignos o malignos. Los médicos pueden tardar más de diez minutos en inspeccionar visualmente las imágenes de TC del paciente en busca de nódulos, más el tiempo adicional para clasificar los nódulos como benignos o malignos.
Huelga decir que siempre queda una alta posibilidad de errores humanos. 12 Sigma sostiene que su algoritmo de IA puede inspeccionar las imágenes de TC y clasificar los nódulos en dos minutos.
Conclusión
En este artículo, hemos cubierto las principales ideas de proyectos de aprendizaje profundo. Comenzamos con algunos proyectos para principiantes que puedes resolver con facilidad. Una vez que termines con estos proyectos simples, te sugiero que vuelvas, aprendas algunos conceptos más y luego intentes los proyectos intermedios. Cuando te sientas seguro, podrás abordar los proyectos avanzados. Si deseas mejorar tus habilidades de aprendizaje profundo, necesitas poner tus manos en estas ideas de proyectos de aprendizaje profundo.
Estas son sólo un puñado de las aplicaciones del mundo real de Deep Learning realizadas hasta ahora. La tecnología es todavía muy joven: se está desarrollando mientras hablamos. El aprendizaje profundo tiene inmensas posibilidades de dar lugar a innovaciones pioneras que pueden ayudar a la humanidad a abordar algunos de los retos fundamentales del mundo real.
Si estás interesado en saber más sobre el aprendizaje profundo y la inteligencia artificial, echa un vistazo a nuestro programa PG Diploma in Machine Learning and AI que está diseñado para profesionales en activo y más de 450 horas de rigurosa formación.