¿Cuál es la diferencia entre red neuronal convencional y convolucional?


Respuesta 1:

Una red neuronal convencional es como una combinación de neuronas que aprende patrones de cualquier entrada que lo discrimine. Utiliza el mismo proceso de aprendizaje para todo tipo de datos. Entonces, puedes decir que todo lo que le preocupa es buscar un patrón. Parece bueno, ¿verdad? Sin embargo, hay un problema con este proceso. Aunque estamos buscando IA generalizada, un proceso de aprendizaje general como una simple red neuronal de múltiples capas no será nuestra respuesta. Al menos no con la precisión que estamos buscando en este momento. Por lo tanto, necesitamos redes que puedan especializar el aprendizaje según el tipo de datos. Antes, me mudo a CNN, déjenme aclarar la verdadera razón de la necesidad de especialización. Las redes neuronales se inspiran en la mayor red neuronal que conocemos, la red de la que estamos hechos. Ahora, si nos miramos a nosotros mismos y al hallazgo reciente, especialmente en las últimas 7 décadas, descubrirá que la mayoría de las tareas tienen un filtro específico para ellos. Por ejemplo, escuchar tiene su propio filtro mientras que para ver un objeto nuestro cerebro usa su propio filtro específico. Entonces, estos filtros especializados nos ayudan a tratar los datos de manera un poco diferente dependiendo de la tarea. Estos hallazgos en la neurociencia se convirtieron en una inspiración para redes neuronales especializadas como CNN, RNN y más.

Ahora, sobre CNN, una red neuronal de convolución es un tipo que usa la convolución como filtro para aprender de los datos. Es una de esas redes neuronales que utiliza las copias de la misma neurona para aprender. Por lo tanto, aprende más con un conjunto fijo de neuronas que las redes neuronales simples. La red neuronal de convolución utiliza una combinación de operador de convolución junto con el zoom llamado capa de agrupación. Por lo tanto, se complica alrededor de los datos, aprende patrones y luego se acerca al patrón aprendido para obtener un aprendizaje aún más específico sobre dónde está ese patrón en los datos. Esto lo hace realmente diferente de lo que hace una red neuronal simple. Está desarrollando características más decisivas para las siguientes capas. No solo se trata de aprender todo lo que los datos tienen para ofrecer, sino también de lo que queremos que aprenda. Por ejemplo, si alimentaste los datos de una imagen a una red neuronal simple, no solo aprenderá los bordes, los parches, el borde de los colores, sino incluso más cosas que nosotros como persona podríamos no notar, sino que será un modelo matemático. Lo que hace es que, a veces, complica los procesos de aprendizaje y da como resultado un hiperplano un poco más pobre de lo que podría haber aprendido. Por otro lado, CNN con convolución y agrupación, procesa cada píxel, aprende características más efectivas (agrupación máxima, agrupación mínima, agrupación promedio), lo que resulta en un hiperplano de decisión mucho mejor.

También en términos de cálculo, CNN y las redes neuronales simples difieren mucho. Una red neuronal simple de tres capas hará más cálculos que una red neuronal de convolución de tres capas. La razón es bastante simple. CNN está seleccionando y reenviando solo las características decisivas más altas a la siguiente capa. Por lo tanto, cada capa siguiente tiene que lidiar con un menor número de píxeles, por lo tanto, un menor número de cálculos.

Nota: Un poco fuera de lugar pero perspicaz. Es posible que haya escuchado frases como "puedes aprender a hacer esto", "con la meditación puedes tener un mejor control", "practicar ... practicar ... practicar ..." etc. ¿Qué meditación o el arte de repetir lo mismo a lo largo del tiempo? lo que hace es que entrena tus filtros para aprender con mayor precisión con más datos y menos ruido. Las redes neuronales son una visión emocionante para nuestras mentes humanas y viceversa. Es fascinante, inspirador e increíble. Explorarlo es nada menos que explorar un universo entero.

Espero que esto te ayude.

¡Feliz aprendizaje!


Respuesta 2:

Creo que por una red neuronal convencional, te estás refiriendo a una red neuronal artificial (ANN). ANN fue el primer algoritmo de aprendizaje profundo. La idea detrás de ANN es que trata de imitar el cerebro de un humano con una capa de entrada, una capa de salida y varias capas ocultas en función de la complejidad de un problema. Cada capa tiene varias neuronas, cada una de las cuales se enfoca en varias características e ignora varias otras para encontrar la salida en lugar de enfocarse en todas las características con el mismo peso.

La Red neuronal convolucional (CNN) fue diseñada para preprocesar imágenes para que puedan ser alimentadas a un ANN. Dado que las imágenes no son enteros ni cadenas, sino una gran variedad de píxeles con valores que van de 0 a 255, no se pueden alimentar directamente a la capa de entrada de la ANN. Tendrá que pasarlo por varios filtros para eliminar el ruido de una imagen y convertirlo en una matriz unidimensional más pequeña de características para alimentar a una ANN.

Puede leer más sobre ambos en estos enlaces:

¿Cómo funciona la red neuronal artificial (ANN)? ¡Simplificado!

Una guía completa de redes neuronales convolucionales: la forma ELI5


Respuesta 3:

Creo que por una red neuronal convencional, te estás refiriendo a una red neuronal artificial (ANN). ANN fue el primer algoritmo de aprendizaje profundo. La idea detrás de ANN es que trata de imitar el cerebro de un humano con una capa de entrada, una capa de salida y varias capas ocultas en función de la complejidad de un problema. Cada capa tiene varias neuronas, cada una de las cuales se enfoca en varias características e ignora varias otras para encontrar la salida en lugar de enfocarse en todas las características con el mismo peso.

La Red neuronal convolucional (CNN) fue diseñada para preprocesar imágenes para que puedan ser alimentadas a un ANN. Dado que las imágenes no son enteros ni cadenas, sino una gran variedad de píxeles con valores que van de 0 a 255, no se pueden alimentar directamente a la capa de entrada de la ANN. Tendrá que pasarlo por varios filtros para eliminar el ruido de una imagen y convertirlo en una matriz unidimensional más pequeña de características para alimentar a una ANN.

Puede leer más sobre ambos en estos enlaces:

¿Cómo funciona la red neuronal artificial (ANN)? ¡Simplificado!

Una guía completa de redes neuronales convolucionales: la forma ELI5