¿Cuál es la diferencia entre minería de datos, aprendizaje automático y reconocimiento de patrones?


Respuesta 1:

La minería de datos se trata principalmente de encontrar características o patrones relevantes en un dato en particular, esto se puede lograr mediante el aprendizaje automático, especialmente algoritmos de aprendizaje no supervisados, como el agrupamiento. La minería de datos se trata principalmente de tratar de encontrar una explicación humana comprensible a los datos dados. Por ejemplo, encontrar patrones financieros significativos para mejorar las ganancias y las ventas.

El aprendizaje automático se trata de métodos de aprendizaje, es decir, métodos que mejorarán lenta e incrementalmente un sistema con parámetros ajustables. ML está muy relacionado con la optimización numérica en matemáticas, se trata de encontrar el mejor conjunto de valores de parámetros que reduzcan el error entre la salida real y la salida deseada, en un contexto supervisado en su mayoría. Las derivadas de parámetros se utilizan para determinar la dirección en la que se ajustan los parámetros, por lo tanto, ML se basa principalmente en el descenso de gradiente, es decir, el descenso de gradiente estocástico.

El reconocimiento de patrones, por otro lado, es una aplicación de ingeniería de minería de datos y ML, es un proceso de reconocimiento de patrones como imágenes o voz. Una vez que se entrena una red neuronal usando algoritmos ML, se puede usar para el reconocimiento de patrones. Se pueden usar otros métodos, incluso los que no están relacionados con ML y la minería de datos para el reconocimiento de patrones, como un sistema de reconocimiento de patrones totalmente artesanal.

Pero las tres áreas se superponen tanto que es fácil pensar que son lo mismo. Por ejemplo, la visión por computadora y la visión artificial solo están separadas por la aplicabilidad, la visión por computadora está más en el lado académico / de investigación, mientras que la visión en la máquina está en el lado de la ingeniería práctica, pero técnicamente son lo mismo.

EDITAR: para agregar, la minería de datos se asocia principalmente con estadísticos, ML se asocia principalmente con informáticos, mientras que el reconocimiento de patrones se asocia principalmente con ingenieros eléctricos / electrónicos.

Espero que esto ayude.


Respuesta 2:

La minería de datos es el proceso de análisis de datos que se extrae de los datos para encontrar información útil o como una etapa de preprocesamiento del aprendizaje automático, como la selección de creación de características y demás. También incluye una visualización y hace que los datos sean interpretables.

El reconocimiento de patrones parece ser un subcampo del aprendizaje automático que se presenta como una versión precursora de ML y se preocupa más por reconocer algunas construcciones visuales o elementos comunes en un nivel más abstracto. La parte remanente de ML está más preocupada por las predicciones y las puntuaciones relacionadas en diferentes dominios. También tiene razones históricas como la conocida conferencia CVPR.


Respuesta 3:

Estas cosas están interconectadas y funcionan juntas en la mayoría de las situaciones, pero tienen diferentes propósitos. Trataré de explicar las principales diferencias.

El aprendizaje automático es un término que cubre todas las tecnologías en las que una máquina puede "aprender" por sí misma, sin tener ese conocimiento programado explícitamente en él. La mayoría de los tipos son de naturaleza iterativa y mejoran con el tiempo en cada tarea que se les pide que realicen.

Muchas aplicaciones móviles usan aprendizaje automático (por ejemplo, aplicaciones de compras como la aplicación móvil Wish). El aprendizaje automático es básicamente la idea de entrenar máquinas para reconocer patrones y aplicarlos a problemas de partículas. La ciencia de datos es la ciencia de aplicar ML a problemas prácticos como la creación de mejores resultados de motores de búsqueda o la clasificación de imágenes.

El reconocimiento de patrones es el proceso de reconocer patrones mediante el uso de un algoritmo de aprendizaje automático. El reconocimiento de patrones se puede definir como la clasificación de datos basada en el conocimiento ya adquirido o en información estadística extraída de patrones y / o su representación. Uno de los aspectos importantes del reconocimiento de patrones es su potencial de aplicación.

Ejemplos: reconocimiento de voz, identificación del hablante, reconocimiento de documentos multimedia (MDR), diagnóstico médico automático. En una aplicación típica de reconocimiento de patrones, los datos sin procesar se procesan y se convierten en una forma que pueda utilizar una máquina. El reconocimiento de patrones implica la clasificación y el grupo de patrones.

  • En la clasificación, se asigna una etiqueta de clase apropiada a un patrón basado en una abstracción que se genera usando un conjunto de patrones de entrenamiento o conocimiento de dominio. La clasificación se utiliza en el aprendizaje supervisado. La agrupación generó una partición de los datos que ayuda a la toma de decisiones, la actividad específica de toma de decisiones que nos interesa. La agrupación se utiliza en el aprendizaje no supervisado.

Las características pueden representarse como variables binarias continuas, discretas o discretas. Una característica es una función de una o más mediciones, calculadas de manera que cuantifica algunas características significativas del objeto.

La minería de datos es el proceso de clasificar una gran capacidad de datos para identificar y establecer relaciones entre estos datos para resolver problemas a través del análisis de datos. Las herramientas de minería de datos tienen muchos propósitos diferentes y uno de ellos es predecir tendencias futuras.

Las propiedades clave de la minería de datos son:

  • Descubrimiento automático de patrones; Enfoque en grandes conjuntos de datos y bases; Predicción de resultados probables; Creación de información procesable;

Existe una gran superposición entre la minería de datos y las estadísticas. De hecho, la mayoría de las técnicas utilizadas en la minería de datos se pueden ubicar en un marco estadístico. Sin embargo, las técnicas de minería de datos no son las mismas que las técnicas estadísticas tradicionales.

Los métodos de minería de datos son adecuados para grandes conjuntos de datos y pueden automatizarse más fácilmente. De hecho, los algoritmos de minería de datos a menudo requieren grandes conjuntos de datos para la creación de modelos de calidad.

Por lo tanto, creo que describí todos los conceptos básicos sobre estos términos y ahora debería comprender las diferencias.