¿Cuál es la diferencia entre trabajar en análisis y ciencia de datos?


Respuesta 1:

Data Analytics es un lugar fácil en comparación con la ciencia de datos.

Veamos las diferencias entre ellos y los roles y habilidades de ambos para que pueda tener una idea clara sobre el rol de trabajo del científico y analista de datos.

Científico de datos vs analista de datos según la definición

  • Un rol de Data Scientist es predecir el futuro basado en patrones pasados. Mientras que el analista de datos encuentra información significativa de los datos, el papel del científico de datos es generar su propia pregunta. Pero el analista de datos encuentra las respuestas a otros grupos de preguntas. Como científicos de datos tienen lo que si. Pero los analistas de datos son los que hacen el análisis diario. El científico de datos aborda los problemas comerciales. También ofrece una predicción precisa del valor de los negocios una vez resuelto. Mientras que Data Analyst solo aborda problemas comerciales, el científico de datos utiliza el aprendizaje automático para extraer información. Pero Data Analyst utiliza una herramienta R / SAS para extraer información. El rol del científico de datos es explorar y examinar la información. Explora información de muchas fuentes desconectadas. Pero Data Analyst explora y examina datos de una sola fuente. La predicción de Data Scientist es muy alta. Puede ser preciso hasta el 90%. Pero, los analistas de datos no predicen. Solo resuelven la pregunta dada por el negocio. A Los científicos de datos formularán preguntas. Formulan esas preguntas cuyas soluciones pueden beneficiar al negocio. Pero el analista de datos solo resuelve las preguntas formuladas por las empresas. Un científico de datos debe tener sólidos conocimientos en modelos estadísticos y aprendizaje automático. El analista de datos necesita un sólido conocimiento en SAS / R

Analista de datos vs Científico de datos según las responsabilidades

a) Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos. Predicción del problema empresarial. Sus funciones son dar resultados futuros de ese negocio. Desarrollar modelos de aprendizaje automático y métodos analíticos. Encontrar nuevas preguntas comerciales que luego puedan agregar valor al negocio. Minería de datos utilizando métodos de vanguardia. Presentar resultados de una manera clara y haciendo el análisis ad-hoc.

b) Responsabilidades del analista de datos

  • Identifique cualquier problema de calidad de datos en la adquisición de datos. Solución de problemas comerciales. Al mapear y luego rastrear los datos. Un analista de datos debe coordinarse con los ingenieros para recopilar nuevos datos. Realizar un análisis estadístico de los datos comerciales. Documentar los tipos y la estructura de los datos comerciales.

4.3. Analista de datos versus roles de científico de datos basados ​​en conjuntos de habilidades

a) Roles de Data Scientist según sus habilidades

  • Los creativos de datosDesarrolladores de datosInvestigadores de datosLos empresarios de datos

b) Roles de analista de datos según sus habilidades

  • Administradores de bases de datosOperacionesThe Data ArchitectsA Data Analysts

4.4. Data Scientist vs Data Analyst - Salario

Las estadísticas a continuación muestran el salario de Data Scientist vs Data Analyst-

Para saber más, consulte el siguiente enlace:

Data Science vs Data Analytics


Respuesta 2:

Gracias por el A2A.

No estoy de acuerdo con que el análisis y la ciencia de datos sean lo mismo. Basado en las demandas de nuestro equipo de ciencia de datos, desafortunadamente rechazo a muchos candidatos que trabajan en 'análisis' que postulan.

Hay mucho ruido en el espacio, y no hay una definición ampliamente aceptada, por lo que evitaré entrar en "debates de definición".

Pero a nivel práctico, el equipo de ciencia de datos tiene la responsabilidad del desarrollo y la implementación del modelo. Independientemente de si son modelos de simulación, modelos de aprendizaje automático, modelos de predicción de series temporales o modelos de inferencia estadística, la responsabilidad recae en la ciencia de datos para:

  • Realice la traducción del problema y elija el (los) enfoque (s) de modelado correcto (s) Construya y / o diseñe la canalización de datos de una manera que sea adecuada para el modelado, con la salida de nuestros proyectos a menudo proporcionando requisitos a otros equipos de datos Elija, optimice y evalúe El modelo (s) de forma iterativa. Apoyar las actividades en la ampliación de los modelos en la producción.

Todo lo demás no es único y puede ser realizado por profesionales de datos o análisis u otros equipos.

Esto incluye herramientas de código abierto, programación, trabajar con 'big data', contar historias, tener conocimiento de dominio, hacer procesamiento de datos, crear visualizaciones, proporcionar información, ser curioso, tener doctorados, lidiar con datos no estructurados.

Pero cuando tiene un profesional de análisis y un científico de datos, y necesita enfocarse en un modelo, debe recaer en la ciencia de datos.

Muchos lectores también tendrían la implicación de esto con bastante claridad:

  • Necesitamos muchos profesionales de análisis, profesionales de datos (y muchos otros) junto con científicos de datos para tener éxito Muchos científicos de datos en realidad no están haciendo trabajo de ciencia de datos

Esta no es una respuesta exhaustiva, pero explica mucho del ruido, expectativas desalineadas, números de demanda inexactos y brechas en la ejecución.


Respuesta 3:

La respuesta corta es que no hay diferencia y que una organización competente tendrá un equilibrio de ambos. Ambas son aplicaciones de interpretación humana de datos informáticos. La diferencia esencial es que el "análisis de datos" es cualquier cosa que su contador promedio reconocerá en una hoja de cálculo, en el contexto de lo que se presenta en una hoja de cálculo. Es decir cuentas, porcentajes, tendencias. Mientras que la ciencia de datos da un paso más allá hacia medidas más sofisticadas como correlaciones, intervalos de confianza, momentos. También con la ciencia de datos, es más probable que uno se involucre con la predicción y diseñe algunos subconjuntos representativamente significativos de los datos completos.

Así que tomemos un ejemplo de hamburguesa. Una cadena de comida rápida en California contrató a mi empleador anterior para que pusiera una aplicación analítica sobre sus datos de punto de venta. Nadie antes de ese momento tenía nada más que una comprensión muy amplia de cuánto dinero ganaban diariamente sus 400 tiendas impares. Los nuevos datos de POS utilizaron códigos de producto, y ahora sabíamos hasta cada recibo, cuánto dinero gastó cada cliente en cada producto en el menú. Recuentos simples por tiempo. Esto le dijo a la cadena qué períodos del día vendían qué comida y cuánto. Luego hicieron algunos cálculos matemáticos simples para calcular la eficiencia de sus cocineros y cajeros y descubrieron que estaban contratando personal y turnos en el momento equivocado. Entonces, solo contando, descubrieron que debían realizar un turno de cuatro horas de 10 a.m. a 2 p.m. en lugar de uno de 8 a.m. a mediodía porque interrumpir el turno al comienzo de la 'hora del almuerzo' estaba mal. No hubo una hora de almuerzo, hubo un almuerzo de cuatro horas con un pico alrededor de las 12:20 pm.

Cambiaron sus patrones de personal, aumentaron la moral de los empleados y la satisfacción del cliente simplemente siguiendo lo que los * datos * decían sobre los tiempos de compra de los clientes, en lugar de las ideas estándar sobre lo que es la hora del almuerzo. Lo mismo con el desayuno, lo mismo con la cena, lo mismo con la noche. Eso es analítica.

Ahora tome el mismo conjunto de datos y ejecute correlaciones en qué partes se venden con qué hamburguesas. (No hicieron esto). Y descubriría que, por ejemplo, las personas que ordenaron tacos casi nunca pidieron papas fritas con ellos. Entonces eso reorganizaría lo que venden como un 'combo de comida'. Luego, cuando alguien ordena un taco en el camino, un aviso en tiempo real podría decirle al cajero que sugiera un lado de taquitos o salsa extra.

Mi experiencia me dice que el grueso del valor a extraer de los datos está operativo. Es decir que el conteo por tiempo es muy valioso, al igual que agregar dimensiones y atributos a datos simples. Pero cuando desea comenzar la predicción, necesita herramientas más sofisticadas que la simple agregación. La recompensa está en análisis, refinando que la recompensa está en modelado predictivo. Pero sí, siempre necesita la intuición de los gerentes que operan el negocio para comprometerse (o no) con las proyecciones de su computadora. Ahí reside el arte de la inteligencia empresarial, que consiste en conocer el equilibrio correcto de datos informáticos con respecto al conocimiento humano para aplicarlo a un problema empresarial. [1]

La parte más importante del trabajo de un científico de datos, en mi opinión, es comprender las restricciones matemáticas de los datos para determinar cuánto se puede confiar y cuál es un tamaño de muestra adecuado para considerar dadas las posibilidades de seguir su salida. En otras palabras, se trata de un tipo especializado de inferencia. Ahora que la tecnología y la metodología han hecho que sea menos costoso agregar cantidades masivas de datos, los estadísticos y los científicos de datos necesitan decirnos cuánto arriesgamos al depender de esos datos, o si no tenemos suficiente para tomar las decisiones adecuadas. [2]

Notas al pie

[1] Los cuatro pilares de la inteligencia empresarial

[2] Barreras al valor agregado en el análisis de datos