¿Cuál es la diferencia entre un científico de datos y un estadístico?


Respuesta 1:

Sasha Mikheev

Específicamente, el código que escriben nunca está diseñado para ser utilizado por alguien además de ellos

pero rutinariamente arruinan sus análisis aplicando técnicas a los problemas sin comprender los supuestos detrás de esas técnicas.

josh_wills: Data Scientist (n.): Persona ...

Variables aleatorias independientes e idénticamente distribuidas

Estadísticas no paramétricas


Respuesta 2:

Los científicos de datos entienden las cosas desde una perspectiva de datos. Es necesario comprender qué características tienen los datos: ¿son escasos? ¿Tiene cierta estructura? ¿podemos aprovechar cierta información ortogonal de otras fuentes de datos? ¿Qué dicen los científicos del dominio sobre las propiedades de los datos? entre varios otros temas similares. La otra diferencia es que los científicos de datos son principalmente informáticos, desarrollan soluciones algorítmicas para problemas del mundo real, teniendo en cuenta las restricciones informáticas, que pueden ser causadas por el tamaño de los datos que contienen requisitos de espacio y tiempo. Para garantizar esto, un científico de datos puede necesitar conocer tecnologías como la computación paralela que pueden ayudarlo a abordar estos problemas. Dependiendo de los requisitos computacionales de la tarea en cuestión, especialmente en las aplicaciones que requieren cálculos sobre la marcha, es posible que desee realizar una parte de su procesamiento en la nube, alguna poderosa máquina de computación a la que se pueda acceder en la red, esto trae en el problema adicional de qué procesar en la nube, teniendo en cuenta que esto requeriría el envío continuo de datos en la red, aumentando el tiempo requerido. Esto es sólo la punta del iceberg. Hay una gran cantidad de otros problemas, como los que vienen con el procesamiento de datos en bruto, que dependiendo de la aplicación, pueden provenir de una variedad de fuentes, desde cámaras de monitoreo de tráfico hasta sensores montados en satélites que monitorean las condiciones climáticas en nuestro planeta.

Lo que estoy tratando de aclarar es que si bien un científico de datos requiere un conocimiento estadístico sólido, no es la única herramienta en su arsenal.


Respuesta 3:

Un estadístico debe conocer más estadísticas para poder llevar ese pesado término. Solo saber cómo encontrar correlaciones, calcular diferentes tipos de regresión y comprender solo las distribuciones de probabilidad no es suficiente. El mayor conocimiento de las estadísticas podría ser arbitrariamente complejo. Ambos deben comprender estadísticas básicas y presentar resultados significativos de una manera visual que sea interesante e informativa.

Un científico de datos debe ser capaz de formar su propia hipótesis y probarla, de la A a la Z. Deben descubrir los requisitos de hardware y software, y también poder codificarlo todo. Parece que map-reduce es realmente común. Al menos en algunos casos tienen que convertirse en administradores de servidores e incluso podrían estar ejecutando sistemas distribuidos.


Respuesta 4:

Un estadístico debe conocer más estadísticas para poder llevar ese pesado término. Solo saber cómo encontrar correlaciones, calcular diferentes tipos de regresión y comprender solo las distribuciones de probabilidad no es suficiente. El mayor conocimiento de las estadísticas podría ser arbitrariamente complejo. Ambos deben comprender estadísticas básicas y presentar resultados significativos de una manera visual que sea interesante e informativa.

Un científico de datos debe ser capaz de formar su propia hipótesis y probarla, de la A a la Z. Deben descubrir los requisitos de hardware y software, y también poder codificarlo todo. Parece que map-reduce es realmente común. Al menos en algunos casos tienen que convertirse en administradores de servidores e incluso podrían estar ejecutando sistemas distribuidos.