La respuesta o, a veces, incluso la pregunta se encuentra en los datos. Mientras que para las empresas más avanzadas esto hace ya tiempo que es algo natural, el valor añadido de los datos está ganando cada vez más reconocimiento también en el público general. En esencia, los datos proporcionan la base para:
- Decisiones empresariales (p. ej. dirección, compras)
- Pronósticos (p. ej. tendencias, evolución de ventas)
- Medición del rendimiento (p. ej. éxito de la empresa, desempeño)
Estos tres puntos, por minimalistas que puedan parecer, muestran por qué las empresas que han reconocido el valor de los datos tienden a tener más éxito. Sin embargo, para que los datos proporcionen las preguntas deseadas —o también las respuestas—, es necesaria la preparación adecuada de los datos, el análisis, la visualización de los datos y una serie de pasos de procesamiento adicionales. Muchas tareas en este ámbito recaen en las disciplinas de Data Engineering, Data Science y Data Analytics.
Data Engineering
Data Engineering se ocupa de la generación, recopilación, mantenimiento, preparación, enriquecimiento, validación y transmisión de datos. Además, crea una infraestructura adecuada y aplicaciones idóneas para el análisis. De este modo, Data Engineering sienta las bases para los análisis de datos. En resumen, Data Engineering puede abarcar las siguientes subáreas:
- Creación de conjuntos de datos relevantes y fiables
- Conceptualización y provisión de una arquitectura de sistemas
- Programación de las aplicaciones correspondientes
- Diseño y configuración de bases de datos
- Configuración de sensores e interfaces
Las personas que trabajan en esta disciplina lo hacen bajo las denominaciones profesionales de Data Engineer, ingeniero de datos, Big Data Engineer o también arquitecto de Big Data. Los ingenieros de datos trabajan, por ejemplo, con programas como Python, SQL y Linux y deberían contar, entre otras, con competencias en las áreas de gestión de clústeres, visualización de datos, procesamiento por lotes (batch) y Machine Learning. Aunque los Data Engineers no participan en el análisis de los datos, sí necesitan una comprensión básica de los datos empresariales para crear una arquitectura adecuada. La calidad de esta depende directamente de la capacidad para crear y mantener canalizaciones de datos.
Data Science
En el caso de Data Science (en español, ciencia de datos) se trata de una ciencia interdisciplinaria. Combina métodos y conocimientos de las matemáticas, la informática y el sector específico en el que se aplica la disciplina. En el marco de Data Science se analizan grandes volúmenes de datos (Big Data). Los resultados de estos análisis pueden servir como base para la toma de decisiones a la hora de detectar anomalías o como una “mirada al futuro” (pronóstico de sucesos o desarrollos futuros). En primer lugar, mediante Data Science se genera nuevo conocimiento. Esto afecta potencialmente también a conocimiento sobre áreas desconocidas de las que no se sabía que eran desconocidas. Así, pueden identificarse nuevas soluciones para problemas hasta ahora desconocidos. El foco real reside en identificar preguntas, sin apuntar realmente a encontrar una respuesta específica. Las personas que trabajan en este ámbito se denominan Data Scientists o también científicos de datos y pueden proceder de diversas disciplinas (p. ej. informáticos, especialistas en administración de empresas, etc.). Los análisis de grandes volúmenes de datos se llevan a cabo en Data Science mediante aprendizaje automático (MI) e inteligencia artificial (IA). En comparación con la Business Intelligence, que está orientada a interpretar datos pasados (análisis descriptivo), Data Science analiza datos pasados para realizar predicciones futuras (análisis predictivo).
Data Analysis
En el marco de la Data Analysis (en español, análisis de datos) el foco se sitúa en el análisis estadístico de conjuntos de datos ya existentes. El objetivo es la creación de métodos mediante los cuales se puedan recopilar, procesar y organizar los datos para, posteriormente, encontrar soluciones a los problemas existentes. En general, el análisis de datos se ocupa de temas específicos y sirve para responder preguntas concretas. Las personas que trabajan en este ámbito se denominan analistas de datos. La base de sus análisis son los datos en forma de modelos de datos o herramientas como paneles de control (dashboards) interactivos y KPIs.
Las diferencias entre las disciplinas

Como puede apreciarse en las definiciones de las distintas disciplinas, estas están estrechamente interconectadas.
Data Engineer & Data Scientist
Los ingenieros de datos sientan el cimiento del ámbito de Data Science. Proporcionan datos formateados, escalables y seguros. Para ello se necesitan conocimientos en las áreas de programación y arquitectura de sistemas. Un buen Data Engineering se caracteriza por anticipar las necesidades de Data Science y preparar y poner a disposición los datos de forma acorde. La disciplina Data Science toma estos datos y genera insights mediante algoritmos robustos. Para ello, en el área de Data Science se requieren tanto conocimientos de programación como de análisis.
Data Scientist & Data Analyst
Si se comparan las tareas de los científicos de datos y los analistas de datos, la diferencia radica principalmente en su enfoque. Los primeros se ocupan de un tema en un nivel macro y los segundos en un nivel micro. Los Data Scientists se centran en la identificación de nuevos aspectos; su objetivo es determinar qué preguntas debería plantearse realmente una organización. Se trata, por tanto, de la exploración de nuevas tendencias y desarrollos y de la identificación de métodos de análisis optimizados. Los Data Analysts, en cambio, buscan respuestas a preguntas concretas o identificar datos inmediatamente utilizables. Si, por tanto, Data Analysis sigue a Data Science, gracias a análisis adicionales pueden generarse insights utilizables a partir de preguntas inicialmente inespecíficas.
