Big data es un concepto que está de moda. Esta popularidad conlleva su referencia frecuentemente desde los últimos años y un gran número de empresas asegura utilizarlo en su actividad. Sin embargo, no todo lo que se menciona sobre big data es cierto. Se afirma que el 65% de los proyectos de big data que se empiezan en España fracasan. Esta situación se debe a que las organizaciones no están preparadas, a la existencia de un gran desconocimiento, además de a una escasa formación.
¿Qué es Big data?
Una de las aproximaciones más completas de big dataes la facilitada por Gartner (2012): «Son activos de información caracterizados por su alto volumen, velocidad y variedad, que demandan soluciones innovadoras y eficientes de procesado para la mejora del conocimiento y toma de decisiones en las organizaciones»
Big data no es solo un conjunto de nuevas tecnologías, sino que es una combinación de negocio y analítica para obtener valor de los datos (convertirlos en información y conocimiento) que, por sus características, situación, volumen, variedad o velocidad antes no se aprovechaban.
Las aplicaciones del big data son infinitas, actualmente es impensable hacer marketing sin utilizar big data. Podemos destacar su reciente aplicación en CRM, Business Intelligence y Business Analytics.
Las 5 V’s del Big data
La gran generación de volúmenes de datos que se producen a diario, sumado a la velocidad con la que lo hacen, y la extensa variedad de procedencia, hacen que el procesamiento y análisis se convierta en un proceso de selección complejo. Por esta razón, se añaden al proceso dos nuevas uves, veracidad y valor, imprescindibles a la hora tomar decisiones y maximizar la rentabilidad.
Volumen: alusión al gran tamaño de generación de datos diarios, ya sean por parte de empresas o usuarios Velocidad: hace referencia a la rapidez en la que fluyen los datos, así como al tiempo de procesamiento a tiempo real. Variedad: los datos provienen de diferentes fuentes, ya sean estructurados, no estructurados y semiestructurados. Esta variedad es la que afecta directamente a la complejidad de almacenaje y análisis de estos. Veracidad: dado el gran volumen de datos que se generan, es necesario analizarlos para garantizar así la autenticidad y fiabilidad para la posterior toma de decisiones.</li><li>Valor: Este contexto menciona la necesidad de seleccionar aquellos datos que sean útiles para poder rentabilizarlos y generar ventajas competitivas. Los datos son el petróleo del siglo XXI
Tipos de datos
Siguiendo la clasificación de datos de Joyanes (2013), se distinguen tres categorías de datos según su procedencia:
Datos estructurados. Se presentan en un formato o esquema bien definido y que poseen campos fijos. Son hojas de cálculo, archivos, bases de datos tradicionales provenientes de CRM, ERP, etc., que han sido recolectados por profesionales del marketing en algún momento.
Datos semiestructurados.
No tienen formato definido, pero sí contienen etiquetas u otros marcadores con el fin de clasificar los elementos de estos. En esta categoría encontramos textos con etiquetas XML y HTML.
Datos no estructurados. Los más numerosos. Son datos de tipo indefinido, almacenados principalmente como documentos u objetos sin estructura fija ni bajo ningún patrón concreto. Pueden ser generados por máquinas y personas. Son archivos de audio, vídeo, fotografía y formatos de texto libre como emails, SMS, artículos, WhatsApp, etc.
Analítica de datos
Permite extraer información relevante en base a diferentes análisis de datos a partir de técnicas estadísticas, inteligencia artificial o nuevas tecnologías, con el objetivo de comprender el negocio y solucionar problemas de negocio para ayudar en la toma de decisiones estratégicas
Analítica descriptiva.
¿Qué ha ocurrido? Es la más simple, ya que utiliza técnicas sencillas como medias, desviaciones típicas, gráficos, etc. En una fase preliminar de procesamiento de datos, permite entender la situación en la que se encuentran las empresas, identificando tendencias, patrones y excepciones.
Business intelligence es un tipo de analítica de datos descriptivo. «Es la habilidad de aprender las relaciones de hechos presentados de forma que guíen las acciones hacia una meta deseada» (Schmarzo, 2014).
De manera general, la información que se extrae de business intelligence se organiza siguiendo dos modelos (González, 2017): Data warehouse. Almacén de datos estructurados que proporciona servicio a toda la empresa y permite la integración de la información de los distintos departamentos o áreas de negocio. Data mart. Repositorio estructurado de datos que proporciona servicio generalmente a una sola área del negocio; por ejemplo, al área comercial.
Analítica predictiva.
¿Qué va a pasar?Pretende predecir resultados basándose en tendencias, patrones y anomalías dentro del histórico de datos. Este tipo de analítica está ligada al data mining y al data science. El data mining o minería de datos es el proceso automatizado para el descubrimiento de información relevante en cantidades de datos masivas. Por su parte, el data science es la extracción de conocimiento a partir de datos.
Analítica prescriptiva. ¿Cuál es la mejor estrategia?
Trata de determinar las acciones que deben llevarse a cabo ante una situación concreta basándose en modelos predictivos.
Es una combinación entre la analítica predictiva y los algoritmos de optimización. No solo se predice lo que puede suceder, sino también las causas, y se añaden recomendaciones respecto a las acciones que se aprovecharán de esas mismas predicciones. Algunas de las metodologías más utilizadas dentro de estas categorías son: muestreo, calidad de los datos, preparación de los datos, modelización y evaluación.
Fuente: Puro Marketing