Hay conceptos que hasta que no encuentran la denominación adecuada no pasan a ser del dominio público: los acoge la ciudadanía y después el diccionario de la RAE. Uno de ellos es «big data» y en su caso la popularización ha sido bastante rápida. Aunque en la industria de los datos hay términos mucho más antiguos -«datawarehouse», «data mart», «data minning» o «data driving decissions»- cuyo significado es en determinados aspectos coincidente y en otros solo colindante con el significado de «big data», éste último llegó para quedarse. Él define la inmensa cantidad de información que se genera, almacena y reutiliza, y los demás lo complementan haciendo referencia a las acciones que a partir de él se ejecutan.
El éxito del término ha sido tan abrumador que hablar de «big data» se ha convertido casi en un lugar común en cualquier tertulia o sobremesa. A pesar de la popularización de su uso y de los múltiples campos de dominio común en los que se aplica («smart cities», prevención de fraude fiscal, medicina, prescripción de contenidos de televisión, etc.) su esencia misma sigue siendo algo desconocida e inaccesible para la mayoría y podríamos decir que infunde respeto y temor a partes iguales. Es algo muy parecido a lo que pasaba con el big brother de George Orwell: a veces era bueno y a veces temible; unos se sentían protegidos por el Ministerio de la Verdad, al tiempo que otros lo veían como una gran amenaza.
Aunque la industria del dato tenga ya décadas de antigüedad y trayectoria, es cierto que nos encontramos en un punto de su desarrollo que le ha permitido ganar notoriedad: políticos y gobernantes se han hecho conscientes de su poder y lo han convertido en herramienta indispensable; como antes hicieron con el petróleo o las armas.
Las empresas descubrieron el poder de los datos hace mucho más tiempo. Desde que en las ultimas décadas del siglo pasado se generalizó el control informático de la actividad empresarial, los ‘hombres del marketing’ sabían que analizando esos datos y, a veces, buscando también una explicación en datos exógenos, podían mejorar la adquisición de nuevos clientes. Los ‘hombres del crédito’ sabían que analizando patrones pasados de impago podrían predecir el futuro. Había nacido la industria del dato que hoy cuenta con millones de profesionales dedicados a mejorar la rentabilidad de las empresas a las que prestan su talento y hacerlo, a veces, reduciendo el impacto de la burocracia en el cliente final y mejorando las rutinas y tiempos de gestión. Los datos no significan ningún peligro para los ciudadanos; si no que, al contrario, no usarlos de un modo inteligente sería una auténtica estupidez.
Volviendo el éxito del término «big data», si ha triunfado frente a otros similares y muy usados por los profesionales del sector – smart data o inteligencia artificial- es por la importante apuesta que han hecho por él los proveedores de software y almacenamiento cloud. Primero hacemos que las empresas se empachen de datos tragando todo lo que generan los sistemas de comunicación y de transacciones. Después, es irremediable venderles un digestivo, para que hagan mejor la digestión de la enorme ingesta de datos.
Lo importante para una empresa es definir y construir bien su modelo de datos y no tragar todo los que se les ofrece solo porque el almacenamiento es casi gratis. Un modelo de datos es como una dieta: si nos acercamos a un todo incluido a aprovecharnos de lo que se nos ofrece, podemos acabar gastando mucho dinero en medicamentos digestivos. Aquí reside la perversión de las grandes tecnológicas también para el usuario particular: primero te facilitan la toma de fotografías, luego el reenvío, después las redes sociales, más tarde el cloud y, pronto, sistemas de gestión de almacenamiento para que los miles de millones de ciudadanos guardemos nuestros recuerdos. Ahí está el negocio del futuro: cobrarnos por ello.
En el ámbito empresarial el almacenamiento ilimitado tampoco es gratis. La acumulación de demasiados datos conduce a conclusiones poco claras y a veces erróneas. Algo que sucede porque no se ha aplicado un principio de relevancia al aprovechamiento de esos datos. Lo valioso no es saber qué dato es el bueno, es saber a cuál debo renunciar por iterartivo, por poco descriptivo, o por carente de calidad.
Fuente: ABC Economia