Observatorio Tecnológico de Hidalgo

Nuevos beneficios y dolores de cabeza del Big Data

5 August, 2019

by OtechUAEH

En el pasado era casi imposible saber cuántos libros sobre cocina se habían publicado en el mundo, por ejemplo. Contabilizar cualquier cosa era una tarea titánica, sin mencionar lo que implicaba almacenar esta información.

Hoy hay una explosión de datos que se debe, en parte, a los avances en la tecnología. De una forma inimaginable internet reúne una vasta cantidad de información en línea sobre todas las áreas del conocimiento. Solo a principio de año se anunció en las noticias que el telescopio Pan-STARRS (Panoramic Survey Telescope & Rapid Response System) liberó datos astronómicos equivalentes a 30.000 veces el contenido total de texto de Wikipedia o dos mil millones de selfies. Es el mayor volumen de información astronómica jamás publicado: contiene 1,6 petabytes de datos (un petabyte es un millón de gigabytes).

Manejados de manera adecuada los datos pueden usarse para descubrir qué hay allá afuera de este globo terrestre, detectar tendencias del mercado, prevenir enfermedades, mejorar la movilidad en las ciudades, facilitar la relación de los ciudadanos con las entidades públicas y hasta combatir el crimen, prediciendo su ocurrencia y optimizando el uso de los recursos policiales.

Pero en manos inescrupulosas este fenómeno puede generar problemas y dilemas como asegurar datos sensibles como los bancarios y de qué manera demandar la protección a la privacidad a las compañías (ver análisis).

Monstruosa cantidad

En la actualidad, según información de The Economist, el negocio del manejo de la información (ayudar a las compañías a darle sentido a las grandes cantidades de datos), se ha incrementado el doble que la industria del software.

Cuenta Santiago Villegas Ceballos, estudioso de la gestión de la información y consultor en cultura digital, que los grandes teóricos de la administración hablaban a mediados del siglo pasado de la era de la información como un momento histórico en el que el conocimiento era el nuevo capital. Ahí ya había un interés de los negocios en adquirir conocimiento estratégico, administración de datos y gestión del conocimiento.

Los académicos argumentan que la información es una colección de datos y que el conocimiento se compone de líneas de información. Debido a que hay una línea delgada entre los datos e información se usan de manera indiscriminada en este artículo.

La cantidad se incrementa, según la ley de Moore – que la industria de los computadores toma como un hecho– diez veces cada cinco años y la potencia de procesamiento y la capacidad de almacenamiento de los chips de computadora se duplican o sus precios se reducen a la mitad aproximadamente cada 18 meses.

¿Qué hacen con los datos?

Así como crecen se comparten. De acuerdo a Cisco, multinacional estadounidense, el tráfico total de Internet ha experimentado un crecimiento espectacular en las últimas dos décadas. Hace más de 20 años, en 1992, las redes globales de internet transportaban aproximadamente 100 Gigabytes (ver tabla) de tráfico por día. Diez años más tarde, en 2002, el tráfico global ascendió a 100 GB por segundo. En 2017, el tráfico global de Internet alcanzó más de 45.000 GB por segundo.

En internet cualquier interacción es un dato. Por eso ahora se habla de Big Data (un conjunto de datos extremadamente grande). Mover el mouse resulta un dato, dar like a una página o a un artículo sobre mascotas también lo es, dice Andrés Mora de la agencia de comunicaciones creativas Apple Tree. “Pero un dato por sí solo no vale nada, estos comienzan a cobrar valor cuando se analizan, se cruzan y se usan para tomar decisiones”.

El gobierno colombiano los usó alguna vez, narra Edgar Medina, experto en marketing digital y empleado del portal web oficial de la Alcaldía de Bogotá, para determinar que el documento del RUT era uno de los más solicitados y de esta manera mejoraron ese servicio al habilitar extraerlo a través de la web.

Hay otros usos de la información como analizarla para vender más. Mora trabaja con datos en el marketing también y explica que desde la publicidad se ha intentado entender al consumidor tradicionalmente desde las encuestas, sondeos o grupos focales. Pero las cosas están cambiando.

Internet está permitiendo un grado de sofisticación nunca antes vista a través de algoritmos de computador que de forma automática categorizan al usuario en segmentos de consumo (por intereses, edad, género…). La red global permite capturar acciones como cuánto tiempo estuvo en ese portal sobre ciclismo y convertirlas en unos y ceros (ver tabla de inflación de datos).

Por esto es que en el ámbitos de los datos personales hay escándalos recientes que evidencian que quienes tienen la posibilidad de contar con sus datos también podrían usarlos para manipularlo.

“Cuando algo es gratis el producto es usted”, es común escuchar en Sillicon Valley según Villegas. Él advierte que las vidas de las personas se han convertido en un paquete de datos para vender. Solo se requiere su consentimiento para comercializarlos. El problema es que no todas las empresas y gobiernos son transparentes en su uso o el usuario desprevenido no lee los términos y condiciones al acceder al servicio.

Cualquier persona nacida en los últimos 30 años en medio del contexto digital se podría preguntar, ¿qué importa si un grupo de empresas de las que nunca ha escuchado conocen su edad o género? Según Ana María Mesa, especialista en derecho informático y privacidad de datos y fundadora de Law TIC, importa bastante, y más si usted no sabe que el mundo que ve hoy tiene un filtro comercial.

Por eso fue muy importante lo que se logró a principios de este año, cuenta: la Superindustria exigió a Facebook fortalecer medidas de seguridad para proteger datos personales de más de 31 millones de colombianos mediante la resolución 1321 del 24 de enero de 2019.

Porque para muchos no es viable convertirse en ermitaños digitales. Deshacerse del celular le evitaría que empresas como Spotify o Apple music, que lo conocen para ofrecerle “un mejor servicio”, le presenten música que por sus análisis de datos sobre sus gustos sabrán será de su agrado.

Una situación con claroscuros. Consultores como Villegas están de acuerdo en que hacer uso de los datos privados de millones de personas influiría en formas tan sutiles de vivir como la de que un algoritmo le ayude a encontrar música afín a sus intereses, hasta como sucedió en 2016, que una empresa que tenga su perfil de personalidad y más datos sobre usted lo influencie y no siempre de manera limpia en su intención de voto. Eso ya pasó con los datos privados que Facebook le compartió de forma inapropiada a Cambridge Analytica y que terminarían influyendo en las votaciones presidenciales de Estados Unidos en 2016.

Escándalos por los datos

El profesor David Carroll, de la Parsons School for Design, demandó a Cambridge Analytica –la empresa británica que participó en la minería de datos para ayudar a la campaña de Donald Trump– buscando que le devolviera los datos que había recaudado sobre él a partir de su huella digital (ubicaciones geográficas de sus visitas, post en Facebook y test de personalidad, por ejemplo) y para saber de qué manera usaron su perfil como votante. Lo narra en el documental recién estrenado en Neftlix The great hack (2019). Quería conocer en más detalle cómo lo habían perfilado y qué hicieron con su información, si lo manipularon o no.

La desaparecida empresa declarada en bancarrota luego de haber apoyado cientos de campañas políticas (Argentina en 2015, Trinidad y Tobago en 2009, India en 2010, Italia en 2012, Kenya en 2013…) haciendo cruce de datos y catalogando individuos a partir de su personalidad, nunca se los quiso entregar. Prefirió cerrar a devolver la información. El documental cuenta cómo la compañía usó cookies, esos archivos informáticos diminutos enviados por los sitios web que se almacenan en cada navegador y rastrean, por ejemplo, los términos de búsqueda y los videos reproducidos por los usuarios. Hasta crearon un cuestionario viral en Facebook para extraer información sobre la personalidad de más de 6 millones de personas.

En total recogieron información de 220 millones de votantes americanos, con un promedio de 5.000 datos por persona. Usaron esos datos para entender mejor a la gente y bombardearla –al menos a determinados perfiles “más persuadibles”, explica el documental–, con contenidos en Facebook que ensuciaban la imagen de Hillary Clinton, contrincante de Trump. Y Trump ganó.

Brittany Kaiser, una ejecutiva clave para revelar las formas ilegales de trabajar de la empresa británica, aseguró en Netflix que “la razón por la que Google y Facebook son compañías tan poderosas es porque el año pasado los datos superaron a la industria del petróleo. Los datos son el bien más valioso del mundo”.

De hecho, eMarketer prevé que la industria de la publicidad en línea, que se basa en el rastreo y personalización de datos, alcanzará su récord de ganancias este año con 77.000 millones de dólares. Por eso es que esos zapatos lo persiguen tanto en la web, no importa qué esté leyendo, después de que buscó una sola vez que quería unos, ellos aparecen esporádicamente.

Si no le importa que se conozca su identidad, quizás quiera reconsiderarlo, sabiendo ya que ha habido más de un escándalo por fuga o mal manejo de grandes compañías. Pasó en 2013, la falta de transparencia de Yahoo quedó expuesta junto con tres mil millones de cuentas hackeadas (nombres, correos, números de teléfono y contraseñas) en 2013. Lo que la empresa no hizo público sino hasta 2016 cuando entró en negociaciones para ser comprada por Verizon.

La tienda digital e-Bay también fue víctima de un ataque cibernético que comprometió los datos personales de 145 millones de usuarios. Y otro escándalo famoso fue el de Uber. Dos hackers accedieron a datos personales de 57 millones de usuarios. A la empresa le tomó un año confesar el hecho.

Facebook está lejos de ser la primera corporación que sufrió violación de su información o que la usó de forma cuestionable. Hoy siguen creciendo tanto sus ingresos como las dudas sobre qué tipo de control se ejerce sobre estos gigantes de la información, también están Alphabet, Amazon, Apple y Microsoft. Cinco megacompañías que mueven hoy al mundo. Como lo sentenció la revista The Economist, en una edición especial en 2017, el recurso más valioso de esta época ya no es el petróleo: son los datos. Esos datos que muchas veces usted regala, solo da clic en aceptar

Fuente:

Helena Cortés Gómez, H. C. G. (s.f.). Nuevos beneficios y dolores de cabeza del Big Data. Recuperado 5 agosto, 2019, de https://www.elcolombiano.com/tecnologia/nuevos-beneficios-y-dolores-de-cabeza-del-big-data-FG11351433