Si tenemos una gran cantidad de observaciones la ciencia de datos permite extraer patrones y predecir comportamientos basándose únicamente en ellos. ¿Para qué clase de problemas es útil?
Para responder esta pregunta es más simple aclarar qué tres clases de problemas no resuelve. La primera es muy grande, la forman todos aquellos procesos para los que existe una descripción matemática precisa como una reacción química o la dinámica planetaria.
La segunda clase se compone de todos los problemas para los que disponemos de observaciones, pero para las que no hay relación entre los datos de entrada y de salida. Por ejemplo, no podemos predecir si una operación de crédito es fraudulenta basándonos en la temperatura y humedad de la ciudad en la que ocurre.
La tercera, es aquella para la que no disponemos ni de modelo ni de suficientes datos. Queremos saber si determinada persona va a comprar o no un automóvil durante el próximo año. Si no sabemos nada de él, es imposible, pero si ha visitado páginas web del ramo la cosa resulta mucho más simple.
Los sistemas ecológicos son uno de los campos de estudio de la ciencia de datos. Imaginemos una isla en mitad del océano en la que vive un número reducido de especies. Los herbívoros se alimentan de plantas y, a su vez, son devorados por depredadores en una cadena muy complicada. La ciencia de datos ayuda a identificar las especies cuya desaparición puede producir lo que se denomina extinción en cascada y la destrucción del sistema. Esta información se recogía antiguamente de forma manual. La tecnología de Internet de las Cosas ofrece la posibilidad de disponer de medidas de datos en tiempo real. Basta con instalar sondas con los sensores adecuados.
Saber por dónde se mueven los cachalotes con una precisión de metros está muy bien para los documentales de sobremesa en televisión, pero ¿cómo nos afecta a los habitantes de una ciudad?
La agricultura es uno de los sectores que más se va a beneficiar en los próximos años. Gracias a los datos, se puede saber de antemano cuando sembrar en cada parcela, regular de forma automático el riego o la utilización de abono o herbicidas.
Otra aplicación de máximo interés es la reducción de la huella de carbono de nuestras actividades. La predicción de la demanda de energía eléctrica permite confeccionar la combinación óptima para reducir el consumo de combustibles fósiles.
Todos estos avances resultan posibles por la combinación de tres elementos: abundancia de datos, capacidad para procesarlos remotamente y disponibilidad de profesionales que sepan sacar partido de la información.
Ser científico de datos es algo que se tiene que aprender, con un programa adecuado. El perfil de estos profesionales combina la ingeniería, las matemáticas y el dominio de aplicación específico: empresa, salud, logística, ecología, etc. Aunque las universidades han hecho un esfuerzo en los últimos años para dar respuesta a esta demanda, la necesidad no para de crecer.
Francisco Javier García Algarra, director académico del Área de Ingeniería de U-tad.
U-tad es un centro universitario referente en formación en las disciplinas del Big Data y la Ciencia de Datos. Entre sus titulaciones se encuentran el Grado Universitario en Ingeniería del Software con una mención en Big Data, o un Doble Grado Universitario en Ingeniería del Software y Matemática Computacional. También ofrece formación de postgrado como un Máster en Data Science y Big Data y un Experto en Business Analytics.
Fuente: Interempresas