Título: «Caracterización de contexto en Sistemas Big Data: Caso de estudio de las fluctuaciones del nivel freático en función de variables meteorológicas”
Tesista: Mariano Campetella
Directora: Dra. Alejandra Cechich
Carrera: Licenciatura en Sistemas de Información
Día: 14 de diciembre de 2023
En la actualidad cuando se habla de big data se hace referencia a un término que nos permite describir grandes volúmenes de datos que son difíciles o imposibles de procesar a través de métodos tradicionales. La relevancia del big data no se centra en la cantidad de datos en posesión, sino en la forma en que se emplean. Es factible obtener información de diversas fuentes, someterla a análisis y descubrir múltiples soluciones, que incluyen la reducción de gastos, la optimización del tiempo, la creación de productos innovadores y, en especial, la toma de decisiones de manera perspicaz.
Dentro del contexto de Big Data, nos encontramos con las «5V» (Volumen, Velocidad, Variedad, Veracidad y Valor) que son un conjunto de características clave que se utilizan para describir y definir los desafíos y propiedades de los datos en un entorno de grandes volúmenes de datos. Una de estas 5V, la Variedad, se refiere a la heterogeneidad o diversidad de los tipos de datos que pueden provenir de diversas fuentes y pueden tener una amplia variedad de formatos y estructuras así como posibles usos. Estos tipos de variedades se reúnen en lo que se conoce como variedad de contexto y se los utiliza con el propósito de permitir la reutilización de características identificadas en ámbitos similares.
Para identificar variedades en un campo o dominio específico, en este trabajo de tesis se se aplica el proceso T-VIP (Top-Down Variety Identification Process), el cual se inicia con hipótesis planteadas por expertos del dominio, donde luego a partir de una recolección de datos de diversas fuentes se analizan los mismos para luego determinar si los resultados respaldan o refutan las hipótesis iniciales. Este proceso es cíclico y puede repetirse, permitiendo trabajar con más datos de manera interactiva y así desarrollar modelos que se almacenan en bases de conocimiento.
T-VIP se aplicó en dos escenarios de estudio distintos, uno en la región mediterránea de Lecce, Italia, y el otro en Villa Regina, en la provincia de Río Negro. Ambos casos se enmarcan en analizar las fluctuaciones de los niveles de las aguas subterráneas con el propósito de identificar las causas de dichas variaciones, considerando las condiciones meteorológicas y las distintas clases de textura del suelo presentes en cada región. Finalmente, se empleó CoVaMaT para almacenar todos los casos estudiados, enriqueciendo así la base de conocimientos para su posible recuperación y reutilización en futuras ocasiones.