El grupo -conformado por estudiantes de Ingeniería Matemática y la Licenciatura en Ingeniería en Ciencia de Datos, más la académica Paula Aguirre- se impuso en “Escasez hídrica en Petorca", uno de los tres desafíos del certamen. La finalidad del evento fue desarrollar, a través de diversas técnicas, soluciones que atiendan diferentes problemas derivados del cambio climático en Chile.
Articular el desarrollo de soluciones concretas e innovadoras que permitan abordar el cambio climático y mitigar sus efectos, empleando para ello las herramientas y capacidades que entregan la informática y la teledetección, además de generar resultados que trascendieran a la actividad en sí misma, fueron los objetivos del certamen "Datatón FACH 2024". En este contexto, la última versión de la competencia abarcó los desafíos “Incendios en Valparaíso", "Retroceso del Glaciar Grey en Torres del Paine" y "Escasez hídrica en Petorca". Fue en esta última categoría donde resultó ganador un equipo del Instituto de Ingeniería Matemática y Computacional (IMC) formado por estudiantes y la académica Paula Aguirre.
Data Observatory (DO) y la Fuerza Aérea de Chile a través de su Servicio Aerofotogramétrico (SAF) fueron los impulsores de esta convocatoria, que reunió un total de 15 equipos que entre el 1 y 6 de abril trabajaron en el desarrollo de las soluciones que propusieron en sus postulaciones iniciales. Para ello, los participantes tuvieron a su disposición fotografías aéreas de las zonas de estudio (proporcionadas por SAF) e imágenes del satélite nacional FASat-Charlie, más sus pares internacionales Jilin y SkySat. Adicionalmente, se facilitaron datos de Landsat (5-7-8-9), Sentinel (1-2-3) y modelos de elevación del terreno disponibles en Data Cube Chile.
En el caso de la escasez hídrica en Petorca, comuna de la región de Valparaíso, los equipos participantes propusieron soluciones basadas en machine learning que apuntaban a tres objetivos esenciales. El primero era detección de usos de suelo con foco en el consumo y demanda de agua, mientras que el segundo era la cuantificación de cambios en el uso de suelo. El último apuntaba a predecir qué zonas podrían llegar a presentar un mayor riesgo de sequía.
El equipo IMC que decidió abordar este problema estuvo conformado por Paula Aguirre -doctora en astrofísica del Instituto- y los estudiantes Roberto Benatuil, Min Soo Jeon y Luis Felipe Castillo de Ingeniería Matemática, más Sergio Ramírez y Vicente Muñoz de la Licenciatura en Ingeniería en Ciencia de Datos. La investigadora explica que el equipo se gestó en el curso “Ciencia de Datos Geoespaciales”, que es optativo para ambos programas académicos a cargo del IMC y donde los estudiantes aprendieron varias de las técnicas de trabajo con datos que aplicaron en el concurso: “Su motivación surgió a partir de ese curso, que ahora se está dictando por tercera vez. En el equipo participaron alumnos de una edición anterior y también algunos que están tomando el curso actualmente. Es una alegría saber que esas herramientas efectivamente les sirven para abordar desafíos que hoy son muy reales y que muchas otras organizaciones también están analizando”.
Paula Aguirre, Sergio Ramírez, Min Soo Jeon, Roberto Benatuil, Vicente Muñoz y Luis Castillo.
Los estudiantes señalan que una de las motivaciones para participar en la competencia fue la cercanía que ellos tienen con la crisis hídrica que desde hace años aqueja a la zona de Petorca. “Algunos venimos de regiones y también convivimos con la problemática de la sequía. Por eso nos interesó lo que sucede en Petorca. Uno de los problemas que más nos gustó resolver fue identificar qué zonas tienen riesgo de sequía a partir de imágenes satelitales”, comenta Vicente Muñoz, oriundo de la región de O’Higgins. Al respecto, Roberto Benatuil - proveniente de Talca- agrega que “analizar la escasez hídrica a partir de imágenes satelitales y ciencia de datos, y aprovechar esa información en conjunto con técnicas de machine learning, fue lo que más nos atrajo para tomar parte en el certamen”.
Soluciones innovadoras
Paula Aguirre, quien además es parte del Centro Nacional de Inteligencia Artificial (Cenia), señala que la primera tarea del equipo fue abordar el problema de clasificación de imágenes que planteaba el desafío. Inicialmente, se usaron imágenes de alta resolución de una época determinada: “Los datos que teníamos eran imágenes que nos proporcionaron del satélite chino Jilin y del FASat-Charlie. Si bien eran imágenes de alta resolución para una o tres fechas, nos servían para el primer objetivo que era solamente detectar uso de suelo”, indica la académica.
En el segundo objetivo del desafío, que consistía en evaluar cómo el uso de suelo va cambiando en el tiempo, la tarea fue más compleja ya que se necesitaban datos con una mayor temporalidad. “El problema del fondo es que no teníamos datos de entrenamiento. ¿Cómo le decíamos al modelo que aprendiera si no teníamos referencias más extensas?”, comenta Paula Aguirre. La innovadora solución provino de los propios estudiantes, a quienes se les ocurrió dividir las imágenes de alta resolución en segmentos más pequeños y aprovechar la plataforma de inteligencia artificial Gemini de Google para realizar un etiquetado automático de los datos.
“Al comienzo nos costó mucho la clasificación, porque muchos de los modelos que existen están hechos para Europa y no para Chile. Con ayuda de APIs de Google, tuvimos que empezar a trabajar para generar modelos que nos permitieran clasificar imágenes en Chile”, señala Vicente Muñoz. Con respecto del uso de Gemini, el estudiante comenta que dividieron las grandes imágenes satelitales en pequeños cuadrados de 100 por 100 pixeles: “Luego, las ingresamos en Gemini y le dijimos al sistema ‘Clasifica estas imágenes en cuatro categorías’. Así sacamos datos para entrenar modelos”.
La profesora Paula Aguirre añade que lo usual en este tipo de trabajos es que una persona experta se encargue de mirar las imágenes y etiquetarlas, lo que era imposible de hacer durante los pocos días que duró la fase final del concurso: “Lo que los estudiantes hicieron fue simular este proceso de etiquetado especializado con Gemini, que es como un Chat GPT pero de imágenes ya que uno le entrega una foto y te dice a qué corresponde. Eso fue un punto a favor porque nos permitió tener un set de datos etiquetados. Si tuviéramos muchas más imágenes del mismo tipo, además de más tiempo para validar el etiquetado, esto se podría escalar de buena forma. Eso permite aterrizar el problema a la localidad particular de Petorca”.
El uso del agua en Petorca se ha vuelto un tema clave para enfrentar la sequía que afecta a la zona.
En cuanto al objetivo de predecir riesgo de sequía, el equipo logró generar series de tiempo para muchas métricas distintas. “Se trata de indicadores que son estándar. Combinando todas esas métricas, los estudiantes formularon un modelo matemático de decisión, que el fondo determina si una zona está en riesgo de sequía o no. Obviamente que ese modelo se puede adaptar a lo que realmente es una verdadera detección de sequía, pero el fondo del modelo está y lo que nosotros quisimos plantear es que es multidimensional. Con mayor conocimiento del problema uno le puede ir cambiando los ‘inputs’, pero ya hay una formulación matemática de cómo uno decide si, al ver el problema en el tiempo, se está avanzando hacia una sequía o no”, comenta la académica del IMC.
Para los equipos que obtuvieron el primer lugar en cada desafío de la "Datatón FACH 2024", se consideran premios que abarcan créditos AWS por un total de US $3.000 y que sirven para ocupar la nube de Amazon con fines de investigación. El certamen también contempla para los vencedores premios por $ 500.000 y lentes de realidad virtual, mientras que el Servicio Aerofotogramétrico de la Fuerza Aérea de Chile (SAF), a través de un trabajo conjunto, proporcionará las facilidades para continuar el desarrollo de las soluciones ganadoras, actuando como una incubadora de proyectos.
“Logramos llegar con una buena idea y esquema de cómo hacer la solución completa, pero faltó tiempo para trabajarla más, entrenar los modelos con muchas combinaciones de parámetros distintos y hacer más experimentos para tener una mejor evaluación de los resultados. Pero está toda la maqueta y la idea es que con más tiempo esto se pueda mejorar y escalar”, indica Paula Aguirre. “El espíritu de la FACH al realizar esta alianza con Data Observatory y hacer la Datatón es identificar proyectos y grupos con los cuales ellos puedan trabajar para sacarles más provecho a los datos”, precisa la profesora.
Roberto Benatuil plantea que tener acceso a más imágenes y de mayor resolución de la zona específica de estudio podría permitir “hacer la clasificación de mejor manera, poder automatizar aún más el proceso y entrenar mejor el modelo que proponemos”. Vicente Muñoz también señala que el modelo incluso se podría aplicar a otras zonas del país: “Con la cantidad adecuada de datos de distintas partes de Chile, podríamos generar un modelo como el que tienen en Europa para nuestro territorio y así detectar sequía antes de que sea un problema para los humanos”.