Durante tres semanas estudiantes de magíster y doctorado de la Escuela de Graduados de la Facultad de Ciencias de la Universidad Austral de Chile (UACh) participaron del curso “Seminarios de machine learning para ciencias ambientales con R”, a cargo del profesor Felipe Benavides, académico de la Universidad Nacional de Colombia.
El curso tuvo como objetivo iniciar a las y los participantes en la comprensión de la ciencia basada en datos, un nuevo paradigma en la forma de producción de conocimiento y la toma de decisiones. Esto en un momento donde muchos algoritmos de machine learning están siendo aplicados satisfactoriamente tanto en problemas clásicos como la distribución de especies, como brotes de enfermedades, conservación, restauración y cambio climático, así como también en la identificación de nuevos problemas e hipótesis.
“Las herramientas del machine learning son principalmente predictivas. A diferencia de la estadística que se enseñan en pregrado, que sirven para explicar cómo una variable tiene efecto en otra, el machine learning es muy útil para clasificar y predecir fenómenos ambientales y tomar decisiones, ya que nos permite tener el mapa completo, tanto en el espacio como en el tiempo”, explicó Benavides.
De la estadística al algoritmo
En esta línea, tanto el docente como las y los participantes del curso coincidieron en que esta técnica del data science les permitirá resolver problemas ambientales con mayor eficiencia.
En este contexto, parte de las problemáticas abordadas de manera práctica durante el curso fue la construcción de algoritmos para predecir el tipo de vegetación en una determinada cuenca de la Región de Los Ríos. Para ello, se utilizaron imágenes de dron a fin de poder clasificar diferentes coberturas de vegetación, sin tener que hacerlo directamente terreno.
Asimismo, las y los estudiantes trabajaron en análisis de datos de diversidad de especies marinas del Pacífico chileno. A partir de esa información y en relación a variables ambientales como pH y salinidad, establecieron un modelo de predicción de la distribución geográfica de cada especie. Esta información, a su vez, se puede someter a diferentes escenarios como cambio climático y prever su situación futura.
Finalmente, cabe mencionar que el software utilizado fue R-studio, gratuito y de código abierto.