Tecnologie di machine learning per mappare la vita negli oceani e monitorare il loro stato di salute

Più dati sono disponibili, meglio è, perché l’ampiezza e la ricchezza dei dati sono sinonimo di conoscenze, ma la sfida rimane umanamente impraticabile quando si parla degli oceani. Dal punto degli ecosistemi, infatti, sulla terra i confini tra diverse “regioni ecologiche” sono facilmente identificabili ma negli oceani questa messa a fuoco è molto più complessa e quasi impossibile perché la maggior parte degli esseri viventi è di dimensioni microscopiche ed è mobile.

Le comunità marine generalmente vengono identificate dagli scienziati attraverso le immagini satellitari della clorofilla, il pigmento verde prodotto dal fitoplancton. Le concentrazioni di clorofilla in qualche modo indicano la ricchezza di un ecosistema, ma due regioni con la stessa concentrazione di clorofilla in realtà possono ospitare combinazioni molto diverse di vita vegetale e animale.

“È come se dovessi guardare tutte le regioni terrestri che non hanno molta biomassa, come l’Antartide e il Sahara, ma di fatto le loro identità ecologiche sono completamente diverse”, ha affermato Maike Sonnewald, ex postdoc del Dipartimento of “Earth, Atmospheric and Planetary Sciences” del MIT, che ha guidato un progetto particolarmente innovativo.

Sonnewald e i suoi colleghi dell’Istituto hanno sviluppato una tecnica di machine learning che elabora e relaziona automaticamente una serie molto complessa di dati oceanici globali e che è in grado di individuare elementi comuni tra le località marine, in base ai rapporti e alle interazioni tra più specie di fitoplancton.

“Gli ecosistemi stanno cambiando con i cambiamenti climatici e la struttura delle diverse comunità deve essere monitorata per comprenderne gli effetti sulla vita dei pesci e sulla capacità degli oceani di assorbire l’anidride carbonica”, ha affermato Sonnewald. “Non possiamo comprendere appieno queste dinamiche con metodi convenzionali, ma questo metodo, integrato con i dati satellitari e altri strumenti, potrebbe aumentare in modo significativo le nostre conoscenze.”

La nuova tecnologia di machine learning è stata chiamata SAGE, Systematic AGgregated Eco-province method, ed è stata progettata per acquisire set di dati complessi e di grandi dimensioni ma può essere impiegata anche per fare proiezioni su set di dati più semplici e di dimensioni inferiori.

In particolare, i ricercatori hanno utilizzato un algoritmo di clustering che è stato progettato per “navigare” in un grande dataset ed è in grado di affinare e mettere a fuoco certe aree con una grande densità di punti, che condividono qualcosa in comune.

L’algoritmo è quello utilizzato nel Darwin Project del MIT, un’iniziativa che coinvolge oceanografi, biogeochimici e microbiologi marini e che integra le le diverse conoscenze e diversi modelli per arrivare a una migliore comprensione delle comunità microbiche marine. Il nuovo modello messo a punto per questo progetto abbina un modello del clima oceanico – inclusi i modelli di vento, corrente e temperatura – con un modello di ecologia oceanica. Il modello tiene conto di 51 specie di fitoplancton e delle modalità secondo cui ciascuna specie cresce e interagisce con le altre, del clima circostante e delle sostanze nutritive disponibili.

Grazie alla raccolta e alla selezione dei dati, SAGE è stato in grado di suddividere l’oceano nella sua globalità in circa 100 diverse province ecologiche, ognuna con un distinto equilibrio di specie.

I ricercatori hanno dunque assegnato ciascuna posizione disponibile nel modello oceanico a una delle 100 province e hanno dato un colore a ciascuna provincia. Hanno quindi generato una mappa dell’oceano globale, colorata per tipo di provincia.

Il team ha quindi cercato modi per semplificare ulteriormente le oltre 100 province individuando elementi comuni anche tra queste regioni ecologicamente distinte.

Per fare questo, sono state impiegate tecniche specifiche per rappresentare tutte le 100 province in un singolo grafico, secondo la biomassa, una misura analoga alla quantità di clorofilla prodotta in una regione. Hanno scelto di raggruppare le 100 province in 12 categorie generali, o “mega province”. Quando hanno confrontato queste mega province, hanno però riscontrato che quelle che avevano una biomassa simile erano composte da specie biologiche molto diverse.

“Ad esempio, le province D e K hanno quasi la stessa quantità di biomassa, ma quando guardiamo più in profondità, K ha diatomee ma scarsi procarioti, mentre D ha quasi nessuna diatomea e molti procarioti, anche se da un satellite le due aree potrebbero sembrare uguali “, afferma Sonnewald. “Il nostro metodo consente però di integrare anche informazioni ecologiche oltre alla misurazione della presenza generica di clorofilla.”

Il team ha sviluppato un widget online che i ricercatori possono utilizzare per trovare altre somiglianze tra le 100 province e se i colleghi di Sonnewald hanno scelto di raggruppare le province in 12 categorie, altri ricercatori potrebbero voler suddividere le province in più gruppi per identificare i tratti condivisi tra questi gruppi.

Sonnewald sta condividendo lo strumento con gli oceanografi che vogliono studiare alcune aree in cui sono presenti particolari habitat ecologici, e questo modello può aiutarli a fare spedizioni e campionamenti mirati in alcune zone evitandone altre in cui l’equilibrio delle specie potrebbe essere diverso.

“Invece di effettuare i campionamenti basati genericamente sulla presenza della clorofilla con questo metodo è possibile intervenire in modo quasi chirurgico perché il modello indica già cosa si potrebbe trovare in una zona specifica” ha dichiarato Sonnewald.

Questa ricerca è stata finanziata, in parte, dalla NASA e dal Jet Propulsion Laboratory.

L’immagine è del MIT.

Alessandra Apicella

Leave a Reply Cancel reply