|
Capitolo 2: Ricerca ed elaborazione delle dataset dei tipi di suolo e di vegetazione e delle osservazioni meteorologiche
Introduzione
L'attività sotto descritta ha come obiettivo la messa a punto di una base dati di suolo, di vegetazione e meteorologici, che consenta di migliorare la previsione delle grandezze meteorologiche con particolare riferimento ai campi atmosferici sul contorno inferiore.
A tal fine, è di fondamentale importanza disporre:
1) di dati relativi alle caratteristiche fisiche del suolo e della copertura vegetale presente sul dominio d'interesse;
2) di dati relativi ai fenomeni meteorologici effettivamente osservati, ed in particolare quelli riguardanti la superficie terrestre, in quanto necessari per la validazione del modello di suolo di cui si vuole dotare il modello.
Nei paragrafi che seguono vengono brevemente illustrati i set di dati che sono stati acquisiti e su cui si è lavorato nel corso di questo primo anno di lavoro; in particolare, si è cercato di evidenziare le tecniche di elaborazione a cui sono stati sottoposti i dati al fine di adeguarli alle necessità applicative della linea di ricerca. L'espressione "elaborazione dei dati", deve essere intesa come l'insieme di tutte le operazioni che hanno permesso di manipolare ciascun dataset, modificandone sia "l'organizzazione strutturale" (ad esempio, convertendo i dati dal formato binario al formato ascii) che "il contenuto informativo".
Dataset Ambientali
Caratteristiche dei dataset prodotti
Per quanto riguarda le caratteristiche fisiche del suolo e della vegetazione, la maggior parte delle informazioni e dei dataset ad esse attinenti, sono reperibili, più o meno facilmente, su Internet: diversi, infatti, sono i siti che si occupano della distribuzione, solitamente gratuita, di dati ambientali; tra quelli più interessanti, si evidenziano:
il sito dello USGS (http://edcwww.cr.usgs.gov/webglis) dove è possibile reperire, mediante il sistema informatico GLIS, una discreta quantità di informazioni su tutti quei dati relativi alla superficie terrestre;
il sito dello UMD ( http://glcf.umiacs.umd.edu), che mette a disposizione diversi prodotti scientifici di carattere ambientale, tra cui un dataset globale ad alta risoluzione spaziale (1 km x 1km), relativo al tipo di copertura terrestre (landcover dataset).
Tutti i dataset prodotti per la linea di ricerca e descritti in questa relazione riguardano prevalentemente dati telerilevati ovvero dati "raccolti" tramite sensori satellitari; le moderne tecniche di telerilevamento, infatti, oggigiorno favoriscono lo sviluppo e la diffusione di dati territoriali sempre più dettagliati.
Due ulteriori aspetti caratterizzano i set di dati oggetto di discussione:
1) l'area di interesse, che comprende gran parte del continente europeo e porzioni, più o meno marginali, del continente africano, asiatico e Groenlandia. L'area in questione è individuata dalle coordinate geografiche: 40 W, 70 E; 15 N, 70N;
2) le informazioni georiferite; ciò significa che i dataset contengono informazioni relative ad entità (come il suolo, la vegetazione ecc.) di cui si conoscono, anche se non esplicitamente, le reali coordinate geografiche e che quindi risultano perfettamente localizzabili sulla superficie terrestre.
Gli strumenti informatici di cui si è fatto uso nella fase di elaborazione dati, sono essenzialmente tre:
· Arc/View, che rientra nella categoria dei cosiddetti software GIS (Geographic informative system o Sistema Informativo Geografico) ovvero di quei software che integrano operazioni comuni di database, come l'interrogazione o l'analisi statistica, con i vantaggi della visualizzazione e dell'analisi di dati territoriali;
· il linguaggio di programmazione Fortran90;
· Freeform, software gratuito sviluppato al National Geophysical Data Center. Tale software consiste in un insieme di utilities sviluppate per facilitare la conversione dei dati tra diversi possibili formati; molto spesso, infatti, il primo limite all'uso di un dataset è proprio il formato utilizzato per la memorizzazione delle informazioni in esso contenute.
Dataset ricavati dalla Digital Soil Map of the World
La Digital Soil Map of the World, distribuita dalla FAO su supporto cd-rom (www.fao.org/waicent/Faoinfo/agricult/agl/agll/dsmw.htm ), è la versione rielaborata e digitalizzata della FAO/UNESCO Soil Map of the World, classificazione dei suoli di tutto il mondo, pubblicata tra il 1974 ed il 1978. Il cd-rom in questione contiene: mappe dei tipi del suolo secondo l'originale classificazione del FAO (risoluzione spaziale: 8km x 8km) in formato vettoriale ed in formato griglia; sintesi inerenti le caratteristiche (texture, slope,ecc.) e le proprietà derivate del suolo (derived soil properties) come il ph, il contenuto organico di carbonio e la capacità di ritenzione idrica del suolo.
Il processo di elaborazione delle informazioni contenute nella Digital Soil Map of the World è consistito, prima di tutto, nella "rasterizzazione" delle mappe del suolo (cioè nella loro trasformazione dal formato vettoriale al formato griglia o "raster") e quindi nella loro memorizzazione, in formato testo, su file (ascii raster file); i file così ottenuti sono stati rielaborati mediante programmi appositamente scritti nel linguaggio FORTRAN90.
Tre sono i set di dati ricavati dalla Digital Soil Map of the World, per la linea di ricerca:
1) dataset dei tipi di suolo;
2) dataset della tessitura del suolo;
3) dataset del permafrost (che contiene l'informazione della presenza degli strati permanentemente ghiacciati nel suolo).
Dataset del suolo
Il dataset dei tipi di suolo distingue 26 classi di suolo, mentre il dataset originale della FAO considera la distinzione delle sottoclassi numerose di queste 26 classi. Si ritiene interessante osservare che anche un altro dataset del suolo, noto come Zobler dataset (anch'esso rielaborazione del dataset FAO e facilmente reperibile su internet), individua solo 26 classi di suolo, quasi del tutto coincidenti con quelle da noi definite.
Ogni classe di suolo FAO è determinata dalla combinazione tra suoli primari (suoli che occupano almeno il 24% dell'area territoriale considerata), suoli secondari (almeno il 20%) ed inclusioni (meno del 20%), mentre nel dataset finale si è ritenuto sufficiente prendere in considerazione soltanto i suoli primari.
Dataset della tessitura del suolo
Il dataset della tessitura del suolo è sicuramente quello più interessante per gli scopi della linea di ricerca; in effetti una dettagliata descrizione della tessitura del suolo, ovvero della sua composizione percentuale in termini di argilla, sabbia e limo, consente di definire le proprietà del suolo (come ad esempio la capacità idrica), determinanti nella descrizione degli scambi di flussi energetici tra suolo ed atmosfera.
Data la relativamente bassa risoluzione del dataset originale della FAO (8 km x 8 km), l'informazione ricavata dal texture dataset è stata rielaborata, cercando di tener conto dei criteri di classificazione definiti dall'American Soil Taxonomy. A tale scopo è stato necessario determinare la frequenza con cui si manifesta ciascuna delle tre classi di tessitura (coarse, medium, fine) definite dal sistema di classificazione FAO, per ciascun tipo di suolo.
La figura 2.1 illustra un esempio dell'analisi condotta sulla frequenza delle differenti classi di tessitura per un tipo di suolo Luvisols; mentre il dataset originale della FAO prende in esame soltanto tre differenti classi di tessitura, il dataset prodotto per la linea di ricerca ne distingue tredici, coincidenti con quelle definite dall'American Soil Taxonomy
Figura 2.1: Frequenza delle diverse classi di tessitura nel tipo di suolo identificato dalla FAO con il termine di Luvisols. Il numero 1 identifica la classe di tessitura "coarse", il 2 la classe "medium", il 3 la classe "fine". I simboli 1/2, 1/3, 2/3, si riferiscono a situazioni in cui due classi di tessitura occupano il 50% del suolo preso in esame.
Dataset del Permafrost
L'immagine di figura 2.2, si riferisce al dataset del permafrost, ricavato dalla Digital Soil Map of the World facendo uso di un programma in Fortran appositamente scritto.
L'assenza, pressoché totale, di permafrost sull'area geografica d'interesse (si ricordi che il dataset originario è a bassa risoluzione!) rende l'uso di tale dataset del tutto superfluo, per cui è deciso di farne a meno nella definizione del modello di suolo.
Figura 2.2 Dataset del permafrost; data la bassa risoluzione del dataset FAO originario, il permafrost (la piccola area dell'Europa orientale colorata di nero) risulta assente in tutta l'Europa.
Dataset della vegetazione
Il dataset della vegetazione (landcover dataset) utilizzato nel progetto di ricerca è quello fornito dal sito dello UMD (University of Maryland); si tratta di un dataset ad alta risoluzione spaziale (1km x 1km) in cui vengono distinte tredici classi di vegetazione (si veda la tabella 1).
Per esaminare l'effettiva incidenza di ciascuna di tali classi sul dominio d'interesse, il dataset è stato suddiviso in sei quadranti uguali (figura 3): all'interno di ogni quadrante è stata determinata la frequenza con cui si presentano le 13 classi di vegetazione. L'obiettivo primario di tale analisi è stato quello di valutare l'effettiva importanza delle classi di vegetazione. I risultati sono riportati nelle figure 2.4 e 2.5. Si noti ad esempio che le classi 8 e 9 (Closed e Open Shrubland) sono trascurabili. Darne un contributo non è trascurabile: in particolare, le classi 8 e 9 sono particolarmente frequenti in quelle aree geografiche in cui prevale il suolo nudo (distese di ghiaccio o deserto).
Da tali risultati si è inoltre osservato che la classe di vegetazione 2 (Evergreen Broadleaf Forest) compare solo nel 6° quadrante e con una frequenza del tutto trascurabile, mentre la classe 3 (Deciduous Needleleaf Forest, classe che, nell'area presa in esame, dovrebbe avere come unico rappresentante la pianta del larice) non compare in nessuno dei sei quadranti (ciò probabilmente dipende dalla presenza della classe 5, Mixed Forest, la quale tende a "nascondere" la presenza del Larice). Ciò spiega perché il numero di classi di vegetazione effettivamente presenti nel dataset del landcover utilizzato per il modello di suolo è pari ad 11.
Classi
di vegetazione
|
|
|
|
|
|
Water
|
0
|
|
Evergreen
needleleaf forest
|
1
|
|
Evergreen
broadleaf forest
|
2
|
|
Deciduous
needleleaf forest
|
3
|
|
Deciduous
broadleaf forest
|
4
|
|
Mixed
Cover
|
5
|
|
Woodland
|
6
|
|
Wooded
grassland
|
7
|
|
Closed
Shurbland
|
8
|
|
Open
Shrubland
|
9
|
|
Grassland
|
10
|
|
Cropland
|
11
|
|
Bareground
|
12
|
|
Urban
and Built-ip
|
13
|
Tabella 2.1 Classi di vegetazione del dataset originario dello UMD; le classi 2 e 3 non hanno alcuna importanza nel dataset della vegetazione prodotto per la linea di ricerca.
Figura 2.3 Analisi della frequenza di ciascuna delle 13 classi di vegetazione, all'interno di ciascuno dei 6 quadranti in cui è stato suddiviso il dataset della vegetazione.
Classi di vegetazione: primo e terzo quadrante del dataset landcover
Figure 2.4 e 2.5: Gli istogrammi rappresentano la frequenza con cui si manifestano ciascuna delle 13 classi di vegetazione, all'interno dei 6 quadranti in cui è stato suddiviso il dataset del landcover (figura 3).
LAI dataset
L'indice di area fogliare (LAI: Leaf Area Index) viene definito come il rapporto tra la superficie fogliare totale, considerando un solo lembo, e la superficie del suolo su cui le foglie si proiettano (m2 x m-2). Il LAI è un indice non normalizzato: mentre è ben definito che il valore 0 corrisponde al suolo nudo (bare ground) e i valore del LAI per i vari tipi della vegetazione possono variare dallo 0 a un arbitrario numero positivo (perché le foglie possono sovrapporsi e loro area totale può superare l'area del suolo sottostante la pianta), però spesso nei dataset si introduce una normalizzazione del LAI per limitarlo con il valore massimo 1.
Il leaf area index viene spesso impiegato come parametro nei modelli SVAT (soil-vegetation-atmosphere transfer) e nei GCM (global circulation models). Il sito internet
http://cybele.bu.edu/ fornisce un dataset del LAI con risoluzione spaziale di 15' x 15' (una risoluzione più elevata sarebbe stata auspicabile, ma questo si è rivelato l'unico dataset del LAI con proiezione lat/lon regolare, riguardante l'area geografica presa in esame), che copre un periodo di tempo che va dal luglio 1981all'agosto del 1994. Il dataset, distribuito in formato binario (8 bit unsigned integer), una volta convertito in formato ascii, è stato sottoposto ad un'operazione di rescaling, mediante la formula:
(valore_del_lai-100)*0.05
necessaria per convertire i valori numerici dal formato intero (utile al momento della memorizzazione delle informazioni su file) a quello reale. Sfruttando l'informazione del dataset così ottenuto, si è cercato di determinare, per ognuna delle classi di vegetazione del landcover dataset, delle curve che descrivessero il possibile andamento annuale del LAI. Come si può osservare dal grafico di figura 6, le curve del LAI ricavate dal dataset Cybele, per ciascuna delle classi del landcover dataset, presentano dei valori pressoché nulli nel corso dei mesi invernali, per poi raggiungere un massimo in estate. Questo andamento, ragionevole per la maggior parte delle classi di vegetazione, non è invece plausibile per la classe delle "aghifoglie" (classe 1), per le quali ci si attende un andamento costante nel corso dell'anno, trattandosi di piante non decidue. Tale incongruenza è addebitabile al fatto che il dataset del LAI presenta, per i mesi invernali, molti dati mancanti, dovuti alla neve che, con la sua presenza, "nasconde" la vegetazione al rilevamento del sensore satellitare.
Il grafico di figura 2.7 illustra l'andamento del LAI sulla base dei valori prodotti e gentilmente forniti dal Dr. Gottschalk, autore di alcuni studi sul LAI nell'ambito del progetto LDAS (Land Data Assimilation System) consultabili alla pagina web
http://ldas.gsfc.nasa.gov/; dal grafico è evidente un andamento più realistico per la classe delle aghifoglie. Il dataset finale, utilizzato nell'ambito della linea di ricerca, è stato ottenuto mediando l'andamento delle curve dei due grafici di figura 2.6 e 2.7.
Figura 2.6 e 2.7: Il primo grafico in alto illustra l'andamento del Lai ricavato dal Cybele dataset; la legenda si riferisce alle classi di vegetazione presenti nel dataset del landcover dello UMD. Il secondo grafico illustra l'andamento del LAI secondo le analisi del dottor Gottschalk dello LDAS.
Dataset di emissività
Il sito http://tanalo.larc.nasa.gov:8080/ (nel momento in cui si scrive, questo sito non è più consultabile da diversi mesi) metteva a disposizione degli utenti due diversi dataset, con risoluzione 10' x 10' (circa 16 km x 16km),
sull'emissività della superficie terrestre.
La documentazione riguardante la struttura dei due database era piuttosto scarna (la risoluzione spaziale, il numero delle righe e delle colonne sono stati dedotti tramite semplici calcoli). I dati originari, memorizzati in formato binario come "8 bit signed integer", sono prima stati convertiti in formato ASCII tramite il software Freeform e successivamente, tramite un semplice programma in Fortran, riorganizzati in modo di poterli visualizzare con il software Arc/View. Tale dataset sarà utilizzato in seguito per definire la distribuzione geografica del parametro di emissività.
Dati meteorologici osservati
La validazione del modello DALAM (e, in particolare, del modello di suolo di cui si vuole dotare il DALAM), rappresenta un aspetto fondamentale del progetto di ricerca, in quanto consente di evidenziare sia gli eventuali errori logici (ovvero errori di programmazione presenti nel codice FORTRAN che descrive la fisica del modello) sia di verificare le prestazioni dello stesso modello.
Il processo di validazione richiede che si disponga di un termine di confronto (solitamente le osservazioni) rispetto a cui verificare la bontà dell'output prodotto facendo uso del nuovo modello di suolo. Per una prima fase di validazione si è deciso di acquisire i dati relativi alla superficie (essendo l'attenzione rivolta al modello di suolo) per due periodi di tempo che vanno dal 27 al 30 dicembre e dal 3 al 6 luglio 2001. Per una maggiore accuratezza del processo di validazione, i dati sono stati raccolti non solo per il territorio nazionale, ma anche per una porzione d'Europa pressappoco coincidente con quella definita dai dataset ambientali descritti nelle pagine precedenti.
I dati relativi al territorio nazionale sono stati forniti dalla società Finsiel di Roma e riguardano i fenomeni meteorologici osservati nelle stazioni della Rete Agrometeorologica Nazionale (RAN) e nelle stazioni dell'Aeronautica Militare (AM); i dati meteorologici relativi alle stazioni europee, invece, sono stati acquisiti dal Centro Europeo (ECMWF), attraverso apposite "richieste" all'archivio MARS (Meteorological Archival Retrieval System). L'archivio MARS contiene osservazioni, analisi e previsioni, generate sia del sistema operativo di previsione dello ECMWF sia da diversi esperimenti di ricerca. La maggior parte dei dati contenuti in esso sono memorizzati in uno dei due standard definiti dalla WMO (World Meteorological Organization): GRIB (per i campi atmosferici) e BUFR (per le osservazioni).
I dati sono stati rielaborati ed adattati alle necessità della linea di ricerca tramite appositi programmi FORTAN (ad esempio, la precipitazione, rilevata ogni ora sulle stazioni AM ed ogni dieci minuti sulle stazioni RAN è stata cumulata in modo da ottenere dati triorari); si stanno, invece, ancora elaborando i dati del Centro Europeo. In questo caso, infatti, il processo di elaborazione si presenta meno immediato del precedente (che comunque ha richiesto il suo tempo, dato che i dati di dicembre e quelli di luglio forniti da Finsiel non presentavano alcuna omogeneità nel formato di memorizzazione), poiché i dati sono memorizzati in messaggi BUFR (Binary Universal Form for the Representation of Meteorological Data) e per essere utilizzati richiedono di essere convertiti in formato ascii.
Sommario del capitolo 2
Sono stati acquisiti ed elaborati data set relativi alle caratteristiche fisiche del suolo e di copertura vegetale sull'area di integrazione del modello, comprendente Europa e Africa settentrionale (40 W, 70 E, 15N, 70 N). In particolare sono stati utilizzati dati di 'Tipo e uso del suolo', di 'Tessitura del suolo', del 'Permafrost', di 'Landcover' (classi di vegetazione), di 'Leaf area index' (includendo l'andamento stagionale), di Emissività, di Topografia. I data set, originariamente a diverse risoluzioni, sono stati elaborati per fornire dati omogeneizzati alla risoluzione variabile del modello meteorologico, per il quale costituiscono un data base integrato. Sono stati inoltre acquisiti e rielaborati i primi dataset di dati meteorologici dedicati all'inizializzazione del modello per effettuare case studies di validazione.
Torna all'inizio
|