tesi di laurea - home page | deibadia/papers/tesi_l_caruso.pdf · corso di laurea in ingegneria...

33
Università degli Studi di Padova DIPARTIMENTO DI INGEGNERIA DELL’INFORMAZIONE Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea Analisi di misure aggregate in reti di sensori wireless Relatore: Leonardo Badia Laureando: Laura Caruso Anno Accademico 2013-2014

Upload: lynguyet

Post on 15-Feb-2019

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Università degli Studi di Padova

DIPARTIMENTO DI INGEGNERIA DELL’INFORMAZIONECorso di Laurea in Ingegneria dell’Informazione

Tesi di laurea

Analisi di misure aggregatein reti di sensori wireless

Relatore:Leonardo Badia

Laureando:Laura Caruso

Anno Accademico 2013-2014

Page 2: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Abstract

In the last few years Wireless Sensor Networks (WSNs) had a crucial role inimproving life quality by many means, such as monitoring enviroment or cli-mate conditions. Developing energy-efficient interpolation methods for esti-mating the value of a physical signal where the sensors can not be deployedis an ongoing challenge. Also energy consumption in data trasmission canbe significantly reduced in aggregating or compressing data, both spatiallyand temporally, in order to prolong the lifetime of the sensors. However, sen-sors are most likely subjected to damaging. This work shows how PrincipalComponent Analysis (PCA), a spatial compression method based on the sta-tistic knowledge of a natural signal, can deal with an important statisticallybased interpolation technique called kriging, in the presence of undetectedbroken devices which sense values very different from reality and may alterthe statistical structure of the signal. The goal achieved in this paper is touse PCA-compression to limit data transmission load and at the same timeto reach an acceptable level of precision in interpolating 2D physical signals(e.g. temperature, luminosity, humidity) in broken networks.

Page 3: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Indice

1 Introduzione 2

2 Background 62.1 Kriging e metodi di interpolazione . . . . . . . . . . . . . . . 6

2.1.1 Il variogramma . . . . . . . . . . . . . . . . . . . . . . 72.1.2 Il kriging . . . . . . . . . . . . . . . . . . . . . . . . . 82.1.3 Related work . . . . . . . . . . . . . . . . . . . . . . . 9

2.2 Principal Component Analysis (PCA) . . . . . . . . . . . . . 122.2.1 Related work . . . . . . . . . . . . . . . . . . . . . . . 14

3 Studio di kriging e PCA applicati a una WSN 163.1 Problem statement . . . . . . . . . . . . . . . . . . . . . . . . 163.2 L’implementazione in Matlab . . . . . . . . . . . . . . . . . 19

4 Risultati 214.1 Descrizione del modello . . . . . . . . . . . . . . . . . . . . . 214.2 Analisi dei risultati . . . . . . . . . . . . . . . . . . . . . . . . 22

5 Conclusioni e sviluppi futuri 28Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . 28

1

Page 4: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Capitolo 1

Introduzione

Lo studio delle reti di sensori wireless (Wireless Sensor Network, WSN) ècresciuto esponenzialmente nell’ultimo decennio, in virtù degli innumerevoliambiti in cui esse possono trovare applicazione come, a titolo d’esempio, ilmilitare, l’industriale, il settore medico, o quello ambientale e delle scienzenaturali [7, 4, 23]. Esempi di applicazione concreta [23] riguardano ancheproblemi di logistica, robotica, domotica e, in generale, tutto ciò che conflui-sce nella filosofia dell’Internet of Things (IoT) [24, 27], quella tecnologia chevedrebbe le cose e gli oggetti interconnessi in maniera intelligente con l’au-silio di Internet. Pertanto, la crescente diffusione delle WSN rappresenta unprezioso incentivo al miglioramento della qualità della vita e della sicurezzae si presume che ben presto esse divengano parte integrante del quotidiano.

UnaWSN si configura come un rete costituita da dispositivi di dimensioniridotte con capacità autonome di calcolo, di memorizzazione e di trasmissionee ricezione dei dati [7]: un nodo della rete è in grado di campionare unqualsiasi dato, rielaborarlo ed inviarlo a una centrale che dialoga con l’utente,affinchè un fenomeno fisico, quale il livello di inquinamento dell’aria o ilgrado di luminosità di una stanza, possa essere efficientemente monitorato omappato, anche in tempo reale [4].

Quanto alle modalità di installazione, esse sono molteplici: possono con-sistere in un’installazione su vasta scala, che avviene in modo casuale o adhoc [4] (es. lancio dei sensori da un aereomobile su foresta o specchio d’ac-qua [7]), oppure specificamente localizzata (es. paziente ospedaliero per con-trollo dei valori clinici [27, 7]), a seconda della tipologia di applicazione. Perquanto riguarda la densità, invece, essa dipende da vari fattori quali, nuova-mente, il tipo di applicazione (il monitoraggio di un ambiente di vasta scalarichiederà una maggiore densità di installazione di un target tracking) o illivello di accuratezza della mappatura [4].

Tuttavia, i sensori soffrono di una serie di limiti non trascurabili checondizionano diversi aspetti della loro progettazione, dai protocolli di rou-ting impiegati per la trasmissione dei dati, agli algoritmi utilizzati nella loro

2

Page 5: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Figura 1.1: Installazione di sensori wireless presso il laboratorio di ricercaIntel a Berkley. 54 sensori, nell’arco di un mese circa, misurano temperatura,umidità, luminosità ed elettricità dell’aria, raccogliendo un totale di quasi2.3 milioni di misurazioni [14].

elaborazione [26]. Questi aspetti negativi derivano, fra le altre cose, dalledimensioni ridotte che li caratterizzano e dal costo economico che deve rima-nere contenuto qualora il problema richieda ingenti quantità dei dispositiviin questione: tutti fattori che si traducono in limitazioni alla durata dellabatteria e alle capacità di processare i dati e memorizzarli [4], tant’è veroche una recente tendenza è quella di costruire reti di sensori capaci di im-magazzinare energia (energy harvesting) da sorgenti alternative (es. energiasolare) [25].

La natura finita di una rete di sensori wireless, inoltre, rende necessariolo sviluppo di metodi efficaci per l’interpolazione dei punti dello spazio incui i sensori non siano presenti [15], soprattutto per fenomeni naturali, pro-blema che verrà preso in considerazione in questa tesi. Questo fatto diventacruciale laddove i sensori non possano essere installati a causa di particolariasperità del territorio o della presenza fisica di altri elementi: le zone in pro-posito vengono denominate coverage holes [1] e rappresentano un ostacoloalla corretta ricostruzione del segnale. In aggiunta, la rete può incorrere inrotture e danneggiamenti e, poiché nella maggior parte dei casi riparazioni osostituzione delle batterie risultano gravose se non addirittura impossibili, isensori circostanti devono supplire alla mancanza del sensore rotto sfruttan-do metodi di interpolazione [1]. Più in generale, le reti di sensori denotanouna certa dinamicità dal punto di vista della topologia, il che richiede chespesso debbano essere messe in atto strategie di rerouting, in aggiunta aglialtri problemi che possono sorgere [7].

Per tutti i suddetti motivi, la ricerca sulle WSN si sta sempre più in-dirizzando verso lo sviluppo di strategie mirate alla riduzione dei consumienergetici, strettamente correlati alle comunicazioni fra sensori e all’attività

3

Page 6: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

del processore. In questa direzione, sono di primaria importanza le tecnichedi compressione e di aggregazione dei dati [4].

Con aggregazione dei dati si intende la tecnica di fondere in un unico setdi informazioni dati provenienti da sensori diversi, che sono però indirizzativerso una stessa destinazione. La configurazione usuale di una WSN prevedeche i nodi pre-processino in maniera semplice le informazioni e le inviino auna o più unità, chiamate sink, delle quali si assumono illimitate tutte lebuone proprietà di un elaboratore [8]. Ma al sink tali informazioni possonogiungere in forma aggregata, per esempio:

• combinando i dati in un’unica funzione (es. media, mediana, minimo),ciò però comporta una perdita di informazione;

• inserendo in un unico pacchetto dati afferenti a diversi fenomeni (es.temperatura e umidità) per limitarne l’overhead ;

• inserendo in un unico pacchetto dati che rientrano in un certo intervallodi tempo;

• comprimendo i dati in modo lossy o lossless e in base alla loro correla-zione, spaziale o temporale, eliminando quella ridondanza di informa-zione che si verifica quando, per esempio, nella rete ci sono nodi moltovicini e per questo strettamente correlati.

In questa tesi, verrà analizzata la tecnica della Principal Component Ana-lysis (PCA), la cui applicazione rientra in una combinazione fra il secondo el’ultimo caso.

Un altro esempio di tecnica di aggregazione dei dati, per certi versi simileall’istogramma e molto diffusa nelle WSN, è il quantile digest (q-digest),basata sull’idea di raggruppare in buckets misure di sensori che differisconoa meno di un fattore desiderato, determinato dal livello di precisione e dallalunghezza del messaggio che contiene le informazioni sulle misure [19].

Una strategia di compressione lossless altrettanto diffusa, fondata sul no-to teorema di teoria dell’informazione di Slepian-Wolf [28], è la DistributeSource Coding (DSC) [8] i dati vengono compressi in forma distribuita senzache i sensori necessitino di comunicare fra di loro, ammesso che i nodi ab-biano la conoscenza a priori della correlazione del segnale e delle distanzereciproche fra i nodi stessi.

Le tecniche summenzionate hanno l’effetto negativo di aumentare l’errorenel recupero del segnale: a quelli naturali, dovuti alla precisione dello stru-mento di misurazione o alle interferenze dell’ambiente, si aggiungono quellicausati dall’interpolazione e dalla compressione dei dati, che, in particolare,saranno oggetto di studio e approfondimento nel presente lavoro. In lette-ratura, inoltre, sono presenti pochi esempi di lavori che analizzino come letecniche di interpolazione e compressione basate sulla statistica del segnale

4

Page 7: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

possano comportarsi innanzi al verificarsi di quelle anomalie nel funziona-mento dei sensori che difficilmente possono essere identificate dalla meraanalisi dei risultati. I sensori potrebbero misurare valori “sballati” senza chel’utente se ne possa accorgere. In questo lavoro si andrà a visualizzare quan-to un valore anomalo registrato da un sensore difettoso possa incidere sulrecupero del segnale.

conclusioni aggiunte alla fine.] Nello specifico, verrà mostrato comein uno scenario di applicazione di una WSN un’interpolazione efficiente possarichiedere la collaborazione di un numero di limitato di nodi della rete e comela compressione della PCA possa avere un ruolo positivo nella ricostruzione diun segnale campionato da sensori difettosi, in quanto consente di trascurareuna parte del rumore contenuto nelle misure.

La tesi sarà strutturata nel seguente modo.Nel capitolo 2 si esporranno gli strumenti matematici propedeutici al-

la comprensione del lavoro svolto e si porteranno in esempio alcuni lavoricorrelati o affini. Si fornirà, in particolare, una trattazione esaustiva di unnoto metodo di interpolazione chiamato kriging [1] e della PCA [9], usati inquesto lavoro.

Nel capitolo 3 si esporrà il problema in modo dettagliato e verrà propostauna possibile applicazione alle WSN delle suddette tecniche di interpolazionee compressione. In più, si discuterà un’implementazione originale del pro-blema di interpolazioni spaziali in presenza di malfunzionamento dei nodi(con ciò si assumerà che il nodo misuri un valore affetto da errore molto piùgrande di quello dovuto alla sensibilità dello strumento), realizzata tramiteil software Matlab.

Nel capitolo 4 si descriverà lo scenario che è stato ideato come riferimen-to. Tale scenario, in particolare, interesserà grandezze fisiche come tempe-ratura, luminosità e umidità all’interno di un certo ambiente. Si interprete-ranno, poi, i risultati delle varie simulazioni, andando a visualizzare i graficidell’errore di interpolazione al variare della probabilità di rottura di un nodo.

Il capitolo 5 lascerà spazio alle conclusioni finali e a possibili spunti perla prosecuzione di questo lavoro.

5

Page 8: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Capitolo 2

Background

2.1 Kriging e metodi di interpolazione

Tra i metodi di interpolazione più usati e indubbiamente più efficienti vi èil kriging [1], un metodo geostatistico che negli ultimi anni ha trovato ap-plicazione anche nelle WSN. Se, però, una tipica installazione geologica dimonitoraggio si avvale della raccolta di centinaia e centinaia di campioni,una rete WSN di solito è composta da un numero molto inferiore di punti diraccolta [16]. Tuttavia, il maggior limite del kriging è quello di essere effi-ciente solo in presenza di tanti dati, perciò applicarlo alle WSN non semprepuò essere congruo [16]. Si potrebbe pensare di andare a stimare un puntodello spazio (2D o 3D) semplicemente effettuando la media aritmetica deicampioni del segnale a disposizione oppure, ipotizzando che più lontani sia-no i campioni più il loro valore si discosti da quello incognito, effettuandoneuna media ponderata con coefficienti λj =

1/dj∑ni=1 1/di

dipendenti dall’inversodella distanza (Inverse Distance Weighting, IDW). È provato, tuttavia, chequesti approcci risultano inefficaci in presenza di segnali reali che hanno unastruttura più complessa e varia [15, 16, 6]. Il kriging di contro sfrutta la cor-relazione spaziale del segnale per pesare in maniera diversa i campioni, sullabase del fatto che più i punti sono distanti tra loro, più essi, generalmente,sono incorrelati [1]. Per raggiungere questo scopo, si utilizza una funzionedenominata variogramma, che per la buona riuscita del metodo deve essereprecedentemente calcolata con la massima precisione possibile. Inoltre il kri-ging gode di alcune proprietà fondamentali che si possono riassumere nellaformula best linear unbiased estimator (B.L.U.E.) [2]:

Best è uno stimatore a varianza minima

Linear i coefficienti sono lineari

Unbiased la media dell’errore è nulla

L’ultimo ma non meno importante aspetto vantaggioso è che tale metodo

6

Page 9: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

consente di calcolare la varianza, minima, dell’errore di interpolazione, cherappresenta un parametro da minimizzare al fine di ottenere delle stime piùprecise.

2.1.1 Il variogramma

Lo strumento statistico di cui si avvale preliminarmente il kriging è il (semi-)variogramma, una funzione così definita [3]:

γ(h) = 0.5(zx − zx+h)2 (2.1)

dove zx è i valore osservato in posizione x e zx+h è il valore osservato inun altro punto che dista h dal precedente. Di fatto il (semi-)variogramma èuna (semi-)varianza che esprime la dipendenza spaziale dei campioni. Quel-lo in (2.1) è tuttavia denominato variogramma sperimentale (EV), perchèbasato soltanto sui valori rilevati empiricamente: esso, in genere, ha l’aspet-to di una nuvola puntiforme e serve a predire un modello di variogrammaideale, su cui andrà fondata la stima della correlazione spaziale dell’interosegnale. Il variogramma sperimentale, a causa della sua natura dispersiva,non si presta a essere modellizzato, perciò come base si preferisce utilizzareil seguente stimatore:

γ(h) =1

2N(h)

N(h)∑i=1

(zx − zx+h)2 (2.2)

dove h è un intervallo di distanza (lag) e N(h) è il numero di coppie cherientrano in quell’intervallo. Non di rado si trova che per distanze moltoelevate i valori tendono ad avere un comportamento del tutto imprevedibi-le, perciò è buona norma limitare il variogramma alla semidistanza massi-ma [3]. A questo punto, si può modellizzare il variogramma secondo dellefunzioni predefinite. I modelli parametrici ”autorizzati” in letteratura sonoprincipalmente tre:

• Modello sferico

γ(h) =

{n+ s(1.5ha − 0.5(ha )3 per h ≤ an+ s altrove

• Modello esponenziale

γ(h) = n+ s(1− e−3ha )

• Modello gaussiano

γ(h) = n+ s(1− e−3h2

a2 )

7

Page 10: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

dove n si riferisce al nugget, ossia il valore che il variogramma assume nell’ori-gine (idealmente dovrebbe essere nullo, ma più spesso si ha una discontinuitàdovuta a errori di misurazione), mentre s e a sono rispettivamente il sill, ilvalore a cui il variogramma tende asintoticamente, e il range, cioè la distanzaminima in corrispondenza della quale la differenza fra variogramma e sill èinferiore, convenzionalmente, al 5% ammetto di aver trovato questo pre-ciso valore su wikipedia perchè le altre fonti non mi soddisfacevano,devo proprio citarla?.

Figura 2.1: I due tipi di variogramma a confronto.

2.1.2 Il kriging

L’obiettivo del kriging è quello di fornire i coefficienti con cui pesare i cam-pioni, a seconda della loro correlazione spaziale, per stimare un punto dellospazio. Non discuteremo i passaggi matematici di come si giunge al siste-ma lineare di equazioni che ha come soluzione i vari pesi, ma forniremo deidettagli aggiuntivi strettamente correlati.

Supponiamo di avere n misurazioni a disposizione, z1, z2, . . . , zn, e che ilpunto da interpolare sia z0. Allora

z0 =n∑i=1

wizi (2.3)

Sia w = (w1, . . . , wn, µ) di dimensione n+1, dove wi è uno dei coefficientidi interesse e µ è un coefficiente da scartare, che deriva dal metodo deimoltiplicatori di Lagrange [2, 1]utilizzato per rendere lo stimatore unbiased,cioè privo di errore sistematico (la media dell’errore è nulla). Le prossimeequazioni derivano dalla condizione precedente e da quella che la varianzasia minima:

n∑i=1

wi = 1 (2.4)

8

Page 11: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

w = C−1D (2.5)

dove C è la matrice di covarianza dei campioni e D è il vettore che rappre-senta la correlazione spaziale tra z0 e ogni zi [2]. Tuttavia fra il variogrammaγij e la covarianza Cij sussiste la seguente relazione:

γij =1

2Var(zi − zj) =

1

2{Var(zi) + Var(zj)− 2Cov(zi, zj)}

Se assumiamo che Var(zi) = Var(zj) = σ2, cioè che tutte le variabili abbianola stessa varianza, otteniamo

γij = σ2 − Cij

Quindi risulta evidente che le matrici di covarianza possono essere calcolateagevolmente sfruttando il variogramma di partenza [2]. Inoltre il krigingfornisce anche la varianza dell’errore, che in forma matriciale è

Var(z0 − z0) = (C−1D)TD, (2.6)

mentre in funzione della covarianza è

Var(z0 − z0) = Cov(0) +n∑i=1

n∑j=1

Cov(zi, zj)− 2n∑i=1

Cov(zi, z0) (2.7)

rendendo così possibile avere un’idea di quanto sia precisa la stima. Da (2.7)osserviamo un fenomeno interessante. La varianza dell’errore aumenta al-l’aumentare covarianza tra i vari campioni, il che significa che più i campioniusati nell’interpolazione sono correlati, vale a dire vicini, più la stima peggio-ra: si ha un effetto di clustering o di ridondanza che andrebbe limitato. Lostesso vale al diminuire della covarianza fra il punto da stimare e i campioni:se questi sono troppo lontani l’effetto sulla stima sarà peggiore. Quello de-scritto è l’ordinary kriging, è il metodo più semplice e ha il vantaggio che nonè necessario conoscere a priori la media del segnale. Vi sono altre variantipiù complesse tra cui il simple kriging, che richiede però un’assunzione sullamedia del segnale, o il block kriging, che permette di interpolare un’interaregione.

2.1.3 Related work

Pur essendo consolidato, il kriging rischia di essere oneroso dal punto divista dell’efficienza energetica se applicato alle WSN [5]. L’approccio piùbanale è quello centralizzato: tutti i nodi inviano di volta in volta i campionial sink che elabora il metodo. Ciò comporta costi in termini di energiatroppo elevati se si pensa a quante comunicazioni tra nodi, che nelle retidi sensori avvengono secondo il protocollo multihop, dovrebbero stabilirsiaffinchè l’operazione vada a buon fine [1]. Per questo motivo, negli ultimi

9

Page 12: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

anni, si sono cercati degli algoritmi volti a risolvere il problema in mododistribuito e localizzato.

Per esempio in [1], vengono proposti due algoritmi: un primo prevedeche i nodi calcolino il variogramma aggregando via via i dati secondo unastruttura ad albero (quadtree), una volta che l’EV ha raggiunto il sink, questoelabora il modello e, tramite broadcast, invia i parametri a tutti i nodi dellarete; il secondo (Distributed Kriging, DISK), risolve le equazioni del kriginglocalmente e in modo iterativo, servendosi soltanto di un sottinsieme di nodi,quelli nelle vicinanze del punto di interesse, ottenendo il duplice effetto diridurre le dimensioni della matrice di correlazione prevista nel calcolo, lacui inversione può essere insidiosa se di grandi dimensioni, e di limitare ilnumero di comunicazioni con la base.

Il contributo di [5] supera i limiti di [1] per ciò che riguarda la compu-tazione dell’EV: in [1] si richiedeva la conoscenza globale della rete per ladeterminazione degli alberi e, in secondo luogo, c’era notevole dispendio dienergia nel broadcast, in [5] l’approccio è totalmente distribuito. Inoltre vie-ne sfruttata la varianza del kriging per migliorare la qualità della stima: senell’interpolazione vengono impiegati t nodi e la varianza dell’errore risultaessere sopra una determinata soglia, si aggiungono iterativamente altri k ≥ 1nodi finchè il livello di precisione desiderato non viene raggiunto.

Il framework Error-Bounded Energy-Efficient (E2K) [12] propone un cri-terio di selezione dei nodi veramente necessari per interpolare con il krigingil resto dei punti per un dato istante t, con l’obiettivo principale di ridurre lecomunicazioni tra i sensori e il sink. Non tutti i sensori sono tenuti a man-dare le loro misure in base, ma soltanto una parte di essi, perchè le letture diquelli inattivi vengono interpolate in base entro una soglia d’errore ε che puòessere fissata a piacimento. L’algoritmo di E2K prevede una fase iniziale incui un sensore della rete trasmette con probabilità p e invia al sink e ai suoivicini il valore acquisito. Dopodiché, quei sensori che non hanno trasmessousano i valori che hanno ricevuto per fare il kriging della propria posizio-ne, confrontano la stima ottenuta con il valore che hanno letto realmente etrasmettono soltanto se l’errore che hanno commesso è |z0 − z0| ≥ ε. Que-sta procedura viene iterata finché non sono più necessarie delle trasmissionioppure si è raggiunto un limite prestabilito.

Una particolare variante, inoltre, è l’indicator kriging, metodo che servea stimare la probabilità che in un dato punto dello spazio il valore del feno-meno fisico in esame sia ”anomalo” (o un outlier), cioè superiore a una certasoglia consentita, il che può trovare applicazione, ad esempio, nella ricerca dizone in cui la concentrazione di una sostanza inquinante è molto al di sopradella norma. Si potrebbe pensare in futuro di estendere questo metodo perindividuare con immediatezza i nodi rotti di una rete. In [15] viene propostauna versione migliorata dell’indicator kriging in relazione alla probabilità peche un sensore i della WSN trasmetta al sink in modo corretto l’ indicatoreIτ di una certa anomalia (definito come Iτ (Xi) = 1, se Xi ≤ τ , 0 altrimenti,

10

Page 13: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

dove Xi è il valore misurato dal sensore e τ è la soglia massima consentita),ovvero alla probabilità di errore del canale di trasmissione che, nel caso spe-cifico, è un Binary Symmetric Channel (BSC) e all’energia consumata dallaWSN. Cercare di mitigare gli effetti dell’errore del canale binario, infatti,è molto importante, dal momento che tutta l’informazione è contenuta nelsingolo bit che rappresenta l’indicatore.

In [16, 6], vengono messi a confronto kriging e IDW in una WSN, po-nendo in luce il tradeoff che esiste fra i due: il primo gode di una maggioreprecisione, ma il secondo è più efficiente dal punto di vista della velocità dicalcolo. Infine, nel primo articolo, similmente a quanto verrà mostrato inquesto lavoro, l’errore di interpolazione di una temperatura (in questo casosi parla di reti di sensori installate in vani di furgoni incaricati di trasportarecibi freschi, le cui condizioni di conservazione necessitano un monitoraggiocostante) viene relazionato al numero minimo di sensori da installare perottenere una buona interpolazione.

11

Page 14: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

2.2 Principal Component Analysis (PCA)

La Principal Component Analysis (PCA) [9] è un metodo di origine statisti-ca molto potente per rivelare la struttura intrinseca di un qualsiasi insiemedi dati. Poiché con la PCA si va, sostanzialmente, a eliminare una certaquantità di informazione presente nei dati, rappresentata dalla loro correla-zione, questa tecnica si presta molto bene ad essere utilizzata come metododi compressione, per esempio, nell’elaborazione di immagini o, appunto, inuna rete di sensori wireless.

Quando si va a campionare un insieme di grandezze, si presuppone che lemisure ricavate siano rappresentate secondo il riferimento della base canoni-ca, tuttavia si potrebbe pensare di scegliere una base alternativa che consentauna rappresentazione più efficiente. Si devono considerare due aspetti moltoimportanti:

1. Rumore e varianza: Il rumore impedisce di interpretare corretta-mente i dati e per questo andrebbe più che eliminato, quantomeno”mascherato”. Al contrario l’informazione di un segnale è associata,in qualche modo, alla sua varianza: se si osserva che i dati varianoin maniera significativa lungo una direzione privilegiata, si getta lucesulla natura del fenomeno. Per esempio, se tracciamo le posizioni diun pendolo in oscillazione per istanti successivi, troveremo che lungouna direzione la varianza è alta (direzione dell’oscillazione), lungo unaseconda è moderata (dislivello), lungo la terza è quasi nulla (il motodel pendolo avviene sempre in piano, il “quasi” potrebbe essere do-vuto a un rumore esterno). Il problema di rappresentare bene questidati potrebbe ridursi, dunque, all’identificazione di un riferimento incui la varianza dei dati è massima oppure, in altri termini, in cui èmassimizzato il rapporto SNR =

σ2segnale

σ2rumore

, con σ2 che sta per varianza.

2. Ridondanza: Per descrivere adeguatamente un fenomeno potrebberoessere necessarie meno variabili di quelle che sono state in realtà raccol-te: le variabili in più sono sinonimo di una ridondanza che andrebbeeliminata. La ridondanza è associata invece alla correlazione: comeesempio, si prenda quello dei sensori di una rete, se le misure di duesensori vicini risultano essere molto correlate, uno dei due potrebbeessere risparmiato, decrementando il numero delle variabili di osserva-zione del fenomeno e migliorando così il consumo energetico, visto chenon sarebbe più essenziale una trasmissione da parte di entrambi. Pervisualizzare il grado di correlazione che sussiste fra i dati, di solito siricorre alla matrice di covarianza.

Tenendo conto di questi aspetti, la PCA si propone di trovare una nuovabase secondo la quale i dati mostrino alta varianza e bassa covarianza [9].

12

Page 15: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Figura 2.2: In rosso sono evidenziate le direzioni privilegiate lungo cui va-riano i dati. Poiché non coincidono con x1 e x2, sarebbe bene cambiare ilriferimento mettendo in pratica la PCA.

Supponiamo che la matrice di osservazione sia una matrice X m× n:

X =

x1...

xm

dove m è il numero di variabili considerate e gli xj, 1 ≤ j ≤ m, sono vettori1 × n con n numero di osservazioni per ciascuna variabile [9]. Supponiamodi aver precedentemente sottratto la media alle misure di ciascuna variabile:le variabili così ricavate hanno media nulla, varianza σi =

∑ni=1 = x2i e

covarianza σij =∑n

i,j=1 = xixj . La matrice di covarianza CX si definisce,allora, come:

CX =1

nXXT

Tale matrice è simmetrica, i termini diagonali sono le diverse varianze e itermini non diagonali sono, invece, le covarianze per i 6= j.

L’obiettivo consiste nel trovare una matrice di trasformazione lineareP tale che Y = PX esibisca queste proprietà: le variabili siano ordinateal decrescere della varianza (cioè la variabile più significativa si trovi nellaprima riga) e la matrice di covarianza CX sia diagonale, di modo che lacorrelazione (ridondanza) fra le variabili sia nulla. Poiché CX è simmetrica,è sempre diagonalizzabile in una matrice D attraverso una base ortogonaleE composta dai suoi autovettori.

Si dimostra facilmente che tra CX e CY esiste la seguente relazione:CY = PCXPT [9]. Si pone, infine, uguale a P la matrice le cui righe sonocomposte dagli autovettori diCX, perciò vale P = ET . Sapendo che anche Pè una matrice ortogonale e che, per definizione, P−1 = PT , si può finalmentedimostrare che P è proprio la matrice che trasforma X in Y e nel contempo

13

Page 16: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

diagonalizza CY:

CY = PCXPT = P(EDET )PT

= P(PTDP)PT = D(2.8)

Gli autovettori di CX sono le principal components (PC) di X e vanno acostituire le righe di P, dopo che sono stati ordinati in senso decrescenterispetto agli autovalori corrispondenti che, dato che P è proprio la matriceche diagonalizza CY, corrispondono alle varianze di Y [9].

I vettori di misure {y1,y2, . . . ,ym} riferiti alla nuova base avranno lecomponenti ordinate secondo la loro importanza (varianza decrescente), per-ciò per comprimere i dati si possono eventualmente trascurare le ultimecomponenti, ponendole pari a zero. Per risalire alle misure originali, è suf-ficiente invertire Y, facendo attenzione a riaggiungere la media delle misureinizialmente sottratta.

2.2.1 Related work

La PCA ha trovato applicazione nel campo delle WSN in accoppiata conun’importante tecnica di compressione emergente, il Compressive Sensing(CS) [13]. In [13] viene descritto il framework SCoRe1 che, fra il resto, ana-lizza l’errore di ricostruzione di un segnale compresso con tecnica CS+PCA.La PCA viene applicata a una matrice X di dimensioni N × K, dove Nsono i sensori della rete e K è il numero di istanti temporali in cui i sensoriraccolgono i campioni. Questa fase di training serve a studiare la statisticadel segnale e a ricavare la base di trasformazione che permetterà di rappre-sentare il segnale N -dimensionale con M < N variabili, poichè le rimanentiN −M possono essere trascurate senza grossa perdita di informazione: inaltri termini il segnale verrà reso M -sparso. Il CS, ipotizzando l’esistenza diuna trasformazione che renda il segnale per l’appunto sparso e che la matricedi cambiamento di base sia nota, permette di ricostruire il segnale di parten-za, N -dimensionale, a partire soltanto da L componenti, con M ≤ L < N ,anche se il sistema che ne risulta è in realtà malposto (N variabili, L equa-zioni). Ciò significa che, in ogni momento, è sufficiente che soltanto L < Nsensori siano attivi, poi con CS+PCA si potranno conoscere le acquisizionidei nodi rimanenti. Le performance di questa tecnica vengono poi messe aconfronto per metodi di interpolazione differenti.

Un metodo denominato PCAg che implementa la PCA in una WSN,ma con scopo diverso da [13], ovvero quello di aggregare i dati, è propostoin [17]. Dopo una fase di training simile a quella in [13], i dati arrivano al sinkrisalendo in modo aggregativo un routing tree in cui i nodi calcolano di voltain volta le singole coordinate (di numero inferiore a quello dei nodi della rete)del vettore delle misure dei sensori compresso rispetto alla base delle PC, alloscopo di ridurre a un minimo fisso le dimensioni dei pacchetti che vengono

14

Page 17: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

passati fra i nodi. Un meccanismo di feedback fra il sink, che ritrasformandoottiene il vettore originale, e il routing tree, i cui nodi posseggono le misurenon compresse, permette di vincolare a una soglia di errore l’approssimazionecosì ottenuta ed, eventualmente, di variare di conseguenza il numero dellecomponenti principali trascurate nella compressione.

Una variante è la multiple-PCA per le WSN, proposta in [20], che prevedel’organizzazione della rete in cluster di cui fanno parte i nodi di uno stessolivello del routing tree secondo cui si aggregano le misure: il calcolo dellePC viene ripetuto iterativamente man mano che si risale per i vari livellidi clustering, per eliminare la correlazione che è presente fra i cluster headsvicini tra di loro, migliorando in questo modo il rapporto fra il consumod’energia e la precisione ottenuta.

Un’altra applicazione della PCA alle reti di sensori viene, invece, descrittain [18]. La PCA può consentire la scoperta di eventi anomali all’internodella rete altrimenti non identificabili, come anche la rottura di un nodo,grazie all’analisi delle componenti principali meno significative del vettoredelle misure. Le ultime componenti dovrebbero, infatti, essere di normaprossime allo zero, essendo riferite, generalmente, al rumore. Se esse non losono significa che, con buona probabilità, il nodo è rotto oppure che c’è unqualche avvenimento in corso che provoca un disturbo molto più accentuato.

Come in [13] la tesi studierà le performance della PCA in relazione a unmetodo di interpolazione qual è il kriging, tuttavia si discosterà da [13, 17, 20]in quanto effettuerà la compressione PCA non su un unico tipo di misureraccolte dalla rete, ma su un insieme di due o più grandezze misurate daisensori, che verranno compresse in un unico pacchetto da mandare al sink,senza tuttavia tenere conto della correlazione temporale dei vari segnali, masoltanto di quella spaziale. Infine, a differenza di [13, 17, 20], verrà preso inconsiderazione il problema del malfunzionamento dei nodi.

15

Page 18: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Capitolo 3

Studio di kriging e PCAapplicati a una WSN

3.1 Problem statement

L’obiettivo principale di questa tesi è quello di studiare l’interazione fra l’in-terpolazione di un fenomeno spaziale e una tecnica di compressione come laPCA, al variare della probabilità che un nodo della rete si rompa. Si va, inaltre parole, a studiare quanto gli errori strumentali di misurazione possanoripercuotersi sulla statistica del segnale al punto di influenzare delle tecnichedi compressione come la PCA basate, per l’appunto, sulla correlazione delsegnale stesso.

Qui ci si riferirà soprattutto a fenomeni naturali, il cui monitoraggio, aldi là di quello su vasta scala (es. metereologico, del livello di inquinamentoo di un disastro ambientale), richiede un livello di sofisticazione sempre piùelevato se si pensa al ruolo che potrebbe avere una WSN, per esempio, nel-l’impianto di climatizzazione di una casa intelligente per ridurne i costi digestione, nel controllo di un processo industriale, nella conservazione deglialimenti (come in [16]) oppure nella coltivazione di piante e fiori in ambientecontrollato [21].

Tecniche come la PCA, che consentono di comprimere i dati basandosi,come si diceva, sulla correlazione dei segnali, sono poi ancora più efficientise si ha a che fare con la natura e il clima, dove si osserva che molte voltele grandezze sono di per sè correlate: la temperatura può crescere con laluminosità o l’umidità aumentare al decrescere della temperatura. Effettuareuna compressione nel modo che verrà descritto permette di monitorare piùparametri contemporaneamente con consumi di energia ridotti.

Anche il problema della rottura dei nodi non è da sottovalutare, dato chei sensori sono sì dispositivi economici, ma anche delicati. Le condizioni a cuisono sovente sottoposti rendono un loro danneggiamento alquanto probabile.Per estremo, potrebbero essere installati direttamente nel sottosuolo o in

16

Page 19: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

una foresta per prevenirne gli incendi ed eventualmente individuarne le zonecolpite [22].

Supponiamo di avere una WSN di N sensori installata in un ambiente dicui vogliamo ricostruire l’andamento di K ≥ 2 grandezze fisiche. Si supponepoi che il sink (o anche fusion center), il punto centrale di raccolta di tutti idati, dalla potenza -idealmente- inesauribile, sia a conoscenza della topologiadella rete, allorchè in fase di installazione i vari sensori, dotati di GPS, in-viano le loro coordinate al sink, che calcola così la matrice delle distanze frai nodi. In una fase iniziale di training, tutti i sensori inviano i loro campionial sink, per consentire il calcolo del variogramma alla base del kriging. Ladurata del e la frequenza con cui si vuole ripetere il training rientrano neiparametri di progettazione e hanno a che fare con il tradeoff fra consumodi energia e bontà della stima. Inoltre, durante questa fase, viene costruitala base vettoriale, costituita dalle principal components (PC) dei K segna-li, rispetto a cui rappresentare le misure se si decide di optare per la PCAper comprimere i dati. In tal caso, la base viene distribuita a tutti i nodidella rete in modalità broadcast. Essa, comunque, andrebbe aggiornata ognik istanti temporali ripetendo il training, per registrare eventuali evoluzionitemporali del segnale complessivo, che può essere più o meno correlato neltempo. La matrice di cui si fa la PCA è una matrice W(t) di dimensioniK ×N così composta:

W(t) =

x1(t)

...xK

(t)

dove x1

(t), . . . ,xK(t) sono i vettori contenenti le N misure di delle rispettive

K grandezze campionate da ciascun sensore della rete nell’istante t.Ogni qualvolta l’utente desideri conoscere il valore di una grandezza in un

punto per un dato istante t, il sink richiede l’invio dei campioni agli n ≤ Nsensori più vicini, risale alle misure originali, se compresse, e, successivamen-te, mette in atto l’interpolazione tramite kriging [3]. Un’alternativa possibilepotrebbe essere quella di considerare solo i sensori che rientrano in un raggioprefissato a distanza dal punto di interesse.

Ad ogni istanza, i sensori inviano il vettore con le tre misure in un unicopacchetto di dati, in modo da ridurre il numero di trasmissioni e l’overhead,con conseguente risparmio energetico e diminuzione della probabilità cheun dato venga corrotto nel corso della trasmissione. Tuttavia, queste mi-sure, se applicata la PCA, vengono inviate in formato compresso, perchèrappresentate nel riferimento delle PC. Rispetto alla nuova base il vettorew

(t)i = (x

(t)1 , . . . , x

(t)K ), con 1 ≤ i ≤ N , avrà soltanto L componenti signifi-

cative: le rimanenti K − L saranno trascurabili rispetto alle altre e perciòverranno poste uguali a 0. In ciò consiste la compressione, i valori trasmessialla base sono dunque L/N di quelli originali.

17

Page 20: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Facendo un’assunzione restrittiva al fine di lasciare immutata la statisticaoriginaria dei segnali, trascuriamo che, in condizioni normali, vi siano erroridi misura strumentali da parte dei sensori, mentre diciamo che quando unsensore è rotto o è difettoso i singoli strumenti di misura sono tutti quantiaffetti da un rumore gaussiano di media nulla e di deviazione standard eleva-ta, proporzionalmente all’ordine di grandezza della grandezza fisica. Erroripiù grandi non sono presi in considerazione perché in tal caso sarebbe im-mediato dedurre dai valori interpolati che il sensore andrebbe sostituito oignorato. Possiamo ricondurre tali errori all’effetto di danneggiamenti subìtidal sensore che, magari, sono difficilmente riscontrabili dall’analisi delle mi-sure. Durante la fase di training, però, ipotizziamo che i sensori siano tutticorrettamente funzionanti, in modo che variogramma e PC possano esserecalcolati con precisione.

Nel capitolo 4 si discuteranno i risultati ottenuti attraverso le simulazionie si analizzerano in dettaglio i seguenti grafici:

• l’errore relativo percentuale εr% = 100 |z0−z0||z0| medio di interpolazio-ne del kriging al variare di n ≤ N , il numero di nodi utilizzati perl’interpolazione;

• εr% al variare di n, per T = 100 istanti temporali;

• εr% al variare della probabilità Pr che un nodo della rete si rompa,secondo i termini che abbiamo discusso;

• εr% al variare di Pr con a monte la tecnica della PCA.

18

Page 21: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

3.2 L’implementazione in Matlab

Per simulare la performance del kriging in relazione con la tecnica di com-pressione PCA descritta sopra al variare di Pr probabilità che un nodo sirompa, è stato fatto uso dell’ambiente di programmazione Matlab. Ini-zialmente, decise le coordinate x e y dei nodi della rete, è stato creato unworkspace con le K misure degli N sensori funzionanti per T istanti tempo-rali (la matrice data), a cui si aggiungono le posizioni dei nodi e la matricedelle loro relative distanze (dist). Per calcolare il variogramma teorico sisono utilizzate le funzioni variogram e variogramfit (tratte da [10] e [11]),che valutano rispettivamente il variogramma sperimentale, con la possibilitàdi scegliere il numero di intervalli di distanza (lag) in cui raggruppare i valoridell’EV, e la stima ai minimi quadrati del variogramma teorico, corredatadei parametri fondamentali (range,sill,nugget) del modello prescelto (inquesto caso quello gaussiano). G si riferisce alla grandezza da considerare.v = variogram ([x,y],(data(G,:))’,’nrbins ’ ,100,’plotit ’, false);[range ,sill ,nugget] = variogramfit(v.distance ,v.val ,[], [],

[],...’model ’,’gaussian ’,’plotit ’,false);

La simulazione va a mediare l’errore di ricostruzione al variare di n ≤ N o,per n fisso, della probabilità di rottura di un nodo su un numero prescelto dipunti z0 dello spazio, presi a caso (con distribuzione uniforme e indipendente,data dalla funzione rand). Nella seconda opzione, il rumore casuale vienegenerato in questo modo (sigma è la matrice delle deviazioni standard):data2 = data;for m = 1:size(data ,2)

rnd = 100* rand (1);if(rnd <p) %aggiunta del rumore

for G=1: size(data ,1)data2(1,m) = data2(1,m) +sigma(G)*randn (1);

endend

end

Per applicare il kriging vengono selezionati gli n nodi più vicini al punto dastimare:%d e’ il vettore delle distanze del punto (x0,y0) da tutti i

sensorid = ((x-x0).^2+(y-y0).^2) .^0.5;%selezione degli N nodi piu ’ vicini[Y,I]=sort(d,1);nn = I(1:n); %ritorna gli indici degli n sensori piu ’ viciniD = d(nn); %distanze dagli n sensoriz = (data(G,nn))’; %misure degli n sensori (in colonna)

Per quanto riguarda il calcolo delle PC, in Matlab (R2011b) è presente lafunzione princomp che calcola le PC di un insieme di dati. Tuttavia si è

19

Page 22: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

sfruttata un’implementazione alternativa (pcal), il cui codice è disponibilein [9]. L’effettiva matrice delle misure da inviare al sink viene preparatasottraendo la media delle varie grandezze (mn) alla matrice delle misure deglin nodi e poi proiettandola nello spazio delle PC. A seconda del grado dicompressione prescelto, si trascurano le ultime componenti a partire dall’L-esima. La matrice delle misure con cui fare il kriging nel sink viene poiricostruita tornando alla base originale e riaggiungendo la media dei segnali.

if(PCA)%sottrarre prima la mediaz = data2(:,nn) - repmat(mn ,1,n);projected_data = PC ’*zind = L:size(data2 ,1); %componenti trascurabiliprojected_data(ind ,:) = 0; %compressione%decompressione del vettore delle misure al sinkdata_recovered = PC*projected_data+repmat(mn ,1,n);%campioni della sola grandezza G che interessa (in colonna)z = (data_recovered(G,:))’;

end

Si passa, quindi, al kriging della posizione z0:

%costruzione di CC = zeros(n,n);for i=1:n

for j=i:nx_i = nn(i); % indice di uno degli N nodi piu ’ vicinix_j = nn(j);C(i,j) = sill*(1-exp(-( dist(x_i ,x_j).^2)/( range ^2)));C(j,i) = C(i,j);

endendC(:,n+1) = 1;C(n+1,:) = 1;C(n+1,n+1) = 0;C_inv = pinv(C);

%costruzione di DD = sill*(1-exp(-(D.^2)/( range ^2)));D(n+1) = 1;

w = C_inv * D;z0 = sum(w(1:n,1).*z); %valore stimato

Si può così procedere al calcolo dell’errore medio percentuale εr%.

20

Page 23: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Capitolo 4

Risultati

4.1 Descrizione del modello

Per poter dimostrare risultati di questo tipo, è stato fatto uso di uno scenariodi applicazione molto semplice su cui si sono testate le varie simulazioni. Siè preso come riferimento un ambiente quadrato di lato 200 m di cui sonostati decisi arbitrariamente e a priori gli andamenti di K = 3 grandezze:

• temperatura, espressa in °C,

• luminosità, espressa in lux,

• umidità, espressa in %,

modellizzati attraverso delle quadriche opportunamente scalate secondo va-lori verosimili alla realtà. In alto a destra (200 m, 200 m) è presente undispositivo riscaldante che altera l’andamento della temperatura e nel mezzodella stanza sono collocate due sorgenti luminose. Per quanto queste funzio-ni rispecchino una situazione assolutamente ideale, si ritiene che segnali realipossano avere dei tratti di similarità con questi ideali, in quanto in generesegnali di questo tipo denotano un’alta correlazione spaziale. Si suppone cheN = 100 sensori distribuiti in modo casuale, con distribuzione uniforme eindipendente, nello spazio (si veda Figura 4.1), come il più delle volte avvieneper le WSN, in un arco di tempo che va da circa 12:00 alle 00:00, effettuinouna misurazione delle tre variabili ogni ∆t = 5 s per un totale di T = 3600campioni raccolti da ciascun sensore. Per l’istante iniziale si è assunto chela temperatura dell’ambiente vari fra i 15°C e i 20°C, l’umidità fra il 30% eil 40% e la luminosità registri un massimo di 750 lux.

In Figura 4.2 sono mostrati gli andamenti per T = 1. La fase di trainingin cui vengono calcolati variogramma e componenti principali viene limitatasempre all’istante T = 1. Quando si va a rappresentare il vettore delle K = 3misure campionate da un sensore i, con 1 ≤ i ≤ 100

w(t)i = (t(t), l(t), u(t))

21

Page 24: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

0 20 40 60 80 100 120 140 160 180 2000

20

40

60

80

100

120

140

160

180

200Configurazione dei nodi della WSN

m

m sink

Figura 4.1: Configurazione degli N=100 nodi della WSN.

dove t(t), l(t), u(t) sono rispettivamente temperatura, luminosità e umiditàall’istante t, si proietta il vettore nella base della PC e trascura la terzacomponente, inviando solo L/K = 2/3 dei dati raccolti. Infine, il rumoreda cui sono affette le misure dei sensori, nel caso in cui la rete sia soggettaa rotture, ha deviazione standard, rispettivamente per le tre componenti,σt = 4, σl = 100, σu = 8. Per semplificare il tutto, ad ogni modo, si assumeche l’approccio sia interamente centralizzato, cioè che tutte le comunicazionisiano indirizzate direttamente al sink, posizionato al centro dell’ambiente,così come variogramma e PCA siano calcolati interamente in base.

4.2 Analisi dei risultati

Le simulazioni si riferiscono all’istante iniziale e sono state condotte pren-dendo di volta in volta K = 1000 punti casuali dello spazio fissato, mediandopoi i risultati sull’errore.

In questo caso valgono le stesse considerazioni fatte per la precedentesimulazione:

Page 25: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Figura 4.2: Andamento delle varie grandezze fisiche.

23

Page 26: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

L’errore del kriging

Dai grafici in Figura 4.3 si può facilmente notare come l’errore di interpola-zione diminuisca all’aumentare del numero n di nodi impiegati, fino ad unmassimo di 50. Per 50 < n ≤ 100, anche se non è visualizzato, l’erroretenderebbe a crescere, a giustifica del fatto che più i campioni zi sono di-stanti dal punto da stimare z0, più la covarianza Cov(z0, zi) diminuisce, piùla varianza dell’errore aumenta, come spiegato nel capitolo 2. In ogni caso,per quanto sia stato trascurato il rumore dello strumento e la situazione siacomunque ideale, l’errore medio si mantiene abbastanza piccolo per tuttee tre le metriche considerate, tenendo presente che i sensori sono installa-ti con una densità non particolarmente elevata, ed è prossimo allo zero, aconferma che l’errore tende ad avere media nulla. È possibile imputare que-sta discrepanza con il valore nullo a un imperfetto calcolo del variogrammateorico, che, in via ideale, richiederebbere la compartecipazione di molti piùsensori. Si nota anche come non sia necessario un elevato numero di sensoriper ottenere un’interpolazione soddisfacente, il che vuol dire che può essereimpiegato solo un ristretto numero di essi, magari, stabilito a priori.

Figura 4.3: Errore percentuale medio del kriging al variare di n ≤ 50 numerodi nodi usati per l’interpolazione

Sono state fatte, poi, delle interpolazioni mediante kriging per i successivi1 < t ≤ 100 istanti, per provare gli effetti del training dell’istante iniziale.I grafici in Figura 4.4 dimostrano come l’errore medio di interpolazione, sesi tiene come riferimento il variogramma dell’istante iniziale, si mantengalimitato.

24

Page 27: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Figura 4.4: Errore percentuale medio del kriging al variare di n ≤ 50 per iprimi T = 100 istanti temporali

L’errore e la rottura dei nodi

Supponiamo ora che ciascun sensore della rete abbia una probabilità Pr ∈[0, 0.3] di rompersi, cioè di misurare un valore anomalo, ma comunque sen-sato, e consideriamo che ciascuna rottura sia indipendente dalle altre. Perinterpolare sono stati utilizzati n = 10 sensori. Come si può vedere in Fi-gura 4.5, l’errore di ricostruzione aumenta sensibilmente all’aumentare diquesta probabilità, che per 100 sensori coincide con la percentuale mediadi nodi rotti in 1000 simulazioni di questo tipo. Anche per probabilità nonelevate, l’errore diventa considerevole e, si può dire, inaccettabile. Da questopossiamo dedurre che il buon funzionamento della rete sia un requisito a dirpoco fondamentale, a prescindere dal metodo di interpolazione utilizzato.

La compressione PCA

Sempre considerando la stessa probabilità Pr che i nodi si rompano in modoindipendente e che i nodi scelti siano sempre n = 10, si applica ora la tecnicadella PCA come descritto nel capitolo 3. Poiché i dati sono corrotti e la baserispetto a cui vengono inviati al sink è la stessa base che verrebbe utilizzataper dati non affetti da rumore, si avranno certi casi in cui la terza componentedel vettore delle misure così trasmesso non è trascurabile e che saranno fontedi errore.

Dall’analisi della Figura 4.6, però, emergono dei fatti significativi. An-zitutto, per Pr = 0 si nota che l’errore in presenza della compressione èleggermente superiore al caso precedente, come riportato dalla Tabella 4.1:

25

Page 28: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

0 5 10 15 20 25 300

10

20

30

40

50

60

70

Pr % − percentuale di probabilità di rottura

ε r%Errore percentuale al variare della probabilità di rottura (n=10)

TemperaturaLuminositàUmidità

Figura 4.5: Errore percentuale medio al variare della probabilità di rotturaPr% con n = 10 nodi.

Tabella 4.1: L’errore della PCA nella rete completamente funzionante.

Grandezza εr%

Temperatura 5.1907Luminosità 1.539Umidità 0.244

In secondo luogo, si può osservare come la PCA lasci praticamente immutatala situazione in due terzi dei casi (luminosità, umidità) e addirittura abbiaun effetto benefico in un caso (l’errore della temperatura viene abbassatodi circa il 35% per probabilità elevate). Ciò potrebbe essere imputabile alfatto che vengono trasmessi i 2/3 del vettore delle misure e in questo modo,tralasciando l’ultima PC, si eliminerebbe una parte del rumore che, invece,affligge tutte e tre le variabili.

Visto che l’errore in presenza della PCA, in alcun caso, supera l’erroredell’interpolazione pura e semplice, possiamo, in prima approssimazione, de-durre che la tecnica della PCA applicata in questo modo è una tecnica cheinteragisce bene con il kriging, è abbastanza robusta alle rotture della retee nel caso in esame consente di risparmiare 1/3 della quantità di dati da

26

Page 29: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

inviare.

0 5 10 15 20 25 300

10

20

30

40

50

60

Pr % − percentuale di probabilità di rottura

ε r%

Errore percentuale al variare della probabilità di rottura (n=10)[PCA]

TemperaturaLuminositàUmidità

Figura 4.6: Errore percentuale medio al variare della probabilità di rotturaPr% con n = 10 nodi in presenza della PCA.

27

Page 30: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Capitolo 5

Conclusioni e sviluppi futuri

Far operare i sensori di una WSN in modo affidabile e nel contempo rispar-miare sul campo energetico rappresenta una sfida da portare avanti, soprat-tutto se si pensa alla crescente diffusione a cui le reti di sensori andrannoincontro, per le numerosissime utilità che possono fornire.

In casi pratici abbiamo dimostrato come l’interpolazione con kriging fun-zioni bene anche per n << N sensori della rete e, per tal motivo, possiamoritenere che questo sia un metodo da ottimizzare per le WSN quanto piùpossibile.

Questo lavoro dimostra, inoltre, come l’errore di ricostruzione di un se-gnale fisico in presenza di nodi soggetti a rotture, che è stato introdottoda una particolare tecnica di compressione applicata alle WSN, la PCA,normalmente utilizzata per compressioni temporali, qui impiegata per com-primere spazialmente, non sia superiore all’errore della semplice interpola-zione. La PCA, in qualche caso, addirittura migliora le performance del-l’interpolazione, sulla base del fatto che comprimendo si può trascurare co-sì il rumore aggiunto. Con la PCA così utilizzata viene perseguito, oltreall’obiettivo del risparmio energetico, anche quello di mappare più segnalicontemporaneamente, mantenendo un livello accettabile di precisione.

Un possibile sviluppo futuro sarebbe quello di testare il comportamentodegli altri metodi di compressione di radice statistica che vengono utilizzatinelle WSN rispetto a una rete che presenta dei nodi difettosi, tenendo contoche le probabilità che i sensori si rompano non sono affatto trascurabili,viste soprattutto le condizioni a cui devono essere sottoposti e la (frequente)impraticabilità della loro sostituzione.

Sarebbe interessante, in particolar modo, simulare il problema sopra datireali.

28

Page 31: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

Bibliografia

[1] M. Umer, L. Kulik, E. Tanin, “Spatial interpolation in wireless sensornetworks: localized algorithms for variogram modeling and Kriging”,Geoinformatica, Vol.14 No.1, pp. 101-134, Gennaio 2010.

[2] Edward H. Isaaks, “Applied Geostatistics”, Oxford University Press,1989.

[3] M. Traut, “Matlabr Recipes for Earth Sciences”, Springer, 2010.

[4] J. Yick, B. Mukherjee, D. Ghosal, “Wireless sensor network survey”,Computer Networks,Vol.52 No.12, pp.2292-2330, Agosto 2008.

[5] G.Hernandez-Penaloza, B.Beferull-Lozano, “Field Estimation in Wire-less Sensor Networks Using Distributed Kriging”, IEEE InternationalConference on Communications (ICC), Giugno 2012.

[6] L. Luo, A. Kansal, S. Nath, and F. Zhao, “Sharing and exploring sen-sor streams over geocentric interfaces”, Proceedings of the 16th ACMSIGSPATIAL International Conference on Advances in GeographicInformation Systems (GIS ’08), pp. 250–259, Novembre 2008.

[7] I.F. Akyildiz, W. Su, Y. Sankarasubramaniam, E. Cayirci, “Wirelesssensor networks: a survey”, Computer Networks, Vol.38, pp.393-422,2002.

[8] E. Fasolo, M. Rossi, J. Widmer, M. Zorzi, “In-network AggregationTechniques for Wireless Sensor Networks: A Survey”, IEEE Transac-tions on Wireless Communications, Vol. 14 No.2, pp. 70-87, Aprile2007.

[9] J. Shlens, “A Tutorial on Principal Component Analysis”, 2009.

[10] http://www.mathworks.com/matlabcentral/fileexchange/20355-experimental--semi---variogram

[11] http://www.mathworks.com/matlabcentral/fileexchange/25948-variogramfit

29

Page 32: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

[12] B. Harrington, Y. Huang, J. Yang, X. Li, “Energy-efficient map inter-polation for sensor fields using kriging”, IEEE Transactions on MobileComputing, Vol. 8 No.5, pp. 622-635, Maggio 2009.

[13] G. Quer, R. Masiero, G. Pillonetto, M. Rossi, M. Zorzi, “Sensing, Com-pression, and Recovery for WSNs: Sparse Signal Modeling and Moni-toring Framework”, IEEE Transactions on Wireless Communications,Vol. 11 No. 10, pp.3447-3461, Ottobre 2012.

[14] http://db.csail.mit.edu/labdata/labdata.html

[15] G. Liu, B. Xu, H. Chen, “An indicator kriging method for distribu-ted estimation in wireless sensor networks”, International Journal ofCommunication System, Vol. 27 No.1, pp. 68-80, Gennaio 2014.

[16] R. Jedermann, J. Palafox-Albarran, J.I. Robla, P. Barreiro, “Interpola-tion of spatial temperature profiles by sensor networks”, Proceedings ofIEEE Sensors 2011 Conference, pp.778,781, 28-31 Ottobre 2011.

[17] Y. Le Borgne, G. Bontempi, “Unsupervised and supervised compressionwith principal component analysis in wireless sensor networks”, 2007.

[18] Y. Le Borgne, G. Bontempi, “Distributed Principal Component Analysisfor Wireless Sensor Networks”, Sensors, Vol. 8 No.8, pp. 4821-4850,Agosto 2008.

[19] L. Badia, E. Fasolo, A. Paganini, M. Zorzi, “Data aggregation algorithmsfor sensor networks with geographic information awareness”, ProceedingsWPMC 2006, San Diego (CA), USA, Settembre 2006.

[20] F. Chen, M. Li, D. Wang, B. Tian, “Data compression through Prin-cipal Component Analysis over Wireless Sensor Networks”, Journal ofComputational Information Systems, Vol.9 No.5, pp. 1809–1816, 2013.

[21] C.A.L. Garzon, O.J.R. Riveros, “Temperature, humidity and lumine-scence monitoring system using Wireless Sensor Networks (WSN) inflowers growing”, Proceedings of IEEE ANDESCON 2010 Conference,pp.1-4, 15-17 Settembre 2010.

[22] S. Isik, M.Y. Donmez, C.Tunca, C. Ersoy, “Evaluation of wireless sensornetworks in realistic forest fire scenarios”, Proceedings of InternationalWorkshop on Multi-Sensor Systems and Networks for Fire Detectionand Management, 2014.

[23] T. Arampatzis, J. Lygeros, S. Manesis, “A survey of applications ofwireless sensors and wireless sensor networks, Proceedings of IEEEInternational Symposium on Intelligent Control, pp. 719-724, Giugno2005.

30

Page 33: Tesi di laurea - home page | DEIbadia/papers/tesi_L_Caruso.pdf · Corso di Laurea in Ingegneria dell’Informazione Tesi di laurea ... a titolo d’esempio, il militare,

[24] D. Christin, A. Reinhardt, P. Mogre, R. Steinmetz, R. “Wireless sensornetworks and the internet of things: selected challenges”, Proceedings ofthe 8th GI/ITG KuVS Fachgespräch Drahtlose Sensornetze, pp.31-34,2009.

[25] N. Michelusi, L. Badia, R. Carli, L. Corradini, M. Zorzi, “Energy mana-gement policies for harvesting-based wireless sensor devices with batterydegradation”, IEEE Transactions on Communications, Vol. 61 No. 12,pp. 4934-4947, Dicembre 2013.

[26] M. Rossi, L. Badia, P. Giacon, M. Zorzi, “Energy and connectivity per-formance of routing groups in multi-radio multi-hop networks”, Wire-less Communications and Mobile Computing, Vol. 8 No. 3, pp. 327-342,Marzo 2008.

[27] N. Bui, M. Zorzi, “Health care applications: a solution based on theinternet of things, Proceeding ISABEL, Art. No. 131, 2011.

[28] D. Slepian, J.K. Wolf, “Noiseless coding of correlated informationsources, IEEE Transactions on Information Theory, Vol.19 No.4,pp.471,480, Luglio 1973.

31