dr. pierantonio facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione...
TRANSCRIPT
1
>_Computer-Aided Process Engineering Laboratory
Laboratorio su metodi multivariati in processi batch
Cenni a dati “non-standard”
CAPE-LabDepartment of Industrial EngineeringUniversity of Padova (Italy)
Dr. Pierantonio Facco
Big Data nell'Ingegneria ChimicaBologna, 6 luglio 2017
Boosting innovation
www.capelab.dii.unipd.it
Agenda delle attività di laboratorio Software disponibili PLS_Toolbox ® for Matlab®
Giorno 1 Esempio #1: relazione tra salute e consumo d’alcol Esempio #2: analisi della corporatura di atleti Esempio #3: monitoraggio di uno Slurry-Fed Ceramic Melter
Giorno 2 Esempio #4: monitoraggio produzione di gomma stirene-butadiene Esempio #5: stima della qualità in un processo per la produzione di
penicillina introduzione alla Proiezione su Strutture Lateti (PLS)
Esempio #6: caratterizzazione di grasso suino da NIR
64
2
Esempio #4: Monitoraggio della produzione di una gomma
65
Boosting innovation
www.capelab.dii.unipd.it
Processo e obiettivi
66
Processo semicontinuo*: polimerizzazione stirene-butadiene per la produzione di gomme
Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti
diagnosi delle cause
iMac
Stirene
Burtadiene
* Nomikos, P., MacGregor, J.F., 1994. Monitoring batch processes using multiway principal component analysis. AIChE J. 40, 1361–1375.
3
Boosting innovation
www.capelab.dii.unipd.it
Impianto di produzione della gomma
67
iMac
Computer di processo
Reattore
Acqua di raffreddamento
Stirene
Butadiene
Boosting innovation
www.capelab.dii.unipd.it
Dati disponibili e visualizzazione Caricare: Example4_styrenebutadienebatch.mat Dati: 50 batch «normali» 9 variabili registrate in 200 istanti di tempo
Visualizzare dati: plot(X);xlabel('?');ylabel('?'); che struttura di dati è?
68
4
Boosting innovation
www.capelab.dii.unipd.it
Peculiarità dei dati da processi batch
Matrice tridimensionale di dati il tempo è la terza dimensione
69
I ba
tch
Matrice (I×J): variabilidi processo misurate
per tutti i batchall’istante k
J variabili di processo
Boosting innovation
www.capelab.dii.unipd.it
Trattamento dei dati tridimensionali
Multi-way PCA è una PCA regolare su una matrice
bidimensionale ricavata dalla tridimensionale mediante unfolding
Unfolding: nel senso delle variabili
si riferisce alla media globale delle variabili
non considera la dinamica nel senso dei batch
si riferisce alle traiettorie temporali medie delle variabili
considera la dinamica del processo richiede sincronizzazione tra batch
70
5
Boosting innovation
www.capelab.dii.unipd.it
Dati disponibili e visualizzazione Caricare: Example4_styrenebutadienebatch.mat Dati: 50 batch «normali» 9 variabili registrate in 200 istanti di tempo
Visualizzare dati: plot(X);xlabel('?');ylabel('?'); che struttura di dati è?
71
Boosting innovation
www.capelab.dii.unipd.it
Studio dei profili temporali delle variabili
I profili delle variabili non mostrano anomalie le variabili sono correlate
Tutti i batch sembrano apparentemente normali
72
figure; plot(X(1:200,4:6));xlabel('osservazione/tempo');ylabel('temperatura°C)');legend('reattore','refrigerante','camicia')
Tr(:,:)=X_3D(:,4,:);figure; plot(Tr);xlabel('osservazione/tempo');ylabel('temperatura reattore (°C)');
6
Boosting innovation
www.capelab.dii.unipd.it
Modello PCA
Unfolding batch-wise: considera la dinamica del processo Costruzione PCA su matrice: X_batchwiseunfolded Pretrattamento: autoscaling: si osservano le traiettorie temporali delle variabili rispetto al
profilo temporale medio e alla sua variabilità Scelta numero di PC: 2-4
73
Boosting innovation
www.capelab.dii.unipd.it
Process understanding (1/2)
74
densità lattice
conversione
temperatura refrigerante
temperaturacamicia
Il diagramma dei loading mostra: le relazioni tra le variabili nel tempo traiettorie temporali delle maggiori fonti di variabilità
densità lattice e conversione temperature refrigerante e camicia
tempo
vari
abile
1
vari
abile
2
7
Boosting innovation
www.capelab.dii.unipd.it
Process understanding (2/2)
Il diagramma dei loading cumulati mostra: i valori cumulati su tutta la traiettoria temporale le maggiori fonti di variabilità come nella slide precedente
75
-0.02 -0.01 0.00 0.01 0.02 0.03 0.04 0.05-0.020
-0.015
-0.010
-0.005
0.000
0.005
0.010
0.015
0.020
Load
ing
PC
2
Loading PC1
Trj
Tcw
FbutaTf
TrFstyr
Er
ro
cTOT
FstirFbuta Tf Tr Tcw Trj ro cTOT Er-0.02
-0.01
0.00
0.01
0.02
0.03
0.04
0.05
Load
ing
PC
1
Variabile
Clusters Relazioni positive Anticorralazioni
Boosting innovation
www.capelab.dii.unipd.it
Carte di controllo
Carte di controllo T2 e SPE da leggere sempre congiuntamente hanno un contenuto informativo complementare
76
8
Boosting innovation
www.capelab.dii.unipd.it
Monitoraggio «post mortem» batch 53
Il batch 53 risulta essere regolare
77
Boosting innovation
www.capelab.dii.unipd.it
Monitoraggio «post mortem» batch 99
Il batch 99 viene rilevato come anomalo sia la carte di controllo del diagramma degli score che le carte
di controllo di T2 e SPE indicano un malfunzionamento nel batch
78
9
Boosting innovation
www.capelab.dii.unipd.it
Diagnosi del malfunzionamento
Contribution plot si osservano sia i contributi a T2 che a SPE
Sono legati al malfunzionamento: valori bassi di conversione e densità del lattice valori alti delle temperature di refrigerante e camicia
79
Boosting innovation
www.capelab.dii.unipd.it
E’ possibile anticipare il rilevamento di malfunzionamenti/anomalie?
E’ possibile anche osservare la traiettoria temporale del batch all’interno delle carte di controllo il limite può essere fissato sull’intera storia del batch si possono ricavare limiti di confidenza nel tempo*
80* Nomikos, P., MacGregor, J.F., 1994. Monitoring batch processes using multiway principal component analysis. AIChE J. 40, 1361–1375.
10
Boosting innovation
www.capelab.dii.unipd.it
Monitoraggio in linea batch 99
Rilevamento anticipato dell’anomalia possibilità di intervento/correzione del batch anticipo delle operazioni di smaltimento scarti/pulizia d’impianto
81
rilevamento anticipato dell’anomalia
tempo
Boosting innovation
www.capelab.dii.unipd.it
«Take home message»
Nel controllo statistico di processo ci sono strumenti adeguati per tenere monitorata la dinamica di un processo i processi batch vengono monitorati mediante metodiche «multy-
way»
Il monitoraggio statistico di processo può essere utilizzato: per il monitoraggio «post mortem» in linea per dare in tempo reale un giudizio sullo stato del
sistema sistema sta operando in condizioni standard?
82
11
Esempio #5: Stima della concentrazione di penicillina
83
Boosting innovation
www.capelab.dii.unipd.it
Processo per la produzione di penicillina
Processo batch di crescita della coltura + fase fed-batch di produzione della penicillina
Obiettivo: stima della concentrazione finale di penicillina
84Birol, G., Ündey, C., Çinar, A., 2002. A modular simulation package for fed‐batch fermentation: penicillin production. Comput. Chem. Eng. 26, 1553–1565
variabile
1Velocità di aerazione
2Potenza di agitazione
3Velocità di alimentazione substrato
4Temperatura substr. in alimentazione
5Profilo concentrazione substrato
6Conc. Ossigeno disciolto
7Conc. Biomassa
8Volume di coltura
9Conc. CO2
10pH nel reattore
11Temperatura nel reattore
12Calore generato
13Portata acido
14Portata base
15Portata acqua riscaldamento/raffreddamento
12
Boosting innovation
www.capelab.dii.unipd.it
Dati e problematiche del processo
Dati: 60 batch matrice X:
15 variabili registrate 1 volta all’ora durata del batch 200h
matrice Y: valore finale della concentrazione di penicillina
Alta variabilità delle condizioni iniziali: concentrazione iniziale del substrato da 25 a 35 g/L intasamento progressivo del sistema di aerazione innalzamento del numero di giri dell’agitatore 30-35-40 W sporcamento progressivo della sonda pH
85
YX PLS?
Boosting innovation
www.capelab.dii.unipd.it
Il problema della regressione Obiettivo:
note le misure di processo X, stimare in linea le variabili di qualità Y (di importanza primaria, ma misurate non frequentemente)
la PCA descrive la variabilità delle variabili di processo X qui non si vuole fare questo, ma piuttosto usare X per descrivere Y
Metodo “standard”: immaginare una relazione lineare del tipo: Y = X B + E determinare la matrice B dei parametri del modello mediante minimizzazione
dell’errore E regressione ai minimi quadrati: B = (XTX)-1 XTY soluzione esplicita
Problema: quando le misure di processo sono correlate tra loro, l’inversione di (XTX) è
molto difficile/numericamente impossibile la stima dei parametri B è imprecisa la soluzione è mal condizionata, cioè molto sensibile a piccole variazioni nei
dati
13
Boosting innovation
www.capelab.dii.unipd.it
La tecnica: PLS
La tecnica PLS (Partial Least Squares; anche Projection on Latent Structures)* è concettualmente simile alla PCA vengono ridotte simultaneamente le dimensioni di X e di
Y i vettori latenti dello spazio X vengono ruotati nei pesi W più
predittivi dello spazio Y trova le direzioni di massima variabilità dei dati che
massimizzano la covarianza tra X e Y:
max(XYTYXT)
*Geladi, P., Kowalski, B.R., 1986. Partial least‐squares regression: a tutorial. Anal. Chim. Acta 185, 1–17.
Boosting innovation
www.capelab.dii.unipd.it
Proiezione su strutture latenti PLS PLS considera le correlazioni tra due gruppi di dati X e Y a fini di
regredire Y da X dati X = materie prime/ variabili di processo/ parametri di processo…
dati Y = variabili di qualità
14
Boosting innovation
www.capelab.dii.unipd.it
Modellazione a variabili latenti
PLS individua le direzioni di massima variabilità (variabili latenti) dalla correlazione fra i dati sia per X che per Y
Boosting innovation
www.capelab.dii.unipd.it
Variabili latenti del PLS PLS (Geladi and Kowalski, 1986):
ruota le direzioni di massima variabilità di X perché siano predittive per Y stima della qualità, soft sensing, progettazione di prodotto, spettroscopia NIR, …
15
Boosting innovation
www.capelab.dii.unipd.it
Formulazione matematica di PLS
Equazioni di PLS:
91
ETPptptX
T
1 1
TTA
i
R
Aiiiii
FTQptptY
T
1 1
TTA
i
R
Aiiiii
WP
UWT
T
= T
PT
+ E I
J
I
JA
A
X
J
I
J
jji
Tiii eQ
1
2,ee
TiiiT tλt 12
Boosting innovation
www.capelab.dii.unipd.it
Visualizzazione dei profili delle variabili
Profili temporali di alcune variabili chiave
92
16
Boosting innovation
www.capelab.dii.unipd.it
Modellazione PLS
Caricare: Example5_penicillinestimation.mat
Selezionare il modello PLS Importare i dati di calibrazione: Xcal, Ycal
Pretrattamento: autoscaling dei dati Selezione di 2/3 variabili latenti
93
LVvarianza spiegata X
varianza cumulativa spiegata X
varianza spiegata Y
varianza cumulativa spiegata Y
1 24.88 24.88 58.24 58.242 25.69 50.58 22.95 81.19
Boosting innovation
www.capelab.dii.unipd.it
Analisi della relazione tra batch
Due cluster sono evidenti Entrambi i cluster sono comunque ben rappresentati dal
modello
94
17
Boosting innovation
www.capelab.dii.unipd.it
A quali variabili è correlata la qualità finale del prodotto?
Analisi dei pesi W di LV1 (58% della varianza di Y)
95
Boosting innovation
www.capelab.dii.unipd.it
Prestazioni di stima in calibrazione
Bontà del fitting in calibrazione: coefficiente di determinazione
96
1∑
∑
R2 = 0.88
18
Boosting innovation
www.capelab.dii.unipd.it
Stima su nuove osservazioni con PLS
Importare i dati di convalida: Xval, Yval
Pretrattamento: autoscaling dei dati automatico su media e varianza del set di calibrazione
Proiezione nello spazio della LV Stima della concentrazione di penicillina finale
Per comandi:
97
yp=modlpred(Xval,plsm1);
Boosting innovation
www.capelab.dii.unipd.it
Errori di stima in convalida
Coefficiente di determinazione in convalida: R2 = 0.79 errori relativi di stima sul 2/3% in media errore relativo massimo 11%
98
errore assoluto di stima
19
Boosting innovation
www.capelab.dii.unipd.it
«Take-home message» Per correlare 2 (o più) set di dati diversi e multivariati PLS è una tecnica
assolutamente adeguata, PLS può essere utilizzato per eseguire in modo preciso e accurato:
stime previsioni process understanding analisi correlative
PLS (come PCA) è una tecnica flessibile che si adatta a molti tipi di dati: dati da sensori hardware analisi e misure chimiche, fisiche, meccaniche giudizi di esperti d classificazioni dati quantitativi e qualitativi immagini spettri dati provenienti da internet ecc…
99
Esempio 6: Caratterizzazione del grasso suino da NIR
100
20
Boosting innovation
www.capelab.dii.unipd.it
Spettroscopia al vicino infrarosso NIRS La spettroscopia al vicino infrarosso è una tecnica analitica per la
caratterizzazione di materiali Principio di funzionamento:
le onde elettromagnetiche (780-2500 nm) vengono riflesse/assorbite/ trasmesse in modo differente dei campioni che incidono dipendentemente dalle vibrazioni dei gruppi molecolari che lo compongono
l’intensità e la frequenza con cui le onde elettromagnetiche vengono riflesse/assorbite/trasmesse danno un’indicazione indiretta dei gruppi funzionali presenti nelle molecole del campione analizzato
101
configurazione di uno spettroscopio NIR
Boosting innovation
www.capelab.dii.unipd.it
Applicazioni nell’industria alimentare Metodiche elaborate utilizzando NIRS, analisi dell’immagine, Instron, etc…:
sistemi di classificazione fresco-decongelato classificazione del formaggio per distinguere invecchiamento, alpeggio, e periodo di produzione classificazione prodotti pescati/allevati, freschi/decongelati caratterizzazione dello speck (% grasso, caratteristiche nutrizionali, tipologia allevamento) caratterizzazione degli additivi della salsiccia caratterizzazione della salubrità di molluschi
Applicazioni dell’industria alimentare triglia, branzino, ecc… formaggio Asiago d’allevo speck cozze della laguna veneta salsiccia
21
Boosting innovation
www.capelab.dii.unipd.it
Dati su analisi di grasso suino
Analisi NIR del grasso in carcasse di suino Obiettivo: stima del contenuto di iodio risparmiare misure chimiche di laboratorio
Caricare: Example_6_pigfat.mat Dati: osservazioni:
150 campioni di grasso suino in calibrazione
49 di convalida variabili X:
700 lunghezze d’onda campo d’esplorazione NIR:
1000-2500 nm variabili Y:
contenuto di iodio
103
IODIO
Boosting innovation
www.capelab.dii.unipd.it
Modello PLS
Pretrattamento: standard normal variate SNV (autoscaling per righe) + autoscaling per X, autoscaling per Y
Selezione LV: 10 Calibrazione su: Xcal, Y1cal Convalida su Xval, Y1val
104
LV
varianza spiegata in X
varianza cumulativa spiegata in Y
varianza spiegata in Y
varianza cumulativa spiegata in Y
1 51.67 51.67 28.59 28.59
2 14.56 66.22 7.01 35.6
3 4.06 70.28 19.54 55.14
4 17.3 87.58 4.72 59.86
5 5.24 92.82 5.65 65.51
6 3.2 96.02 3.05 68.56
7 1.33 97.34 4.75 73.32
8 1.47 98.81 1.3 74.62
9 0.41 99.22 1.66 76.28
10 0.27 99.49 2.2 78.48
11 0.08 99.57 2.82 81.3
12 0.13 99.7 0.54 81.84
13 0.11 99.81 0.39 82.22
14 0.04 99.85 0.67 82.9
22
Boosting innovation
www.capelab.dii.unipd.it
Ispezione score, SPE e T2
L’ispezione dello score plot permette di rilevare outliers, misure sbagliate, effetti operatore, derive dello strumento, ecc…
Nel caso di spettri NIR i loading/weights permettono di capire quali strutture molecolari siano più legate alle caratteristiche organolettiche, nutrizionali, o conservazione
105
Boosting innovation
www.capelab.dii.unipd.it
Prestazione di stima
Prestazioni di stima soddisfacenti: R2=0.77 in calibrazione R2=0.89 in convalida
106
23
Dr. Pierantonio Facco
Dept. of Industrial EngineeringUniversity of Padova
Italy
www.capelab.dii.unipd.it
>_ Boosting innovation!