dr. pierantonio facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione...

23
1 >_ Computer-Aided Process Engineering Laboratory Laboratorio su metodi multivariati in processi batch Cenni a dati “non-standard” CAPE-Lab Department of Industrial Engineering University of Padova (Italy) Dr. Pierantonio Facco Big Data nell'Ingegneria Chimica Bologna, 6 luglio 2017 Boosting innovation www.capelab.dii.unipd.it Agenda delle attività di laboratorio Software disponibili PLS_Toolbox ® for Matlab ® Giorno 1 Esempio #1: relazione tra salute e consumo d’alcol Esempio #2: analisi della corporatura di atleti Esempio #3: monitoraggio di uno Slurry-Fed Ceramic Melter Giorno 2 Esempio #4: monitoraggio produzione di gomma stirene-butadiene Esempio #5: stima della qualità in un processo per la produzione di penicillina introduzione alla Proiezione su Strutture Lateti (PLS) Esempio #6: caratterizzazione di grasso suino da NIR 64

Upload: dinhkien

Post on 18-Feb-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

1

>_Computer-Aided Process Engineering Laboratory

Laboratorio su metodi multivariati in processi batch

Cenni a dati “non-standard”

CAPE-LabDepartment of Industrial EngineeringUniversity of Padova (Italy)

Dr. Pierantonio Facco

Big Data nell'Ingegneria ChimicaBologna, 6 luglio 2017

Boosting innovation

www.capelab.dii.unipd.it

Agenda delle attività di laboratorio Software disponibili PLS_Toolbox ® for Matlab®

Giorno 1 Esempio #1: relazione tra salute e consumo d’alcol Esempio #2: analisi della corporatura di atleti Esempio #3: monitoraggio di uno Slurry-Fed Ceramic Melter

Giorno 2 Esempio #4: monitoraggio produzione di gomma stirene-butadiene Esempio #5: stima della qualità in un processo per la produzione di

penicillina introduzione alla Proiezione su Strutture Lateti (PLS)

Esempio #6: caratterizzazione di grasso suino da NIR

64

Page 2: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

2

Esempio #4: Monitoraggio della produzione di una gomma

65

Boosting innovation

www.capelab.dii.unipd.it

Processo e obiettivi

66

Processo semicontinuo*: polimerizzazione stirene-butadiene per la produzione di gomme

Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

diagnosi delle cause

iMac

Stirene

Burtadiene

* Nomikos, P., MacGregor, J.F., 1994. Monitoring batch processes using multiway principal component analysis. AIChE J. 40, 1361–1375.

Page 3: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

3

Boosting innovation

www.capelab.dii.unipd.it

Impianto di produzione della gomma

67

iMac

Computer di processo

Reattore

Acqua di raffreddamento

Stirene

Butadiene

Boosting innovation

www.capelab.dii.unipd.it

Dati disponibili e visualizzazione Caricare: Example4_styrenebutadienebatch.mat Dati: 50 batch «normali» 9 variabili registrate in 200 istanti di tempo

Visualizzare dati: plot(X);xlabel('?');ylabel('?'); che struttura di dati è?

68

Page 4: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

4

Boosting innovation

www.capelab.dii.unipd.it

Peculiarità dei dati da processi batch

Matrice tridimensionale di dati il tempo è la terza dimensione

69

I ba

tch

Matrice (I×J): variabilidi processo misurate

per tutti i batchall’istante k

J variabili di processo

Boosting innovation

www.capelab.dii.unipd.it

Trattamento dei dati tridimensionali

Multi-way PCA è una PCA regolare su una matrice

bidimensionale ricavata dalla tridimensionale mediante unfolding

Unfolding: nel senso delle variabili

si riferisce alla media globale delle variabili

non considera la dinamica nel senso dei batch

si riferisce alle traiettorie temporali medie delle variabili

considera la dinamica del processo richiede sincronizzazione tra batch

70

Page 5: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

5

Boosting innovation

www.capelab.dii.unipd.it

Dati disponibili e visualizzazione Caricare: Example4_styrenebutadienebatch.mat Dati: 50 batch «normali» 9 variabili registrate in 200 istanti di tempo

Visualizzare dati: plot(X);xlabel('?');ylabel('?'); che struttura di dati è?

71

Boosting innovation

www.capelab.dii.unipd.it

Studio dei profili temporali delle variabili

I profili delle variabili non mostrano anomalie le variabili sono correlate

Tutti i batch sembrano apparentemente normali

72

figure; plot(X(1:200,4:6));xlabel('osservazione/tempo');ylabel('temperatura°C)');legend('reattore','refrigerante','camicia')

Tr(:,:)=X_3D(:,4,:);figure; plot(Tr);xlabel('osservazione/tempo');ylabel('temperatura reattore (°C)');

Page 6: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

6

Boosting innovation

www.capelab.dii.unipd.it

Modello PCA

Unfolding batch-wise: considera la dinamica del processo Costruzione PCA su matrice: X_batchwiseunfolded Pretrattamento: autoscaling: si osservano le traiettorie temporali delle variabili rispetto al

profilo temporale medio e alla sua variabilità Scelta numero di PC: 2-4

73

Boosting innovation

www.capelab.dii.unipd.it

Process understanding (1/2)

74

densità lattice

conversione

temperatura refrigerante

temperaturacamicia

Il diagramma dei loading mostra: le relazioni tra le variabili nel tempo traiettorie temporali delle maggiori fonti di variabilità

densità lattice e conversione temperature refrigerante e camicia

tempo

vari

abile

1

vari

abile

2

Page 7: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

7

Boosting innovation

www.capelab.dii.unipd.it

Process understanding (2/2)

Il diagramma dei loading cumulati mostra: i valori cumulati su tutta la traiettoria temporale le maggiori fonti di variabilità come nella slide precedente

75

-0.02 -0.01 0.00 0.01 0.02 0.03 0.04 0.05-0.020

-0.015

-0.010

-0.005

0.000

0.005

0.010

0.015

0.020

Load

ing

PC

2

Loading PC1

Trj

Tcw

FbutaTf

TrFstyr

Er

ro

cTOT

FstirFbuta Tf Tr Tcw Trj ro cTOT Er-0.02

-0.01

0.00

0.01

0.02

0.03

0.04

0.05

Load

ing

PC

1

Variabile

Clusters Relazioni positive Anticorralazioni

Boosting innovation

www.capelab.dii.unipd.it

Carte di controllo

Carte di controllo T2 e SPE da leggere sempre congiuntamente hanno un contenuto informativo complementare

76

Page 8: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

8

Boosting innovation

www.capelab.dii.unipd.it

Monitoraggio «post mortem» batch 53

Il batch 53 risulta essere regolare

77

Boosting innovation

www.capelab.dii.unipd.it

Monitoraggio «post mortem» batch 99

Il batch 99 viene rilevato come anomalo sia la carte di controllo del diagramma degli score che le carte

di controllo di T2 e SPE indicano un malfunzionamento nel batch

78

Page 9: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

9

Boosting innovation

www.capelab.dii.unipd.it

Diagnosi del malfunzionamento

Contribution plot si osservano sia i contributi a T2 che a SPE

Sono legati al malfunzionamento: valori bassi di conversione e densità del lattice valori alti delle temperature di refrigerante e camicia

79

Boosting innovation

www.capelab.dii.unipd.it

E’ possibile anticipare il rilevamento di malfunzionamenti/anomalie?

E’ possibile anche osservare la traiettoria temporale del batch all’interno delle carte di controllo il limite può essere fissato sull’intera storia del batch si possono ricavare limiti di confidenza nel tempo*

80* Nomikos, P., MacGregor, J.F., 1994. Monitoring batch processes using multiway principal component analysis. AIChE J. 40, 1361–1375.

Page 10: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

10

Boosting innovation

www.capelab.dii.unipd.it

Monitoraggio in linea batch 99

Rilevamento anticipato dell’anomalia possibilità di intervento/correzione del batch anticipo delle operazioni di smaltimento scarti/pulizia d’impianto

81

rilevamento anticipato dell’anomalia

tempo

Boosting innovation

www.capelab.dii.unipd.it

«Take home message»

Nel controllo statistico di processo ci sono strumenti adeguati per tenere monitorata la dinamica di un processo i processi batch vengono monitorati mediante metodiche «multy-

way»

Il monitoraggio statistico di processo può essere utilizzato: per il monitoraggio «post mortem» in linea per dare in tempo reale un giudizio sullo stato del

sistema sistema sta operando in condizioni standard?

82

Page 11: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

11

Esempio #5: Stima della concentrazione di penicillina

83

Boosting innovation

www.capelab.dii.unipd.it

Processo per la produzione di penicillina

Processo batch di crescita della coltura + fase fed-batch di produzione della penicillina

Obiettivo: stima della concentrazione finale di penicillina

84Birol, G., Ündey, C., Çinar, A., 2002. A modular simulation package for fed‐batch fermentation: penicillin production. Comput. Chem. Eng. 26, 1553–1565

variabile

1Velocità di aerazione

2Potenza di agitazione

3Velocità di alimentazione substrato

4Temperatura substr. in alimentazione

5Profilo concentrazione substrato

6Conc. Ossigeno disciolto

7Conc. Biomassa

8Volume di coltura

9Conc. CO2

10pH nel reattore

11Temperatura nel reattore

12Calore generato

13Portata acido

14Portata base

15Portata acqua riscaldamento/raffreddamento

Page 12: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

12

Boosting innovation

www.capelab.dii.unipd.it

Dati e problematiche del processo

Dati: 60 batch matrice X:

15 variabili registrate 1 volta all’ora durata del batch 200h

matrice Y: valore finale della concentrazione di penicillina

Alta variabilità delle condizioni iniziali: concentrazione iniziale del substrato da 25 a 35 g/L intasamento progressivo del sistema di aerazione innalzamento del numero di giri dell’agitatore 30-35-40 W sporcamento progressivo della sonda pH

85

YX PLS?

Boosting innovation

www.capelab.dii.unipd.it

Il problema della regressione Obiettivo:

note le misure di processo X, stimare in linea le variabili di qualità Y (di importanza primaria, ma misurate non frequentemente)

la PCA descrive la variabilità delle variabili di processo X qui non si vuole fare questo, ma piuttosto usare X per descrivere Y

Metodo “standard”: immaginare una relazione lineare del tipo: Y = X B + E determinare la matrice B dei parametri del modello mediante minimizzazione

dell’errore E regressione ai minimi quadrati: B = (XTX)-1 XTY soluzione esplicita

Problema: quando le misure di processo sono correlate tra loro, l’inversione di (XTX) è

molto difficile/numericamente impossibile la stima dei parametri B è imprecisa la soluzione è mal condizionata, cioè molto sensibile a piccole variazioni nei

dati

Page 13: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

13

Boosting innovation

www.capelab.dii.unipd.it

La tecnica: PLS

La tecnica PLS (Partial Least Squares; anche Projection on Latent Structures)* è concettualmente simile alla PCA vengono ridotte simultaneamente le dimensioni di X e di

Y i vettori latenti dello spazio X vengono ruotati nei pesi W più

predittivi dello spazio Y trova le direzioni di massima variabilità dei dati che

massimizzano la covarianza tra X e Y:

max(XYTYXT)

*Geladi, P., Kowalski, B.R., 1986. Partial least‐squares regression: a tutorial. Anal. Chim. Acta 185, 1–17.

Boosting innovation

www.capelab.dii.unipd.it

Proiezione su strutture latenti PLS PLS considera le correlazioni tra due gruppi di dati X e Y a fini di

regredire Y da X dati X = materie prime/ variabili di processo/ parametri di processo…

dati Y = variabili di qualità

Page 14: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

14

Boosting innovation

www.capelab.dii.unipd.it

Modellazione a variabili latenti

PLS individua le direzioni di massima variabilità (variabili latenti) dalla correlazione fra i dati sia per X che per Y

Boosting innovation

www.capelab.dii.unipd.it

Variabili latenti del PLS PLS (Geladi and Kowalski, 1986):

ruota le direzioni di massima variabilità di X perché siano predittive per Y stima della qualità, soft sensing, progettazione di prodotto, spettroscopia NIR, …

Page 15: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

15

Boosting innovation

www.capelab.dii.unipd.it

Formulazione matematica di PLS

Equazioni di PLS:

91

ETPptptX

T

1 1

TTA

i

R

Aiiiii

FTQptptY

T

1 1

TTA

i

R

Aiiiii

WP

UWT

T

= T

PT

+ E I

J

I

JA

A

X

J

I

J

jji

Tiii eQ

1

2,ee

TiiiT tλt 12

Boosting innovation

www.capelab.dii.unipd.it

Visualizzazione dei profili delle variabili

Profili temporali di alcune variabili chiave

92

Page 16: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

16

Boosting innovation

www.capelab.dii.unipd.it

Modellazione PLS

Caricare: Example5_penicillinestimation.mat

Selezionare il modello PLS Importare i dati di calibrazione: Xcal, Ycal

Pretrattamento: autoscaling dei dati Selezione di 2/3 variabili latenti

93

LVvarianza spiegata X

varianza cumulativa spiegata X

varianza spiegata Y

varianza cumulativa spiegata Y

1 24.88 24.88 58.24 58.242 25.69 50.58 22.95 81.19

Boosting innovation

www.capelab.dii.unipd.it

Analisi della relazione tra batch

Due cluster sono evidenti Entrambi i cluster sono comunque ben rappresentati dal

modello

94

Page 17: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

17

Boosting innovation

www.capelab.dii.unipd.it

A quali variabili è correlata la qualità finale del prodotto?

Analisi dei pesi W di LV1 (58% della varianza di Y)

95

Boosting innovation

www.capelab.dii.unipd.it

Prestazioni di stima in calibrazione

Bontà del fitting in calibrazione: coefficiente di determinazione

96

1∑

R2 = 0.88

Page 18: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

18

Boosting innovation

www.capelab.dii.unipd.it

Stima su nuove osservazioni con PLS

Importare i dati di convalida: Xval, Yval

Pretrattamento: autoscaling dei dati automatico su media e varianza del set di calibrazione

Proiezione nello spazio della LV Stima della concentrazione di penicillina finale

Per comandi:

97

yp=modlpred(Xval,plsm1);

Boosting innovation

www.capelab.dii.unipd.it

Errori di stima in convalida

Coefficiente di determinazione in convalida: R2 = 0.79 errori relativi di stima sul 2/3% in media errore relativo massimo 11%

98

errore assoluto di stima

Page 19: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

19

Boosting innovation

www.capelab.dii.unipd.it

«Take-home message» Per correlare 2 (o più) set di dati diversi e multivariati PLS è una tecnica

assolutamente adeguata, PLS può essere utilizzato per eseguire in modo preciso e accurato:

stime previsioni process understanding analisi correlative

PLS (come PCA) è una tecnica flessibile che si adatta a molti tipi di dati: dati da sensori hardware analisi e misure chimiche, fisiche, meccaniche giudizi di esperti d classificazioni dati quantitativi e qualitativi immagini spettri dati provenienti da internet ecc…

99

Esempio 6: Caratterizzazione del grasso suino da NIR

100

Page 20: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

20

Boosting innovation

www.capelab.dii.unipd.it

Spettroscopia al vicino infrarosso NIRS La spettroscopia al vicino infrarosso è una tecnica analitica per la

caratterizzazione di materiali Principio di funzionamento:

le onde elettromagnetiche (780-2500 nm) vengono riflesse/assorbite/ trasmesse in modo differente dei campioni che incidono dipendentemente dalle vibrazioni dei gruppi molecolari che lo compongono

l’intensità e la frequenza con cui le onde elettromagnetiche vengono riflesse/assorbite/trasmesse danno un’indicazione indiretta dei gruppi funzionali presenti nelle molecole del campione analizzato

101

configurazione di uno spettroscopio NIR

Boosting innovation

www.capelab.dii.unipd.it

Applicazioni nell’industria alimentare Metodiche elaborate utilizzando NIRS, analisi dell’immagine, Instron, etc…:

sistemi di classificazione fresco-decongelato classificazione del formaggio per distinguere invecchiamento, alpeggio, e periodo di produzione classificazione prodotti pescati/allevati, freschi/decongelati caratterizzazione dello speck (% grasso, caratteristiche nutrizionali, tipologia allevamento) caratterizzazione degli additivi della salsiccia caratterizzazione della salubrità di molluschi

Applicazioni dell’industria alimentare triglia, branzino, ecc… formaggio Asiago d’allevo speck cozze della laguna veneta salsiccia

Page 21: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

21

Boosting innovation

www.capelab.dii.unipd.it

Dati su analisi di grasso suino

Analisi NIR del grasso in carcasse di suino Obiettivo: stima del contenuto di iodio risparmiare misure chimiche di laboratorio

Caricare: Example_6_pigfat.mat Dati: osservazioni:

150 campioni di grasso suino in calibrazione

49 di convalida variabili X:

700 lunghezze d’onda campo d’esplorazione NIR:

1000-2500 nm variabili Y:

contenuto di iodio

103

IODIO

Boosting innovation

www.capelab.dii.unipd.it

Modello PLS

Pretrattamento: standard normal variate SNV (autoscaling per righe) + autoscaling per X, autoscaling per Y

Selezione LV: 10 Calibrazione su: Xcal, Y1cal Convalida su Xval, Y1val

104

LV

varianza spiegata in X

varianza cumulativa spiegata in Y

varianza spiegata in Y

varianza cumulativa spiegata in Y

1 51.67 51.67 28.59 28.59

2 14.56 66.22 7.01 35.6

3 4.06 70.28 19.54 55.14

4 17.3 87.58 4.72 59.86

5 5.24 92.82 5.65 65.51

6 3.2 96.02 3.05 68.56

7 1.33 97.34 4.75 73.32

8 1.47 98.81 1.3 74.62

9 0.41 99.22 1.66 76.28

10 0.27 99.49 2.2 78.48

11 0.08 99.57 2.82 81.3

12 0.13 99.7 0.54 81.84

13 0.11 99.81 0.39 82.22

14 0.04 99.85 0.67 82.9

Page 22: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

22

Boosting innovation

www.capelab.dii.unipd.it

Ispezione score, SPE e T2

L’ispezione dello score plot permette di rilevare outliers, misure sbagliate, effetti operatore, derive dello strumento, ecc…

Nel caso di spettri NIR i loading/weights permettono di capire quali strutture molecolari siano più legate alle caratteristiche organolettiche, nutrizionali, o conservazione

105

Boosting innovation

www.capelab.dii.unipd.it

Prestazione di stima

Prestazioni di stima soddisfacenti: R2=0.77 in calibrazione R2=0.89 in convalida

106

Page 23: Dr. Pierantonio Facco > - site.unibo.it · polimerizzazione stirene-butadiene per la produzione di gomme Obiettivi: monitoraggio (in linea) rilevamento di eventuali anomalie o malfunzionamenti

23

[email protected]

Dr. Pierantonio Facco

Dept. of Industrial EngineeringUniversity of Padova

Italy

www.capelab.dii.unipd.it

>_ Boosting innovation!