adaptive observer design based on scaling and neural networks

6
Abstract— Some works based on neural networks have been proposed to estimate adaptively the states of uncertain systems. However, they are subject to several conditions such as previous knowledge of upper bounds for the weight and approximation errors, ideal switching, and previous sample data for an off-line learning phase, which difficult their application. In this paper, an adaptive observer for uncertain nonlinear systems in the presence of disturbances is proposed in order to avoid the above mentioned limitations. Based on a neural Luenberger-like observer, scaling and Lyapunov theory, an adaptive scheme is proposed to make ultimately bounded the on-line observer error. Besides, it is shown that the scaling of unknown nonlinearities, previous to the neural approximation, has a positive impact on performance and application of our algorithm, since it allows the residual state error manipulation without any additional linear matrix inequality solution. To validate the theoretical results, the state estimation of the Rössler oscilator system is performed. Keywords— adaptive observers, uncertain systems, neural networks, Lyapunov methods. I. INTRODUÇÃO S OBSERVADORES adaptativos são ferramentas computacionais que possibilitam a estimação simultânea do estado e parâmetros de um sistema dinâmico usando- se suas entradas e saídas. As suas aplicações principais incluem a detecção de falhas [1]-[3], controle de sistemas dinâmicos [4]-[6] e telecomunicação com segurança [7]-[9]. Desta forma, tornaram-se objeto de ampla pesquisa na última década. Vide, por exemplo, [10]-[15] e suas referências. O projeto de observadores adaptativos é motivado pelo conhecimento da estrutura do modelo do sistema. Neste sentido, existem pelo menos duas abordagens. Na primeira abordagem é considerado que a estrutura do modelo é conhecida, sendo somente seus parâmetros desconhecidos [16]-[18]. Na segunda, a maior parte da estrutura do modelo do sistema é assumida desconhecida, no entanto, sendo seu vetor de estado associado limitado em norma. Exemplos típicos da segunda abordagem são observadores baseados em redes neurais artificiais [19]-[22] e sistemas nebulosos [23]- [25]. Convém ressaltar que a última abordagem estende a aplicação, pois relaxa a necessidade de se conhecer com precisão o modelo do sistema, o que corresponde, tipicamente, aos casos de aplicação prática. Por exemplo, em [21]-[22], foram propostos observadores J. A. R. Vargas, Universidade de Brasília, DF, Brazil, [email protected] K. H. M. Gularte, Universidade de Brasília, DF, Brazil, [email protected] E. M. Hemerly, Instituto Tecnológico de Aeronáutica, SP, Brazil, [email protected] adaptativos descontínuos baseados em redes neurais linearmente parametrizadas e com funções de ativação definidas, respectivamente, por wavelets e sigmóides. Embora os observadores em [21]-[22] assegurem a existência de um limitante superior para os erros quadráticos médios de observação, é necessária uma fase preliminar de experimentação para a obtenção de uma aproximação dos pesos nominais, que são usados nos algoritmos, fato que dificulta a implementação quando não são disponíveis dados prévios experimentais sobre o sistema. Objetivando assegurar erros residuais de observação assintoticamente nulos, em [12] e [19] foram propostos observadores adaptativos descontínuos. Em [12] foi considerada uma classe de sistemas mecânicos e proposto um observador que comuta entre um modo neural adaptativo, para valores grandes de erro, e um modo deslizante não adaptativo para erros pequenos. Entretanto, a operação em modo deslizante requer o conhecimento prévio de um limitante superior para os erros de aproximação neural, o que é usualmente desconhecido na prática. De igual forma, em [19] foi assegurada a convergência assintótica do estado estimado para o real usando um observador descontínuo baseado em modo deslizante e estimação de um limitante para os erros de aproximação. Contudo, é importante ressaltar que os observadores em [12], [19] e [21]-[22] apresentam trepidação, devido aos atrasos e imperfeiçoes dos dispositivos de comutação. A trepidação resulta em baixa precisão do controle, elevadas perdas de calor em circuitos elétricos de potência, desgaste elevado de peças móveis mecânicas, excitação de dinâmica não modelada de alta frequência, o que degrada o desempenho do sistema e pode levar o mesmo à instabilidade [26]. Uma forma de se evitar a trepidação é usando uma aproximação contínua da descontinuidade. Neste sentido, em [13] foi proposto um observador contínuo para sistemas não- lineares incertos baseado em redes neurais artificiais que assegura a convergência do erro residual de observação para zero, mesmo na presença de erros de aproximação, distúrbios e parâmetros variantes no tempo. Entretanto, o observador proposto assume que limitantes para o erro de aproximação, distúrbios e pesos nominais são conhecidos antecipadamente. Convém notar que em [12], [13], [19], [21] e [22] a dependência entre os vários parâmetros de projeto com o desempenho (transiente e erro em regime) do observador não é simples, pois a implementação demanda, entre outras hipóteses, que diversas desigualdades matriciais lineares sejam satisfeitas. Motivado pelos fatos prévios, neste artigo é proposto um J. A. R. Vargas, Member, IEEE, K. H. M. Gularte and E. M. Hemerly, Member, IEEE Adaptive Observer Design Based on Scaling and Neural Networks O IEEE LATIN AMERICA TRANSACTIONS, VOL. 11, NO. 4, JUNE 2013 989

Upload: elder

Post on 24-Dec-2016

216 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Adaptive observer design based on scaling and neural networks

Abstract— Some works based on neural networks have been proposed to estimate adaptively the states of uncertain systems. However, they are subject to several conditions such as previous knowledge of upper bounds for the weight and approximation errors, ideal switching, and previous sample data for an off-line learning phase, which difficult their application. In this paper, an adaptive observer for uncertain nonlinear systems in the presence of disturbances is proposed in order to avoid the above mentioned limitations. Based on a neural Luenberger-like observer, scaling and Lyapunov theory, an adaptive scheme is proposed to make ultimately bounded the on-line observer error. Besides, it is shown that the scaling of unknown nonlinearities, previous to the neural approximation, has a positive impact on performance and application of our algorithm, since it allows the residual state error manipulation without any additional linear matrix inequality solution. To validate the theoretical results, the state estimation of the Rössler oscilator system is performed.

Keywords— adaptive observers, uncertain systems, neural networks, Lyapunov methods.

I. INTRODUÇÃO

S OBSERVADORES adaptativos são ferramentas computacionais que possibilitam a estimação simultânea do estado e parâmetros de um sistema dinâmico usando-

se suas entradas e saídas. As suas aplicações principais incluem a detecção de falhas [1]-[3], controle de sistemas dinâmicos [4]-[6] e telecomunicação com segurança [7]-[9]. Desta forma, tornaram-se objeto de ampla pesquisa na última década. Vide, por exemplo, [10]-[15] e suas referências.

O projeto de observadores adaptativos é motivado pelo conhecimento da estrutura do modelo do sistema. Neste sentido, existem pelo menos duas abordagens. Na primeira abordagem é considerado que a estrutura do modelo é conhecida, sendo somente seus parâmetros desconhecidos [16]-[18]. Na segunda, a maior parte da estrutura do modelo do sistema é assumida desconhecida, no entanto, sendo seu vetor de estado associado limitado em norma. Exemplos típicos da segunda abordagem são observadores baseados em redes neurais artificiais [19]-[22] e sistemas nebulosos [23]-[25]. Convém ressaltar que a última abordagem estende a aplicação, pois relaxa a necessidade de se conhecer com precisão o modelo do sistema, o que corresponde, tipicamente, aos casos de aplicação prática.

Por exemplo, em [21]-[22], foram propostos observadores

J. A. R. Vargas, Universidade de Brasília, DF, Brazil, [email protected] K. H. M. Gularte, Universidade de Brasília, DF, Brazil,

[email protected] E. M. Hemerly, Instituto Tecnológico de Aeronáutica, SP, Brazil,

[email protected]

adaptativos descontínuos baseados em redes neurais linearmente parametrizadas e com funções de ativação definidas, respectivamente, por wavelets e sigmóides. Embora os observadores em [21]-[22] assegurem a existência de um limitante superior para os erros quadráticos médios de observação, é necessária uma fase preliminar de experimentação para a obtenção de uma aproximação dos pesos nominais, que são usados nos algoritmos, fato que dificulta a implementação quando não são disponíveis dados prévios experimentais sobre o sistema.

Objetivando assegurar erros residuais de observação assintoticamente nulos, em [12] e [19] foram propostos observadores adaptativos descontínuos. Em [12] foi considerada uma classe de sistemas mecânicos e proposto um observador que comuta entre um modo neural adaptativo, para valores grandes de erro, e um modo deslizante não adaptativo para erros pequenos. Entretanto, a operação em modo deslizante requer o conhecimento prévio de um limitante superior para os erros de aproximação neural, o que é usualmente desconhecido na prática. De igual forma, em [19] foi assegurada a convergência assintótica do estado estimado para o real usando um observador descontínuo baseado em modo deslizante e estimação de um limitante para os erros de aproximação. Contudo, é importante ressaltar que os observadores em [12], [19] e [21]-[22] apresentam trepidação, devido aos atrasos e imperfeiçoes dos dispositivos de comutação. A trepidação resulta em baixa precisão do controle, elevadas perdas de calor em circuitos elétricos de potência, desgaste elevado de peças móveis mecânicas, excitação de dinâmica não modelada de alta frequência, o que degrada o desempenho do sistema e pode levar o mesmo à instabilidade [26].

Uma forma de se evitar a trepidação é usando uma aproximação contínua da descontinuidade. Neste sentido, em [13] foi proposto um observador contínuo para sistemas não-lineares incertos baseado em redes neurais artificiais que assegura a convergência do erro residual de observação para zero, mesmo na presença de erros de aproximação, distúrbios e parâmetros variantes no tempo. Entretanto, o observador proposto assume que limitantes para o erro de aproximação, distúrbios e pesos nominais são conhecidos antecipadamente.

Convém notar que em [12], [13], [19], [21] e [22] a dependência entre os vários parâmetros de projeto com o desempenho (transiente e erro em regime) do observador não é simples, pois a implementação demanda, entre outras hipóteses, que diversas desigualdades matriciais lineares sejam satisfeitas.

Motivado pelos fatos prévios, neste artigo é proposto um

J. A. R. Vargas, Member, IEEE, K. H. M. Gularte and E. M. Hemerly, Member, IEEE

Adaptive Observer Design Based on Scaling and Neural Networks

O

IEEE LATIN AMERICA TRANSACTIONS, VOL. 11, NO. 4, JUNE 2013 989

Page 2: Adaptive observer design based on scaling and neural networks

observador adaptativo neural que não apresenta trepidação e possui hipóteses simples e de fácil verificação. Para tanto, objetivando desacoplar a dependência entre o comportamento transiente e erro em regime, foi introduzido um escalonamento das não-linearidades desconhecidas. A relevância do trabalho reside na formalização do fato de que o escalonamento tem um impacto positivo na aplicação do observador, pois pode desacoplar o desempenho transiente do estacionário, e facilita a aplicação, uma vez que fornece um grau de liberdade adicional para o ajuste do erro em regime e contorna a resolução de desigualdades matriciais lineares para ajuste de erro estacionário. Até onde os autores conhecem, não há na literatura uma prova de que o uso de escalonamento de não-linearidades em observação neural conduz a melhorias no desempenho e simplifica a aplicação em problemas práticos.

O trabalho é organizado conforme a seguir. Na Seção 2 são apresentadas as classes de redes neurais consideradas na parametrização de não-linearidades desconhecidas no sistema. Na Seção 3 o problema de observação adaptativa é formulado. Já na Seção 4 o observador proposto, hipóteses e erros associados são apresentados. Na Seção 5 são apresentados os principais resultados do artigo, a prova de estabilidade do observador e importância do escalonamento. Um exemplo de simulação é discutido na Seção 6. Finalmente, na Seção 7, as principais contribuições do trabalho são resumidas.

II. REDES NEURAIS ARTIFICIAIS

As redes neurais artificiais (RNAs) parametrizadas linearmente podem ser expressas matematicamente como

( ) ( )ζπζρ WWnn =, (1)

onde ρLnW

×ℜ∈ , ζζ Lℜ∈ e ρζπ LL ℜℜ : é um vetor de

funções básicas que pode ser considerado como uma função vetorial não-linear, cujos argumentos são pré-processados por uma função escalar ( )⋅s , e ρLn, , ζL são inteiros estritamente

positivos. As funções escalares ( )⋅s usualmente utilizadas

incluem sigmóide, tanh, gaussiana, Hardy’s, inverse Hardy’s multiquadratic [15]. Entretanto, neste artigo considera-se somente a classe de RNAs nas quais ( )⋅s é limitado, uma vez

que neste caso tem-se, ( ) 0πζπ ≤ (2)

sendo 0π uma constante estritamente positiva.

A classe de RNAs consideradas neste trabalho inclui radial basis function neural networks (RBFs), wavelet networks, high order neural nertworks (HONNs) [15], [27]-[28], e também outros aproximadores parametrizáveis linearmente como Takagi-Sugeno fuzzy systems [29]. Os resultados sobre aproximação universal em [15], [27]-[29] indicam que:

Propriedade 1: Para quaisquer constante 00 >ε e função

[ ]Ω∈ Cf existe uma matriz WW =∗ , onde ∗W é uma matriz

“ótima” e ρL é suficientemente grande, tal que,

( ) ( ) 0sup εζπζζ ≤− ∗Ω∈ Wf (3)

onde [ ]ΩC denota o espaço de funções contínuas definidas

em um domínio compacto nℜ⊂Ω , ⋅ denota o valor absoluto

se o argumento é um escalar. Se o argumento é uma função

vetorial em nℜ então ⋅ denota qualquer norma em nℜ .

Propriedade 2: A saída da RNA é contínua com respeito aos seus argumentos e satisfaz a condição de Lipschitz localmente para todo ( )ζ,W finito.

III. FORMULAÇÃO DO PROBLEMA

Considere a classe de sistemas não-lineares representada por

( ) ( )[ ]tuxhuxfBAxx ,,,, θ++= (4) Cxy = (5)

onde Xx ∈ é o vetor de estados de dimensão n, Uu ∈ é um vetor de entradas admissíveis de dimensão m, Yy ∈ é o vetor

de saídas de dimensão q, V∈θ é um vetor de parâmetros (variante no tempo e incerto) de dimensão p,

rUXf ℜ× : , [ ) rVUXh ℜ∞××× ,0: é um vetor de

distúrbios desconhecido, A , B e C são matrizes conhecidas de dimensões apropriadas. Com a finalidade de ter o problema bem colocado, assuma que VUX ,, são conjuntos compactos

e que f e h são Lipschitz localmente com respeito a x em

[ )∞××× ,0VUX , tal que (4) tem uma única solução

passando por ( )0x .

Assume-se o seguinte: Hipótese 1: Na região [ )∞××× ,0VUX

( ) 0,,, htuxh ≤θ (6)

onde ⋅ é a norma Euclideana e 0h é uma constante positiva.

Hipótese 2: Existe uma matriz simétrica positiva definida nnP ×ℜ∈ e uma matriz de ganho qnL ×ℜ∈ tais que

( ) ( ) 0<−=−+− QPLCALCAP T (7) ∗=⋅ CPBTδ (8)

onde 21F

K=−δ , rxrK ℜ∈ é uma matriz diagonal com

elementos diferentes de zero, Q é uma matriz positiva

definida e ∗C está no espaço gerado pelas linhas de C . Comentário 1: A Hipótese 1 impõe um limitante superior sobre a norma dos distúrbios. É usual na literatura. Comentário 2: A Hipótese 2 impõe que o par ( )CA, seja

detectável e a parte linear do sistema dissipativa (strictly positive real [18]). Convém ressaltar que a Hipótese 2 é menos restritiva que aquelas em [12], [13], [19], [21] e [22], onde se impõe que equações de Ricatti sejam satisfeitas.

Objetiva-se projetar um observador adaptativo contínuo para (4), consequentemente isento de trepidação, que não precise de uma fase de aprendizado off-line, limitante superior prévio para os distúrbios ou erros, e que seja de simples aplicação, no que se refere ao ajuste do desempenho transitório e erro em regime.

990 IEEE LATIN AMERICA TRANSACTIONS, VOL. 11, NO. 4, JUNE 2013

Page 3: Adaptive observer design based on scaling and neural networks

IV. OBSERVADOR ADAPTATIVO PROPOSTO

Inicialmente apresentamos o observador proposto e na sequência a equação de erro de observação. Para tanto, observe que o sistema (4) pode ser escrito usando escalonamento como,

( ) ( )[ ]tuxhuxKgBAxx ,,,, θ++= (9)

onde ( ) ( )uxfKuxg ,, 1−= .

Uma vez que o mapeamento ( )uxg , tem estrutura

desconhecida, o mesmo é substituído pela parametrização

neural ( )uxW ,π∗ mais um erro de aproximação ( )ux,ε . Mais

precisamente, (9) é rescrita como

( ) ( ) ( )[ ]tuxhuxKuxKWBAxx ,,,,, θεπ +++= ∗ (10)

onde rxLW ℜ∈∗ é uma matriz ideal ou “ótima”, requerida unicamente para fins analíticos, que pode ser definida como

( ) ( )

−=

∈∈Γ∈

∗ uxWuxgW

UuXxW

,ˆ,supminarg:,ˆ

π (11)

sendo W

WW ˆˆˆ α≤=Γ ,

Wα uma constante positiva, W a

estimação de ∗W e ( )ux,ε o erro de aproximação, que pode

ser definido como

( ) ( ) ( )uxWuxgux ,,:, πε ∗−= (12)

Hipótese 3: Na região UX × , o erro de aproximação é limitado, isto é,

( ) 0, εε ≤ux (13)

onde 00 ≥ε .

Comentário 3: O modelo (4) e a parametrização (10) são motivados para ressaltar, principalmente, que o observador proposto é também válido no caso de alterações intempestivas na dinâmica que podem ser consequência de falhas, desgaste dos equipamentos ou mudanças nas condições de operação. Caso não existam estas condições, o distúrbio dependerá exclusivamente de t.

A estrutura (10) sugere um observador tipo Luenberger da forma

( ) yLuxWBKxAx ~,ˆˆˆˆ −+= π (14)

onde x é o estado estimado, , yxCy −= ˆ~ é o erro de

estimação da saída. Comentário 4: Note em (14) que a matriz de escalonamento K proporciona um grau adicional de liberdade para o ajuste do transiente de x . Na Seção V será provado que a matriz K está relacionada diretamente com o erro residual de observação. Comentário 5: Objetivando-se estabelecer uma relação entre os pesos estimados e o erro de observação, a lei de

aprendizado será definida como ( )xCuxW ~,,ˆˆ ∗= ρ,

onde xxx −= ˆ~ é o erro de observação. Embora o erro de estado não esteja disponível para medições, a realimentação

x~C∗ pode ser determinada, conforme mostrado a seguir, em função de y~ , que está disponível.

Comentário 6: Note que existe uma matriz T tal que

TCC =∗ , pois ∗C é construído a partir de C. Logo, +∗= CCT , sendo +C a pseudo-inversa ([30]) de C , pois esta

matriz satisfaz a equação TCC =∗ , e consequentemente

y~Tx~TCx~C ==∗ ([13], [19]).

Com base em (10) e (14), obtém-se a equação do erro de observação

( )( ) ( )[ ]tuxhuxKBKWWKB

xLCAx

,,,,~ˆ~

~~

θεππ −−++−=

(15)

onde ( )ux,ˆˆ ππ = e ( ) ( )uxux ,,ˆ~ πππ −= .

V. LEI DE APRENDIZADO E ANÁLISE DE ESTABILIDADE

Nesta seção é apresentada a lei de adaptação para a matriz

de pesos W e estabelecidas as propriedades de estabilidade e convergência do observador proposto.

O seguinte fato é necessário para a análise de estabilidade.

Fato 1: Seja LrWW ×ℜ∈~,0 . Então, usando a definição

∗−= WWW ˆ~, tem-se

( )[ ]( ) ( ) 2

0

2

0

2

0

ˆ

~ˆ~2

FF

F

T

WWWW

WWWWtr

−−−+

=−∗

(16)

Na sequência é apresentado o teorema principal do artigo.

Teorema 5.1: Considere a classe de sistemas representados por (4)-(5), sujeito às hipóteses 1-3, e a lei de aprendizado

( )],ˆ~2~)ˆ([ˆ00 uxxCxCWWW T

W πγγ ∗∗ +−−= (17)

onde 0,0 0 >> γγ W e 0W é uma matriz constante.

Então, os erros Wx~

,~ são uniformemente limitados e o erro

residual de observação pertence ao conjunto Ω = x~ | || x~ || ≤ α , sendo

( ) (−+

++=

−−∗

22

22

2

0*

01*

20

10

min

FFF

FF

WWKW

KhKQ

C

γα

ελ

α

π

(18)

e ( ) ( ) ( )( )tutxtxt ,,ˆ~sup 0 παπ ≥= .

Prova: Considere a candidata a função de Lyapunov

( ) 2~~~~ 11 WWtrxPxV W

TT −− += γ (19)

Derivando-se (19) em relação ao tempo e usando-se (15) e (17), obtém-se

( ) ( )[ ]

( )[ ] ( )TTT

TT

TT

TT

xCKWtrWWWtrxCPBhxPBKx

PBKWxWPBKxxLCAPPLCAxV

πγε

ππ

ˆ~~2ˆ~~

~2~2

~~2ˆ~~2

~~

00∗∗

−−−−−

++−+−−=

(20)

RUIZ VARGAS et al.: ADAPTIVE OBSERVER DESIGN 991

Page 4: Adaptive observer design based on scaling and neural networks

Usando-se (7), (8) e a igualdade ( )=∗ TTT xCKWtr π~~

π~~ WPBKx T em (20), resulta

)]ˆ(~

[||~||

~2~2

~~2~~

00 WWWtrxCKhCxKCx

KWCxxQxV

T

TTTT

TTT

−−−−

−+−=

∗∗

∗∗

γδεδ

πδ

(21)

Adicionalmente, empregando-se (2), (13) e o fato 1, o lado direito de (21) pode ser limitado superiormente como

2)ˆ~(~

~.2~.2

~2~.~)(

2

0*2

0

2

0

min

FFF

F

FF

F

WWWWWxC

xChxCK

xCWKxCxC

QV

−−−+−

++

+−≤

∗∗

∗∗∗∗

γ

δεδ

δαλπ

(22)

Ordenado termos e considerando que 0εε < e 0hh < ,

(22) implica

−−−−

−−≤

∗∗∗

2.2.2

2~)(.~

2

0000

min

FF

FFF

WWhK

WKCxQxCV

γδδε

δαλ π

(23)

Com base em (23), conclui-se que 0<V sempre que

α>x~ , com α definido em (18), donde usando o método

direto de Lyapunov [31] x~ e, usando-se (17), W~ são

uniformemente limitados. Para mostrar que x~ converge ao conjunto residual Ω, note que o fato de ser Ω limitado implica que unicamente poderá ocorrer 0≥V para x~ finito e dentro

da região Ω, pois em ΩC temos 0<V e V tem que diminuir

até α=x~ , implicando que o erro residual de observação

converge para a região Ω.

Comentário 7: Com base em (18) pode ser concluído que o erro residual de observação pode ser ajustado através da matriz de escalonamento K, pois a mesma atenua os erros de aproximação e distúrbios. Isto constitui um resultado importante, pois facilita o ajuste arbitrário do erro em regime sem a necessidade de resolver qualquer desigualdade matricial linear adicional, uma vez que o último termo dentro do parêntesis do lado direito de (18) pode ser ajustado via 0γ ou

0W .

Comentário 8: É importante ressaltar que a escolha de valores diferentes de δ , e consequentemente de K, não implicam um novo cálculo das matrizes P e L em (7)-(8) para manter a

alocação desejada dos autovalores de Q, pois a matriz ∗C é escolhida livremente com base em C. Comentário 9: O observador proposto pode ser modificado para considerar a adaptação do parâmetro ( )tθ em (9). Neste

caso seria necessário proceder similarmente a [13]: definir

equação de erro que considere também ( ) ( )tt θθ −ˆ , onde ( )tθ é

uma estimação de ( )tθ e pode ser definida com base no

método direto de Lyapunov.

VI. SIMULAÇÕES

Objetivando-se mostrar a aplicação do observador proposto, considere o oscilador de Rössler [7]

( )321 xxx +−= (24a)

212 axxx += (24b)

( ) ( )txdcxxbx ,133 +−+= (24c)

Cxy = (25)

onde ,398.0=a ,2=b ,4=c

= 100

001C e ( )txd , é um

distúrbio que aparece a partir de t=20 definido como

( ) ( ) ( )[ ]ttxxxtxd 4cos2sin8, 23

221 ++++= (26)

Note que o sistema (24)-(25) está na forma (4)-(5) onde

−−=

caA00

01110

e

=

100

B . Também, o sistema satisfaz as

hipóteses 1 e 3, pois os estados são limitados. Para satisfazer a hipótese 2 de início calcula-se

=+

100001

C , escolhe-se [ ]201=∗C e computa-se

[ ]21== +∗CCT . Na sequência são encontrados valores de

L e P que satisfazem (7) e (8) e que alocam os autovalores de

Q em 34.6631, 3.7465 e 0.3984: ,32

1.01.13.18.2

−−−

=L

=

201021112

P .

As condições iniciais do sistema e observador foram,

( ) [ ] ,2120 Tx = ( ) 00ˆ =x . Os outros parâmetros usados na

implementação de (14) e (17) foram 1=Wγ , 20 =γ ,

[ ]1010010 =W ,

( ) ( ) ( ) ( ) ( ) ( )[ ]Txsxsxsxsxsxs 32

22

12

321 ˆˆˆˆˆˆ=π e ( ) ( )[ ]⋅−+=⋅ 5.0exp15s .

Nas Figs. 1-3 são apresentados os desempenhos obtidos na estimação dos estados do sistema (24)-(25), na presença do distúrbio (26) e para K=3. Observe que a estimação do estado

2x que não está disponível para medida é satisfatória.

( )tx1

( )tx1ˆ

992 IEEE LATIN AMERICA TRANSACTIONS, VOL. 11, NO. 4, JUNE 2013

Page 5: Adaptive observer design based on scaling and neural networks

Figura 1. Estado ( )tx1 e sua estimativa ( )tx1ˆ .

Figura 2. Estado ( )tx2 e sua estimativa ( )tx2ˆ .

Figura 3. Estado ( )tx3 e sua estimativa ( )tx3ˆ .

Nas Figs. 4-6 é mostrada a influência do escalonamento das não-linearidades desconhecidas sobre o erro em regime.

Nas simulações, Figs. 4-6, pode ser observado, conforme antecipado teoricamente, que o aumento de K corresponde a uma diminuição do erro em regime. Observe que o escalonamento atenua o distúrbio, conforme previsto por (18). Note também que o transiente inicial é praticamente o mesmo, para diferentes valores de K, o que um resultado importante, pois sugere que o escalonamento permite desacoplar o comportamento transiente do estacionário, o que facilita a aplicação, já que para ajustar o desempenho estacionário não seria necessário refazer o projeto da matriz Q (que implica a resolução de desigualdades matriciais lineares), com um impacto positivo sobre a carga computacional e consequentemente sobre a aplicação em tempo real.

Figura 4. Norma do erro de estado para K=3.

Figura 5. Norma do erro de estado para K=20.

Figura 6. Norma do erro de estado para K=80.

VII. CONCLUSÕES

Neste artigo foi proposto um observador adaptativo neural contínuo baseado na teoria de estabilidade de Lyapunov e escalonamento para uma classe de sistemas não-lineares incertos. Empregando-se o método direto de Lyapunov foi provado que os erros de estimação são limitados e o erro de observação converge para um conjunto residual em torno de zero, cujo tamanho está relacionado diretamente com uma matriz de escalonamento K. As principais particularidades do observador são: 1) não apresenta trepidação, 2) não requer uma fase off-line prévia, 3) permite o ajuste do transitório e erro estacionário em forma independente, e 4) não precisa da

( )tx3

( )tx3ˆ

( )tx2

( )tx2ˆ

( )tx~

( )tx~

( )tx~

RUIZ VARGAS et al.: ADAPTIVE OBSERVER DESIGN 993

Page 6: Adaptive observer design based on scaling and neural networks

resolução de desigualdades matriciais lineares para ajuste do erro de observação residual. Para verificar a aplicabilidade e desempenho do observador proposto foi considerada a estimação dos estados de um oscilador de Rössler.

REFERENCIAS [1] S. Huang and K. K. Tan, “Fault Detection and Diagnosis Based on

Modeling and Estimation Methods”, IEEE Transactions on Neural Networks, vol. 20, no. 5, pp. 872-881, 2009.

[2] J. Qiu, M. Ren, Y. Niu, Y. Zhao and Y. Guo, “Fault Estimation for Nonlinear Dynamic Systems”, Circuits, Systems, and Signal Processing, vol. 31, no. 2, pp. 555-564, 2012.

[3] C.S Liu, , S.J. Zhang and , S.S. Hu, “ Adaptive neural-networks-based fault detection and diagnosis using unmeasured states”, vol. 2 , no. 12, pp. 1066-1076, 2008.

[4] C. Cao and N. Hovakimyan, “NoveL1 Neural Network Adaptive Control Architecture with Guaranteed Transient Performance”, IEEE Transactions on Neural Networks, vol. 18, no. 4, pp. 1160-1171, 2007.

[5] M. Montanari, Peresada, S. M., C. Rossi and A. Tilli. “Speed Sensorless Control of Induction Motors Based on a Reduced-Order Adaptive Observer”, IEEE Transactions on Control Systems Technology, vol. 15, no. 6, pp. 1049-1064, 2007.

[6] S.C. Tong, Y. M. Li and H. G. Zhang, “Adaptive Neural Network Decentralized Backstepping Output-Feedback Control of Nonlinear Large-Scale Systms with Time Delays”, IEEE Transactions on Neural Networks, vol. 22, no.74, pp. 10731086, 2011.

[7] Dimassi and A. Loría, “Adaptive Unknown-Input Observers-Based Synchronization of Chaotic Systems for Telecommunication. IEEE Transactions on Circuits and Systems I: Regular Papers, vol. 58, no. 4, pp. 800-812, 2011.

[8] X. Liang, J. Zhang and X. Xia.” Adaptive Synchronization for Generalized Lorenz Systems”. IEEE Transactions on Automatic Control, vol. 53, no. 7, pp. 1740-1746, 2008.

[9] Y. Liu and W.K.S. Tang, “Cryptanalysis of Chaotic Masking Secure Communication Systems Using an Adaptive Observer”, IEEE Transactions on Circuits and Systems II: Express Briefs, vol. 55, no. 11, pp. 1183-1187, 2008.

[10] F. Abdollahi, H. A. Talebi, and R. V. Patell, “A Stable Neural Network-Based Observer with Application to Flexible-Joint Manipulators, IEEE Transactions on Neural Networks, vol. 17, no. 1, pp. 118–129. 2006.

[11] D. Paesa, S. Llorente, C. Sagüés and O. Aldana, “Adaptive Observers Applied to Pan Temperature Control of Induction Hobs”, IEEE Transactions on Industry Applications, vol. 45, no. 3, pp. 1116-1125, 2009.

[12] J. Resendiz, W. Yu and L. Fridman, “Two-Stage Neural Observer for Mechanical Systems. IEEE Transactions On Circuits and Systems- II: Express Briefs, vol. 55, no. 10, pp.1076-1080, 2008.

[13] J.A.R Vargas and E.M. Hemerly, “Observação Adaptativa Neural com Convergência Assintótica na Presença de Parâmetros Variantes no Tempo e Distúrbios. Revista Controle & Automação, vol. 19, pp. 18-29. 2008.

[14] T. Poznyak, A. Garcia, I. Chairez, M. Gómez and A. Poznyak, “Application of the Differential Neural Network Observer to the Kinetic Parameters Identification of the Anthracene Degradation in Contaminated Model Soil”, Journal of Hazardous Materials, vol. 146, pp. 661-667, 2007

[15] S. S. Ge, C. C. Hang, T. H. Lee and T. Zhang, Stable adaptive neural network control. Kluwer Academic Publishers, Norwell, Massachusetts, USA, 2002.

[16] M. Krstić, I. Kanellakopoulos and P. Kokotović, Nonolinear and Adaptive Control Design, John Wiley & Sons, Inc., New York, USA, 1995.

[17] R. Marino and P. Tomei, Nonlinear Control Design, Nonlinear Control Design: Geometric, Adaptive and Robust. Prentice Hall International, UK,1995.

[18] P.A. Ioannou and J. Sun, Robust Adaptive Control. Prentice Hall Inc., Upper Saddle River, New Jersey, USA. 1996.

[19] V.Stepanyan and N. Hovakimyan. Robust Adaptive Observer Design for Uncertain Systems With Bounded Disturbances. IEEE Transactions on Neural Networks, vol. 18, no. 5, pp. 1392 – 1403, 2007.

[20] J. Y. Choi and J. A. Farrell, Adaptive Observer Backstepping Control Using Neural Networks. IEEE Transactions on Neural Networks, vol. 12, no. 5, pp. 1103-1112, 2001.

[21] I. Chairez, Wavelet Differential Neural Network Observer. IEEE Transactions on Neural Networks, vol. 20, no. 9, pp. 1439-1449, 2009.

[22] I. Chairez, A. Poznyak and T. Poznyak, Stable Weights Dynamics for a Class of Differential Neural Network Observer, IET Control Theory & Applications, vol. 3, no. 10, pp. 1437-1447, 2009.

[23] M. A. González-Olvera and Y. Tang, Black-Box Identification of a Class of Nonlinear Systems by a Recurrent Neurofuzzy Network. IEEE Transactions on Neural Network, vol. 21, no. 4, pp. 672-679, 2010.

[24] J. H. Kim, C. H. Hyun, E. Kim and M. Park. Adaptive Synchronization of Uncertain Chaotic Systems Based on T–S Fuzzy Model, IEEE Transactions on Fuzzy Systems, vol. 15, no. 3, pp. 359-369, 2007.

[25] Y.G. Leu, W. Y. Wang and T.T. Lee. Adaptive Fuzzy-Neural Control for Nonaffine Nonlinear Systems, IEEE Transactions on Neural Networks, vol. 16, no. 4, pp. 853-861, 2005.

[26] H. K. Khalil, Nonlinear Systems, Second Edition, Prentice Hall Inc., Upper Saddle River, New Jersey, USA, 1996.

[27] E.B. Kosmatopoulos, M.M.Polycarpou, M.A. Christodoulou and P.A. Ioannou. High-Order NeuralNnetwork Structures for Identification of Dynamical Systems, IEEE Trans. Neural Networks, vol. 6, no. 2, pp. 442-431, 1995.

[28] Q. Zhang and A. Benveniste. Wavelet Networks, IEEE Trans. Neural Networks, vol. 3, no. 6, pp. 889-898, 1992.

[29] L. X. Wang. Adaptive Fuzzy System and Control: Design and Stability Analysis, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, USA. 1994.

[30] B. Noble and J. W. Daniel. Applied Linear Algebra, Prentice-Hall, Inc., Englewood Cliffs, New Jersey. USA, 1977.

[31] J.J.E. Slotine and W. Li. Applied Nonlinear Control, Prentice-Hall, Inc., Englewood Cliffs, New Jersey. USA, 1991.

José A. R. Vargas is Professor of Control Systems in the Electrical Engineering Department, University of Brasília, DF-Brazil. He received the Dr.Sc. degree in electronics and computer engineering from Instituto Tecnológico de Aeronáutica, in 2003. His current research interests include on-line identification, state estimation and adaptive control.

Kevin H. M. Gularte received the Engineering degree in mechatronics engineering from University of Brasília, DF-Brazil, in 2013. His current research interests include on-line identification and state estimation using neural networks.

Elder M. Hemerly is Professor of Control Systems in the Electronics Division, Technological Institute of Aeronautics, SP-Brazil. He received the Ph.D. degree in electrical engineering from Imperial College, London, in 1989. His current research interests include robotics, system identification and adaptive control.

994 IEEE LATIN AMERICA TRANSACTIONS, VOL. 11, NO. 4, JUNE 2013