Universidade Estadual Paulista Campus de São José do Rio Preto Instituto de Biociências, Letras e Ciências Exatas Controlabilidade de Sistemas Não Lineares de Equações Diferenciais Ordinárias Alexandre da Silva Bairrada Orientador: Prof. Dr. Adalberto Spezamiglio Dissertação apresentada ao Instituto de Biociências, Le- tras e Ciências Exatas da Universidade Estadual Paulista, Câmpus São José do Rio Preto, como parte dos requisitos para a obtenção do t́ıtulo de Mestre em Matemática São José do Rio Preto Agosto - 2009 Alexandre da Silva Bairrada Sistemas de Equações Diferenciais Ordinárias Não Lineares de Entrada Única Dissertação apresentada para obtenção do t́ıtulo de Mestre em Matemática, área de Equações Diferenciais Ordinárias junto ao Programa de Pós-Graduação em Matemática do Instituto de Biociências, Letras e Ciências Exatas da Uni- versidade Estadual Paulista, ”Júlio de Mesquita Filho”, Campus São José do Rio Preto. BANCA EXAMINADORA Prof. Dr. Adalberto Spezamiglio UNESP - São José do Rio Preto - SP Orientador Profa. Dra. Rita de Cássia Pavani Lamas UNESP - São José do Rio Preto - SP Prof. Dr. Jair Silvério dos Santos USP - Ribeirão Preto - SP São José do Rio Preto, 7 de Agosto de 2009. Aos meus pais, Aparecida e Anibal, aos meus avós, Maria e Antônio e as minhas irmãs, Araceli e Adriana. dedico. Agradecimentos Agradeço a Deus, pela força e por guiar-me. À minha famı́lia pelo apoio incondicional, amor e confiança. Ao Prof. Dr. Adalberto Spezamiglio, obrigado por orientar-me, pelo cuidado e dedicação, pela franqueza e objetividade de suas palavras e tudo que me ensinou. Ao Prof. Dr. Jair Silvério dos Santos - Dept. de F́ısica e matemática da USP - Ribeirão Preto e a Profa. Dr. Rita de Cássia Pavani Lamas - Dept. de Matemática-Unesp-Ibilce, obrigado por terem aceitado o convite para participar da banca examinadora desse trabalho. Agradeço também ao Prof. Dr. Lúıs Antonio Fernandes de Oliveira e à Profa. Dra. Roseli Arbach Fernandes de Oliveira professores da Feis-Unesp-Ilha Solteira por me encaminharem ao mestrado, pelos seus ensinamentos, dedicação ao curso de Matemática, motivação, por tudo. A Regente Zuleica de Carvalho Moreira e aos amigos coralistas obrigado pela descontração que me proporcionaram com o Coral-Ibilce e todos os momentos ines- quećıveis. Aos amigos Rafael Alves, Helton Santana, Alina Carvalho, Wallance Pazin, Ka- rina Almeida, Ismael da Silva Pena, Tassia Ferreira Tártaro, Meire Ellen Gonzalles Martins de Souza, Marisa de Souza Costa, Ana Paula Tremura Galves, Juliana R. Theodoro de Lima, Rodiak Nicolai Figueroa López, Rafael Marcel Asmat Uceda, Ana Carolina Mardegan, Antoniana Gardinali, Renato Ferneda de Souza, Ana Paula Soficier, Lilian Afonso Candido, Ana Cláudia Festucci, Paulo Henrique Graciano, Manuella Aparecida Felix de Lima, Andresa Baldam Marchioli, Marcos Proença de 5 Almeida, Marcos Pavani de Carvalho, Grasiele Cristiane Jorge , Agnaldo José Fer- rari, Gilberto de Campos Fuzzari Jr., Elen Poliani da Silva Arlindo, Lucas Senna Gregório Fugisawa, Guilherme Messias sou grato pela paciência nos momentos de stress, pelo aux́ılio, companheirismo e acima de tudo, o apoio de cada um. Espero não ter esquecido ninguém, muitas pessoas foram importantes na conclusão desse trabalho. Enfim, a todos os meus amigos pois todos contribúıram de alguma forma para que eu chegasse até aqui. ”...você aprende que realmente pode suportar, que realmente é forte e que pode ir muito mais longe depois de pensar que não se pode mais e que realmente a vida tem valor e que você tem valor diante da vida!” ( Trecho de O Menestrel - William Shakespeare ) Resumo Neste trabalho estudamos a controlabilidade de sistemas de n equações dife- renciais ordinárias não lineares de entrada única, via mudança local de coordenadas e retroalimentação, que levam o sistema a um linear controlável. O elemento fun- damental é a existência de uma função de grau relativo n em relação ao sistema, conceito que envolve a Derivada de Lie de um campo de vetores, que se constitui numa condição necessária e suficiente para a controlabilidade. Palavras chave: controle; grau relativo n; derivada de Lie. Abstract In this work we study the controllability of systems of n nonlinear ordinary differential equations of single-input, by using local coordinate change and state feedback, which take the system to a controllable linear form. The main element is the existence of a function of relative degree n with respect to the system, a concept that involves the Lie Derivative of a vector field, and it is a necessary and sufficient condition to controllability. Key words: control; relative degree n; Lie Derivative. Sumário Introdução 10 1 Controlabilidade de Sistemas de Equações Diferenciais Lineares 12 1.1 Equivalência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2 Controlabilidade e Observabilidade . . . . . . . . . . . . . . . . . . . 15 1.3 Retroalimentação Linear . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 Linearização de Entrada e Sáıda 25 2.1 Linearização de Entrada e Sáıda. . . . . . . . . . . . . . . . . . . . . 26 2.2 Funções de Grau Relativo n. . . . . . . . . . . . . . . . . . . . . . . . 27 3 Linearização do Estado de Entrada 35 3.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.2 Condições Necessárias à Solvabilidade do PLEE . . . . . . . . . . . . 41 3.3 O Resultado Principal . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.3.1 Aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Bibliografia 53 9 Introdução Nos últimos anos, a disponibilidade de poderosos microprocessadores de baixo custo tem dinamizado grandes avanços na teoria e aplicações de controle não-linear. Em termos de teoria, grandes avanços têm sido feitos nas áreas de linearização e retroalimentação, controle não-linear e adaptações de técnicas. Em termos de aplicações, muitas práticas de sistemas de controle não-linear foram desenvolvidas para controle de voo de aeronaves, controle de automóveis, robótica avançada e sistemas espaciais. Como resultado, o controle não-linear está ocupando um lugar cada vez mais importante e necessário na Engenharia, como se pode ver em [4], [5]. Neste trabalho partimos do controle em sistemas lineares dando ênfase a re- sultados importantes visando uma extensão para caso não linear. Nossa princi- pal condição é a existência de uma função de grau relativo n num certo ponto de equiĺıbrio do sistema, utilizada na obtenção de uma transformação local de coorde- nadas para levar o sistema original à forma simples y(n) = v. Este trabalho pode ser divido em duas partes, o Caṕıtulo 1 e os Caṕıtulos 2 e 3. No Caṕıtulo 1, apresentamos resultados referentes a equivalência entre uma equação diferencial ordinária de ordem n e um sistema linear, que nos levam às condições de observabilidade e controlabilidade linear. Maiores detalhes desses re- sultados estão em [1] ou [3]. O caṕıtulo 2 fala da equivalência entre um sistema não linear de n equações e uma equação diferencial ordinária de ordem n. Falamos do problema de linearização, retroalimentação, de funções de grau relativo n e a ligação dessas funções com a solução do problema, além de fornecer condições suficientes para uma equivalência 10 11 entre um sistema não linear e uma equação na forma simples y(n) = v (nosso obje- tivo) como resultado principal. Aqui seguimos a referência [2]. No Caṕıtulo 3 falamos da linearização do estado de entrada, retroalimentação, usando colchete de Lie e Identidade de Jacobi, que servem como base para nosso principal resultado, que dá condições necessárias à existência de uma transformação que leva o sistema original à equação y(n) = v. Uma aplicação f́ısica, em robótica, é apresentada seguindo [6] e [7]. Caṕıtulo 1 Controlabilidade de Sistemas de Equações Diferenciais Lineares Neste caṕıtulo vamos considerar alguns conceitos e resultados sobre controla- bilidade de sistemas de equações diferenciais ordinárias lineares que serão úteis no trabalho. Demonstrações e maiores detalhes podem ser conferidos em [1] e [3]. 1.1 Equivalência Vamos tratar aqui da equivalência entre uma equação diferencial ordinária linear e um sistema linear. Considere a seguinte equação diferencial ordinária linear não homogênea de ordem n, y(n) + k1y (n−1) + ... + kny = u(t), (1.1) com ki ∈ R, i = 1, 2, 3, ..., n. Ela é equivalente, via definição padrão, ao sistema de n equações diferenciais de primeira ordem: z′ = Pz + qu(t), (1.2) onde z = [ y y′ . . . y(n−1) ]T , 13 P = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... 0 0 0 . . . 1 −kn −kn−1 −kn−2 . . . −k1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ , e q = [ 0 0 . . . 1 ]T . Mais detalhes sobre o sistema companheiro em [3] página 7. Nosso interesse é na rećıproca. Quando um sistema linear com coeficientes cons- tantes, x′ = Ax + bu(t) (1.3) onde A é uma matriz n×n e b é n×1, pode ser levado a (1.2) por uma transformação linear não-singular T : Rn → Rn tal que x �→ Tx = z? Se z = Tx, então z′ = Tx′ = T (Ax + bu(t)) = TAx + Tbu(t) = TAT−1(Tx) + (Tb)u(t). Logo devemos ter P = TAT−1, isto é, P ∼ A e Tb = q. Definição 1.1.1 O sistema x′ = Ax + bu(t) é linearmente equivalente ao sistema z′ = Pz + qu(t) se existe uma matriz T não-singular tal que TAT−1 = P e Tb = q (1.4) Definição 1.1.2 Um vetor x ∈ Rn é um vetor ćıclico para uma matriz quadrada A de ordem n se os vetores x,Ax, A2x, . . . , An−1x são linearmente independentes. Como exemplo, o vetor q = [ 0 0 . . . 1 ]T é ćıclico para a matriz P dada acima. 14 Se existe T não singular tal que TAT−1 = P e Tb = q, então TAT−1q = TAb e TAkb = TAkT−1q = (TAT−1)kq = P kq, para todo k ≥ 0 inteiro. A não singulari- dade de T implica que, sendo q ćıclico para P, então b é ćıclico para A. De fato, n = rank [ q Pq . . . P n−1q ] = rank [ Tb TAb . . . TAn−1b ] = rank [ b Ab . . . An−1b ] . Vemos que uma condição necessária para a existência da transformação T é que rank [ b Ab . . . An−1b ] = n Veremos que essa condição é também suficiente. Note que, para z = Tx onde z = (z1, z2, . . . , zn), temos z1 = (primeira linha de T )x. Denotemos a primeira linha de T por τ . Assim, desde que Tb = q = [ 0 0 . . . 1 ]T e TAkb = P kq, temos τb = 0, τAb = 0,. . . , τAn−2b = 0, τAn−1b = 1. Podemos escrever isso como τ [ b Ab . . . An−1b ] = [ 0 . . . 0 1 ] = qT . Se rank [ b Ab . . . An−1b ] = n, há uma única solução da equação acima para τ . Seja agora z2 = (segunda linha de T )x = z′1 = τx′ = τ(Ax + bu(t)) = τAx + τbu(t) = τAx. Logo z2 = τAx. Prosseguindo com as outras coordenadas, obtém-se zk = τAk−1x, k = 1, 2, . . . , n. 15 Assim, z = Tx é tal que T = ⎡ ⎢⎢⎢⎢⎢⎢⎣ τ τA ... τAn−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ . Obtemos assim o seguinte resultado: Teorema 1.1.1 O sistema x′ = Ax + bu(t) com x ∈ Rn pode ser transformado no sistema companheiro z′ = Pz + qu(t), por uma transformação linear não singular z = Tx se, e somente se, rank [ b Ab . . . An−1b ] = n. Neste caso, T é definida univocamente por T = ⎡ ⎢⎢⎢⎢⎢⎢⎣ τ τA ... τAn−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦, onde τ é a única solução de τ [ b Ab . . . An−1b ] = [ 0 . . . 0 1 ] = qT . 1.2 Controlabilidade e Observabilidade Definição 1.2.1 O sistema linear (1.3) é completamente controlável se dados quais- quer x0 , xf ∈ Rn, existe tf > 0 e uma função controle u(t) definida em 0 ≤ t ≤ tf , tais que a solução de (1.3), com condição inicial x(0) = x0, satisfaz x(tf ) = xf . A solução para (1.3) com x(0) = x0 é dada por x(t) = etA[x0 + ∫ t 0 e−sAbu(s)ds]. O sistema (1.3) é completamente controlável se para quaisquer x0, xf dados, existe tf e uma função u localmente integrável em 0 ≤ t ≤ tf tais que 16 x(tf ) = etf A[x0 + ∫ tf 0 e−sAbu(s)ds] = xf . Explorando a expressão acima, mostra-se que a relação entre equivalência, já dis- cutida, e controlabilidade, está no fato de que o sistema linear (1.3) é completamente controlável se, e somente se, rank [ b Ab . . . An−1b ] = n, ou seja, ele é equivalente a uma equação do tipo (1.1) com y = z1 = τx. Perguntamos agora se dado c ∈ Rn, o sistema (1.3) é equivalente a uma equação do tipo (1.1) com y = cT x. Vamos escrever o sistema (1.3) com sáıda especificada y = cT x assim: ⎧⎨ ⎩ x′ = Ax + bu(t) (a) y = cT x (b) (1.5) onde c é um vetor constante e y(t) denotando sua função de sáıda. Especificamente, quando cT é a primeira linha de uma transformação T do sis- tema (1.3) para (1.2), onde y é a variável dependente em (1.1)? Se T existe, devemos ter T = ⎡ ⎢⎢⎢⎢⎢⎢⎣ τ τA ... τAn−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ , onde τ = cT e Tb = q. (1.6) Então, rank(T ) = rank ⎡ ⎢⎢⎢⎢⎢⎢⎣ cT cT A ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ = n (1.7) 17 Além disso, como Tb = q, ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ cT cT A ... ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ b = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ bT bT AT ... ... bT (An−1)T ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ c (1.8) Então existe uma transformação T não singular transformando (1.3) para a forma companheira em (1.2) com z1 = cT x se, e somente se, as condições (1.7) e (1.8) estão satisfeitas. Neste caso, T é univocamente determinada, e é a matriz em (1.6). Ob- servemos que os vetores c ∈ Rn são as soluções de um sistema linear não homogêneo dado pela última equação em (1.8). Definição 1.2.2 O sistema (1.3) juntamente com a sáıda y = cT x é completamente observável se para qualquer x0 = x(0), existe um tempo tf > 0 finito tal que o conhecimento da entrada u e da sáıda y em [0, tf ] são suficientes para determinar x0 de maneira única. Pode-se mostrar (ver [1],[3]) que o sistema (1.3) é completamente observável se, e somente se, a condição (1.7) está satisfeita. Por isso, a condição (1.7) é conhecida como a condição de observabilidade do posto e ⎡ ⎢⎢⎢⎢⎢⎢⎣ cT cT A ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ é chamada matriz observabilidade para o sistema (1.3), com a sáıda especificada y = cT x. Com as informações anteriores, compomos o teorema: 18 Teorema 1.2.1 O Sistema (1.3) pode ser transformado por uma transformação não singular z = Tx para a forma companheira em (1.2) se, e somente se, rank [ b Ab . . . An−1b ] = n ( (1.3) é completamente controlável). Quando for o caso, T é única e T = ⎡ ⎢⎢⎢⎢⎢⎢⎣ τ τA ... τAn−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ (1.9) onde τ é a única solução de τ [ b Ab . . . An−1b ] = [ 0 . . . 0 1 ] = qT . Existe uma transformação linear não-singular z = Tx que leva (1.3) no sistema companheiro (1.2) com z1 = y = cT x se, e somente se rank ⎡ ⎢⎢⎢⎢⎢⎢⎣ cT cT A ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ = n, ( (1.3) é completamente observável) e ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ bT bT AT ... ... bT (An−1)T ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ c = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ . Quando for o caso, T é única e será dada pela matriz em (1.9) com τ = cT . 19 1.3 Retroalimentação Linear No sistema (1.3), uma retroalimentação linear é da forma u = Kx onde K é uma matriz linha 1 × n. O correspondente sistema de laço fechado fica x′ = (A + bK)x. Consideremos a forma companheira à (1.3), z′ = Pz + qu(t), onde P = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... 0 0 0 . . . 1 −kn −kn−1 −kn−2 . . . −k1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ e q = [ 0 0 . . . 1 ]T . Tomando K = [ −αn −αn−1 −αn−2 . . . −α1 ] e uma retroalimentação u = Kz + v(t), o sistema anterior fica na forma z′ = (P + qK)z + qv , z′ = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... 0 0 0 . . . 1 −(kn + αn) −(kn−1 + αn−1) −(kn−2 + αn−2) . . . −(k1 + α1) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ z+ ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ v Se escolhermos αj = −kj, j = 1, 2, . . . , n, o sistema ficará z′ = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... 0 0 0 . . . 1 0 0 0 . . . 0 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ z + ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ v e lembrando que z = [ y y′ . . . y(n−1) ]T , ele é equivalente à equação y(n) = v. 20 Veremos no próximo caṕıtulo como isso pode ser obtido no caso de sistemas não lineares. Exemplo 1.3.1 Considere o sistema, ⎧⎨ ⎩ x′ 1 = − 2x1 + 2x2 + u(t) x′ 2 = x1 − x2 . Pela forma (1.3), temos A = ⎡ ⎣ −2 2 1 −1 ⎤ ⎦, b = ⎡ ⎣ 1 0 ⎤ ⎦, e rank [ b Ab ] = rank ⎡ ⎣ 1 −2 0 1 ⎤ ⎦ = 2. Logo, esse sistema é completamente controlável. Para obtenção da E.D.O equivalente ao sistema companheiro devemos encontrar τ de forma que T transforme o sistema dado na forma companheira. Assim τ deve satisfazer τ ⎡ ⎣ 1 −2 0 1 ⎤ ⎦ = [ 0 1 ] . Escrevendo τ = [ τ1 τ2 ] , temos ⎧⎨ ⎩ τ1 + 0 = 0 −2τ1 + τ2 = 1 Dáı, obtemos τ = [ 0 1 ] e τA = [ 1 −1 ] . 21 Então T = ⎡ ⎣ 0 1 1 −1 ⎤ ⎦ e T−1 = ⎡ ⎣ 1 1 1 0 ⎤ ⎦. Como P = TAT−1, temos P = ⎡ ⎣ 0 1 0 −3 ⎤ ⎦. Portanto, o sistema companheiro ⎡ ⎣ z′1 z′2 ⎤ ⎦ = ⎡ ⎣ 0 1 0 −3 ⎤ ⎦ · ⎡ ⎣ z1 z2 ⎤ ⎦ + ⎡ ⎣ 0 1 ⎤ ⎦ · u(t) Isto é, ⎧⎨ ⎩ z′ 1 = z2 z′2 = − 3z2 + u(t) Além disso, como a (primeira linha de T )x = τx = y e z = Tx, temos que z1 = y e, pelo sistema acima, z2 = z′1 = y′ que implica z′2 = y′′ e y′′ = −3y′ + u(t) . Portanto, o sistema companheiro é equivalente a seguinte equação diferencial y′′ + 3y′ = u(t) . Exemplo 1.3.2 Considere o sistema, ⎧⎨ ⎩ x′ 1 = − 2x1 + 2x2 + u(t) x′ 2 = x1 − x2 + u(t) Pela forma (1.3), temos A = ⎡ ⎣ −2 2 1 −1 ⎤ ⎦, b = ⎡ ⎣ 1 1 ⎤ ⎦ e 22 rank [ b Ab ] = rank ⎡ ⎣ 1 0 1 0 ⎤ ⎦ = 1 . Logo, esse sistema não é completamente controlável. Exemplo 1.3.3 Considere o sistema, ⎧⎨ ⎩ x′ 1 = − 2x1 + x2 + u(t) x′ 2 = x1 − x2 . Pela forma (1.3), temos A = ⎡ ⎣ −2 1 1 −1 ⎤ ⎦, b = ⎡ ⎣ 1 0 ⎤ ⎦, e rank [ b Ab ] = rank ⎡ ⎣ 1 −2 0 1 ⎤ ⎦ = 2. Logo, esse sistema é completamente controlável. Agora devemos escolher uma sáıda y = cT x de forma conveniente para que T transforme o sistema para a forma companheira (de acordo com o teorema 1.2.1). Conforme (1.8), c deve satisfazer ⎡ ⎣ bT bT AT ⎤ ⎦ c = ⎡ ⎣ 0 1 ⎤ ⎦ Escrevendo c = ⎡ ⎣ c1 c2 ⎤ ⎦, temos ⎡ ⎣ 1 0 −2 1 ⎤ ⎦ · ⎡ ⎣ c1 c2 ⎤ ⎦ = ⎡ ⎣ 0 1 ⎤ ⎦ . 23 Logo, ⎧⎨ ⎩ c1 = 0 c2 = 1 Ou seja, c = ⎡ ⎣ 0 1 ⎤ ⎦ e cT = [ 0 1 ] . Portanto, y = [ 0 1 ] · ⎡ ⎣ x1 x2 ⎤ ⎦ é a sáıda conveniente para que o sistema dado seja transformado no sistema companheiro. De fato, T = ⎡ ⎣ 0 1 1 −1 ⎤ ⎦ e T−1 = ⎡ ⎣ 1 1 1 0 ⎤ ⎦ . Como P = TAT−1, temos P = ⎡ ⎣ 0 1 −1 −3 ⎤ ⎦. Com isso, temos o sistema companheiro ⎡ ⎣ z′ 1 z′2 ⎤ ⎦ = ⎡ ⎣ 0 1 −1 −3 ⎤ ⎦ · ⎡ ⎣ z1 z2 ⎤ ⎦ + ⎡ ⎣ 0 1 ⎤ ⎦ · u(t) , isto é, ⎧⎨ ⎩ z′1 = z2 z′2 = −z1 − 3z2 + u(t) . Além disso, como a (primeira linha de T )x = cT x = y e z = Tx, temos que z1 = y e, pelo sistema acima, temos z2 = z′1 = y′. Logo, z′2 = y′′ e y′′ = −y − 3y′ + u(t) . 24 Conclúımos que o sistema companheiro é equivalente a seguinte equação diferen- cial y′′ + 3y′ + y = u(t) . Exemplo 1.3.4 Vamos considerar o exemplo 1.3.1. O sistema em questão é equiva- lente a forma companheira z′ = ⎡ ⎣ 0 1 0 −3 ⎤ ⎦ z + ⎡ ⎣ 0 1 ⎤ ⎦ · u(t) onde ⎡ ⎣ 0 1 0 −3 ⎤ ⎦ = P e ⎡ ⎣ 0 1 ⎤ ⎦ = q. Escolhendo α1 = −3 e α2 = 0, temos que K = [ −α2 −α1 ] = [ 0 3 ] e, com a retroalimentação u = Kz + v(t), o sistema fica z′ = (P + qK)z + qv, isto é, z′ = ⎡ ⎣ 0 1 0 0 ⎤ ⎦ z + ⎡ ⎣ 0 1 ⎤ ⎦ v = ⎡ ⎣ z2 v ⎤ ⎦ . Como z = [ y y′ ]T , esse sistema é equivalente à equação y′′ = v. Caṕıtulo 2 Linearização de Entrada e Sáıda Vamos inicialmente destacar um cálculo essencial feito na prova do Teorema 1.2.1, útil em sua generalização. Considere o produto de matrizes abaixo, ⎡ ⎢⎢⎢⎢⎢⎢⎣ cT cT A ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ [ b Ab . . . An−1b ] = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 . . . . . . 0 cT An−1b 0 ∗ ∗ ... ∗ ... 0 ∗ ... cT An−1b ∗ . . . . . . ∗ ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ (2.1) Essa igualdade é verdadeira quando A, b e c satisfazem cT Akb = 0 para 0 ≤ k ≤ n − 2. Se cT An−1b = 0 as matrizes no lado esquerdo são não singulares. No caṕıtulo 1 vimos, reciprocamente, que se uma das matrizes no lado esquerdo for não singular (para algum b, respectivamente c) então a outra também será (para algum c, respectivamente b ). Assim, a não singularidade da matriz do lado direito implica nas condições de controlabilidade e observabilidade do sistema linear (1.3). Se substituirmos Ax e o vetor b em (1.3), respectivamente, pelo campo vetorial f(x) e pelo campo vetorial g(x), perguntamos quando o sistema não linear de en- trada única x′ = f(x)+g(x)u(t) pode ser transformado para uma equação na forma especial y(n) = v(t) por uma mudança local de coordenadas e um estado de retroali- mentação? Se tal transformação e retroalimentação são posśıveis, podemos explorar as propriedades da teoria do controle discutidas no Caṕıtulo 1 para essa forma es- 26 pecial. Nesse caso, um sistema não linear pode ser controlado usando métodos de controle linear. Exemplo 2.0.5 Suponha x ∈ R3 e u(t) ∈ R. O sistema x′ = f(x) + g(x)u(t) = ⎡ ⎢⎢⎢⎣ e−x2 x1 1 2 x2 1 ⎤ ⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎣ 1 0 0 ⎤ ⎥⎥⎥⎦u(t) é equivalente a alguma equação do tipo y(3) = v(t)? Que equivalência seria essa? Como determinar se uma equivalência é posśıvel? 2.1 Linearização de Entrada e Sáıda. Considere a versão de entrada e sáıda únicas não linear para (1.3) descrita por x′ = f(x) + g(x)u(t) (2.2) onde f e g são campos vetoriais suaves definidos numa região aberta G no Rn. O termo suave significa que as componentes de f e g são continuamente diferenciáveis, que será exigido por muitas vezes em nossas discussões. À equação (2.2) podemos acrescentar uma sáıda conhecida y = h(x), (2.3) onde h é uma função suave de valores reais definida em G. Procuramos condições necessárias e suficientes sobre o sistema (2.2) para que seja equivalente a um sistema linear companheiro. Dessa maneira, uma equivalência, se posśıvel, geralmente requer retroalimentação aliada a uma mudança de coordenadas. A condição que permite uma transformação de coordenada diretamente à forma companheira no caso linear, geralmente não pode se esperada aqui. Como no caso linear podemos tentar usar uma sáıda conhecida h para ajudar a definir uma mudança local de coordenadas, z = T (x), e um estado de retroali- mentação, u = α(x) + β(x)v (com β(x) = 0), numa vizinhança U de x0 em (2.2), 27 para produzir uma equação de entrada e sáıda linear y(j) = v (2.4) Em (2.4), v é chamada de nova entrada de referência. Gostaŕıamos de obter j = n para obter o sistema dinâmico n-dimensional com- pleto. Este é o problema de linearização de entrada e sáıda (PLES). A ideia é que a retroalimentação u simplifique o sistema. O termo α(x) pode ser usado para o cancelamento de não linearidades e o termo β(x)v pode definir v para controlar a dinâmica da maneira desejada. Exemplo 2.1.1 Considere o sistema x′ 1 = senx2 x′ 2 = −x2 1 + u(t) É fácil linearizar o comportamento entrada-sáıda. Se y = x2 e u = x2 1 + v, temos a relação de entrada e sáıda linear y′ = v. Essa relação tornar fácil a descoberta da sáıda y(t) = x2(t) especificada pelo controle v, mas o controle v deixa x1 inobservável, ficando a dinâmica bidimensional original obscura. A presença de tal inobservabilidade dinâmica introduz a questão de estabilidade interna para essa dinâmica. A variável x1 pode não continuar a manter o bom comportamento quando usada a estratégia de controle y′ = v. Por exemplo, suponha que nós queremos assegurar a sáıda y = x2 pela constante x2 = c. Então a solução x1 deve ser x1(t) = x1(0) + tsenc e, portanto, |x1(t)| fica não limitado quando t → ∞. 2.2 Funções de Grau Relativo n. A próxima definição recorda o comportamento de sáıdas especiais que produzem observabilidade e uma forma companheira no caso linear no caṕıtulo anterior. A definição é motivada pelo formato dos termos que surgem quando a função é diferen- ciada repetidamente ao longo do sistema (2.2). 28 Definição 2.2.1 A derivada de Lie de uma função de valores reais h ao longo de um campo vetorial g é a função de valores reais Lgh definida por Lgh ≡ dh(x) ·g(x), onde dh(x) é o gradiente linha de h em x. Para derivadas iteradas desse tipo, escrevemos L0 gh = h e Lk gh = Lg(Lk−1 g ). Definição 2.2.2 A função h tem grau relativo j = 1 em relação a (2.2) em x0 se LgL0 fh(x0) = 0, isto é, Lgh(x0) = 0, e tem grau relativo j > 1 em relação a (2.2) em x0 se: (i) LgLk fh(x) = 0 para todo x numa vizinhança de x0, para todo 0 ≤ k < j − 1, e (ii) LgLj−1 f h(x0) = 0 . Existem pontos x0 onde, eventualmente, não é definido grau relativo. Por con- tinuidade das condições (i) e (ii), podemos falar da função h tendo grau relativo j num conjunto aberto U contendo x0. Exemplo 2.2.1 Considere o sistema x′ 1 = senx2 x′ 2 = −x2 1 + u(t) onde x = [ x1 x2 ]T ∈ R2. Temos f(x) = [ senx2 −x2 1 ]T e g(x) = [ 0 1 ]T . 1o Caso: Se y = h(x) = x2; dh(x) = [ 0 1 ] e, portanto, Lgh = dh(x) · g(x) =[ 0 1 ] · [ 0 1 ]T = 1, isto é, y = h(x) tem grau relativo 1 para qualquer x. 2o Caso: Se escolhêssemos a função y = h(x) = x1, dh(x) = [ 1 0 ] , 29 • Lgh = dh(x) · g(x) = [ 1 0 ] · [ 0 1 ]T = 0 para qualquer x; • LgLfh(x) = Lg(dh(x)·f(x)) = Lg ([ 1 0 ] · [ senx2 −x2 1 ]T ) = Lg(senx2) = d(senx2) · g(x) = [ 0 cosx2 ] · [ 0 1 ]T = cosx2. Portanto, essa função tem grau relativo 2 no ponto x0 = 0, pois LgLfh(x0) = LgLfh(0) = cos(0) = 1 = 0. Exemplo 2.2.2 Suponha x ∈ R3 e u ∈ R. Considere o sistema x′ = f(x) + g(x)u = ⎡ ⎢⎢⎢⎣ e−x2 x1 1 2 x2 1 ⎤ ⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎣ 1 0 0 ⎤ ⎥⎥⎥⎦u(t) Logo, f(x) = [ e−x2 x1 1 2 x2 1 ]T e g(x) = [ 1 0 0 ]T . 1o Caso: Se y = h(x) = x1, dh(x) = [ 1 0 0 ] e temos • Lgh = dh(x) · g(x) = [ 1 0 0 ] · [ 1 0 0 ]T = 1. Portanto o grau relativo de y = h(x) = x1 é 1 para qualquer x ∈ R3. 2o Caso: Se y = h(x) = x2, então dh(x) = [ 0 1 0 ] e • Lgh = dh(x) · g(x) = [ 0 1 0 ] · [ 1 0 0 ]T = 0 para qualquer x ∈ R3; • LgLfh(x) = Lg(dh(x) · f(x)) = Lg ([ 0 1 0 ] · [ e−x2 x1 1 2 x2 1 ]T ) = Lg(x1) = d(x1) · g(x) = [ 1 0 0 ] · [ 1 0 0 ]T = 1. Portanto o grau relativo de h(x) = x2 é 2 para qualquer x ∈ R3. 30 3o Caso: Se y = h(x) = x3, então dh(x) = [ 0 0 1 ] e • Lgh = dh(x) · g(x) = [ 0 0 1 ] · [ 1 0 0 ]T = 0 para qualquer x ∈ R3; • LgLfh(x) = Lg(dh(x) · f(x)) = Lg ([ 0 0 1 ] · [ e−x2 x1 1 2 x2 1 ]T ) = Lg( 1 2 x2 1) = d(1 2 x2 1) · g(x) = [ x1 0 0 ] · [ 1 0 0 ]T = x1. Para x0 = [ 1 0 0 ]T , LgLfh(x0) = 1. Portanto o grau relativo de y = h(x) = x3 em x0 = [ 1 0 0 ]T é 2. Porém, não é posśıvel definir o grau relativo em todo ponto. De fato, no ponto x0 = (0, 1, 0), teŕıamos LgLfh(x0) = 0 mas LgLfh(x) = 0 para algum x em qualquer vizinhança de x0, bastando escolher x próximo o suficiente de x0 com primeira coordenada não nula. Nesse caso, as exigências da definição de grau relativo não são satisfeitas, isto é, em x0 = (0, 1, 0) não é definido o grau relativo de y = h(x) = x3. Exemplo 2.2.3 Suponha x ∈ Rn e u ∈ R. Considere o sistema linear com sáıda especificada ⎧⎨ ⎩ x′ = Ax + bu(t) (a) y = cT x (b) e o produto considerado na introdução deste caṕıtulo, ⎡ ⎢⎢⎢⎢⎢⎢⎣ cT cT A ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ · [ b Ab . . . An−1b ] = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 . . . . . . 0 cT An−1b 0 ∗ ∗ ... ... 0 ∗ ... cT An−1b ∗ . . . . . . ∗ ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ . 31 Essa igualdade é verdadeira quando A, b e c satisfazem cT Akb = 0 para 0 ≤ k ≤ n − 2. Se cT An−1b = 0 as matrizes no lado esquerdo são não singulares, ou seja, o sistema pode ser transformado no sistema companheiro pelo teorema (1.2.1). Vamos analisar o grau relativo da sáıda y = h(x) = cT x em (b) e a relação entre grau relativo e a não singularidade das matrizes no lado esquerdo acima. Considere cT = [ τ1 τ2 . . . τn ] , onde cT é a primeira linha de T , a trans- formação que leva o sistema atual no sistema companheiro e x = [ x1 x2 . . . xn ]T . Temos • dh(x) = d(cT x) = d(τ1x1, τ2x2, . . . , τnxn) = [ τ1 τ2 . . . τn ] = cT ; • d(cT Ax) = d ( n∑ i=1 (cT A)i xi ) = [ (cT A)1 (cT A)2 . . . (cT A)n ] = (cT A); • d(cT A2x) = d ( n∑ i=1 (cT A2)i xi ) = [ (cT A2)1 (cT A2)2 . . . (cT A2)n ] = (cT A2); Por indução, chega-se a • d(cT Anx) = cT An. Agora, considerando f(x) = Ax, g(x) = b, onde A, x e b são, respectivamente, matrizes n×n, n×1 e n×1, vamos calcular o grau relativo da sáıda y = cT x = h(x). • LgL0 fh(x) = Lgh(x) = dh(x) · g(x) = cT b; • LgLfh(x) = Lg(dh(x) · f(x)) = Lg(c T Ax) = d(cT Ax) · g(x) = cT Ab; • LgL2 fh(x) = LgLf (dh(x) · f(x)) = LgLf (c T Ax) = Lg(d(cT Ax) · f(x)) = Lg(c T AAx) = Lg(c T A2x) = d(cT A2x) · g(x) = cT A2b; Supondo que 32 • LgLn−2 f h(x) = cT An−2b, tem-se • LgLn−1 f h(x) = LgLf (Ln−2 f h(x)) = LgLf (c T An−2x) = Lg(d(cT An−2x) · f(x)) = Lg(c T An−2 · A(x)) = d(cT An−1(x)) · g(x) = cT An−1b. No cálculo matricial feito no ińıcio deste exemplo, supomos cT Akb = 0, 0 ≤ k ≤ n − 2 e cT An−1b = 0. As fórmulas acima mostram que isso é equivalente a dizer que • LgLk fh(x) = cT Akb = 0, 0 ≤ k ≤ n − 2, e • LgLn−1 f h(x) = cT An−1b = 0, ou seja, o grau relativo de y = h(x) = cT x é n. Assim, uma sáıda y = cT x de grau relativo n implica na não singularidade das matrizes ⎡ ⎢⎢⎢⎢⎢⎢⎣ cT cT A ... cT An−1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ e [ b Ab . . . An−1b ] , que são as condições de controlabilidade e observabilidade do sistema linear, con- forme o teorema 1.2.1. Vamos supor agora uma sáıda y = h(x) com grau relativo n em x0. Então, y e suas n primeiras derivadas ao longo do campo (2.2) são dadas por • y = h(x) • y′ = dh(x) · x′ = dh(x)(f(x) + g(x)u) = dh(x) · f(x) + dh(x) · g(x)u = Lfh(x) + (Lgh(x)) · u = Lfh(x) + 0 · u • y′′ = (y′)′ = (Lfh(x))′ = d(Lfh(x)) · x′ = d(Lfh(x)) · (f(x) + g(x)u) = d(Lfh(x)) · f(x) + d(Lfh(x)) · g(x) · u = L2 fh(x) + LgLfh(x) = L2 fh(x) + 0 · u 33 • y′′′ = (y′′)′ = (L2 fh(x))′ = d(L2 fh(x)) · x′ = d(L2 fh(x)) · (f(x) + g(x)u) = d(L2 fh(x)) · f(x) + d(L2 fh(x)) · g(x) · u = Lf (L2 fh(x)) + Lg(L2 fh(x)) · u = L3 fh(x) + LgL2 fh(x) · u = L3 fh(x) + 0 · u ... • y(n−1) = Ln−1 f h(x) + LgLn−2 f h(x) · u = Ln−1 f h(x) + 0 · u • y(n) = Ln fh(x) + LgLn−1 f h(x) · u, Temos assim ⎡ ⎢⎢⎢⎢⎢⎢⎣ y y′ ... y(n−1) ⎤ ⎥⎥⎥⎥⎥⎥⎦ = ⎡ ⎢⎢⎢⎢⎢⎢⎣ h(x) Lfh(x) ... Ln−1 f h(x) ⎤ ⎥⎥⎥⎥⎥⎥⎦ , e (2.5) y(n) = Ln fh(x) + LgLn−1 f h(x)u . (2.6) Mostraremos mais adiante que, se h tem grau relativo n em x0, o vetor do se- gundo membro em (2.5) tem matriz Jacobiana não singular em x0. Então o segundo membro de (2.5) define uma transformação de coordenadas local numa vizinhança de x0. A presença da função não nula LgLn−1 f h(x) como coeficiente de u em (2.6) nos im- pede de obter um sistema linear controlável companheiro para z = [ y y′ . . . y(n−1) ]T usando apenas a mudança de coordenadas. No entanto, a mudança de coordenadas juntamente com a retroalimentação produz a forma simples y(n) = v. Basta definir u = 1 LgLn−1 f h(x) [−Ln fh(x) + v ] em que v é a nova entrada de referência. Essa situação permite ação de controle sobre o sistema não linear operando com a forma linear controlável (2.4) (com j = n). O grau relativo n de h em x0 é um 34 tipo de condição de observabilidade local. O teorema da Função Inversa aplicado em (2.5) implica que x é determinado por z = [ y y′ . . . y(n−1) ]T perto de x0. Com esses resultados podemos enunciar o teorema abaixo: Teorema 2.2.1 Consideremos o sistema (2.2) para o qual existe uma função de sáıda y = h(x) de grau relativo n em x0. Então, existe uma transformação z = T (x) definida pelo segundo membro em (2.5) numa vizinhança de x0 e uma retroali- mentação u = 1 LgLn−1 f h(x) [−Ln fh(x) + v ] que juntas transformam o sistema (2.2) com sáıda y = h(x) na equação y(n) = v. Caṕıtulo 3 Linearização do Estado de Entrada Se uma função de grau relativo n não está dispońıvel como função de sáıda, ainda queremos uma mudança local de coordenadas z = T (x) e uma retroalimentação u = α(x)+β(x)v com β(x) = 0 próximo de x0, que produza um sistema linear controlável para z. Este é o Problema de Linearização do estado de entrada (PLEE). Como no Caṕıtulo 1, a partir de um sistema linear controlável, uma mudança de coordenadas adicional e um estado de retroalimentação podem ser usados para produzir um sistema linear z′ = Nz + qv ≡ ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . . . . 0 0 0 1 0 . . . 0 ... ... ... 1 0 . . . . . . 0 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ z + ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ v, (3.1) onde N é um bloco nilpotente, de entradas n(i−1,i) = 1, i = 2, . . . , n, as demais, são iguais a zero e q = [ 0 0 . . . 0 1 ]T . Há uma diferença essencial entre os problemas de linearização (PLEE) e (PLES). Num, quando está dispońıvel uma função de sáıda de grau relativo n; no outro, tal função deve ser constrúıda. A partir do (PLEE) e através dele, tentaremos chegar à forma (3.1). O objetivo agora é mostrar que o (PLEE) é solúvel se, e somente se, existe uma função de 35 36 grau relativo n em x0 para (2.2). Já discutimos no caṕıtulo anterior a suficiência da condição de grau relativo n. 3.1 Preliminares Definição 3.1.1 O colchete de Lie [g1, g2] de dois campos vetoriais g1 e g2 é o campo vetorial definido por [g1, g2](x) ≡ ∂g2 ∂x g1(x) − ∂g1 ∂x g2(x) onde ∂gi ∂x é a matriz jacobiana de gi. Para as iteradas do colchete de Lie, introduzimos a notação: ad0 g1 g2 = g2 adg1g2 = [g1, g2] ... adk g1 g2 = [g1, adk−1 g1 g2] para k ≥ 0. Exemplo 3.1.1 Se f(x) = Ax e g(x) = b = [ 0 0 . . . 0 1 ]T , então [f, g](x) = −Ab. Também ad2 fg = [f, [f, g]](x) = A2b e, em geral, adk fg(x) = (−1)kAkb. De fato, • ad0 fg(x) = g(x) = b; • adfg(x) = [f, g](x) = ∂g ∂x f(x) − ∂f ∂x g(x) = −∂f ∂x g(x) = −Ab = (−1)Ab; • ad2 fg(x) = [f, [f, g]](x) = [f, −Ab](x) = ∂ ∂x (−Ab)f(x) − ∂f ∂x (x)(−Ab) = −A(−Ab) = A2b = (−1)2A2b; • ad3 fg(x) = [f, ad2 fg](x) = [f, A2b](x) = ∂ ∂x (A2b)f(x) − ∂f ∂x (x)(A2b) = −A(A2b) = −A3b = (−1)3A3b; Por indução, chega-se a 37 • adk fg(x) = [f, adk−1 f g](x) = (−1)kAkb, k = 0, 1, 2. . . . A propriedade que conecta o colchete de Lie sobre campos vetoriais e a derivada de Lie sobre uma função é a identidade de Jacobi. Proposição 3.1.1 (Identidade de Jacobi) Dados v e w campos vetoriais e λ uma função suave, temos (L[v, w]λ)(x) = (LvLwλ − LwLvλ)(x) . Demonstração: LvLwλ(x) − LwLvλ(x) = Lv(dλ(x)w(x)) − Lw(dλ(x)v(x)) = d(dλ(x)w(x))v(x) − d(dλ(x)v(x))w(x) =( w(x)T (d2λ(x))T + dλ(x) ∂w ∂x (x) ) v(x) − ( v(x)T (d2λ(x))T + dλ(x) ∂v ∂x (x) ) w(x) (3.2) onde d2λ(x) é a matriz das derivadas parciais de segunda ordem de λ em x. Como d2λ(x) é simétrica, (3.2) é igual a d2λ(x)w(x)v(x) − d2λ(x)v(x)w(x) + dλ(x) ∂w ∂x (x)v(x) − dλ(x) ∂v ∂x (x)w(x) = dλ(x) ( ∂w ∂x (x)v(x) − ∂v ∂x (x)w(x) ) = dλ(x) · [v, w] = L[v, w]λ(x). � A identidade de Jacobi também ajuda a identificar o ker dλ(x) para x ∈ U de uma função λ de grau relativo n em relação a (2.2). De fato, neste caso LgLk fλ(x) ≡ 0, k = 0, 1, 2, . . . , n − 2. Temos: Lgλ(x) ≡ 0 ⇒ dλ(x)g(x) ≡ 0, isto é, • g(x) ∈ ker dλ(x); dλ(x)adfg(x) = dλ(x) · [f, g](x) = (L[f, g]λ)(x) = (LfLgλ − LgLfλ)(x) ≡ 0, isto é, • adfg ∈ ker dλ(x); dλ(x)ad2 fg(x) = Lad2 f gλ(x) = (L[f,[f, g]]λ)(x) = (LfL[f, g]λ − L[f, g]Lfλ)(x) = 38 −L[f, g]Lfλ(x) = −L[f, g](dλ(x) · f(x) = −LfLg(dλ(x) · f(x))+ LgLf (dλ(x) · f(x)) = −LfLgLfλ(x) + LgLfLfλ(x) = −Lf (LgLfλ(x)) + LgL2 fλ(x) ≡ 0, isto é, • ad2 fg(x) ∈ ker dλ(x); dλ(x)ad3 fg(x) = Lad3 f gλ(x) = (L[f, ad2 f g]λ)(x) = (LfLad2 f gλ(x) − L[ad2 f g]Lfλ)(x) = Lf [−Lf (LgLfλ)(x)+LgL2 fλ(x)]−[−Lf (LgLf )+LgL2 f ](Lfλ(x)) = −L2 fLgLfλ(x)+ LfLgL2 fλ(x) + LfLgLfLfλ(x) − LgL2 fLfλ(x) = −L2 fLgLfλ(x) + LfLgL2 fλ(x)+ LfLgL2 fλ(x) − LgL3 fλ(x) ≡ 0, isto é, • ad3 fg(x) ∈ ker dλ(x); ... • adn−2 f g(x) ∈ ker dλ(x). • adn−1 f g(x) = (−1)n−1LgLn−1 f λ(x) = 0. Portanto, adn−1 f g(x) não pertence a ker dλ(x). Portanto adk fg(x) ∈ ker dλ(x) para k = 1, 2, . . . , n − 2. Vejamos agora a versão não linear para o cálculo em (2.1). Teorema 3.1.1 Se uma função λ tem grau relativo n em relação a (2.2) num con- junto aberto U , então para todo x ∈ U , (i) os covetores dL0 fλ(x), dLfλ(x), . . . , dLn−1 f λ(x), onde L0 fλ(x) = λ(x) são line- armente independentes; (ii) os vetores ad0 fg(x), adfg(x), . . . , adn−1 f g(x), onde ad0 fg(x) = g(x) são linear- mente independentes. Demonstração: Considere o produto de matrizes 39 ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ dλ(x) dLfλ(x) ... ... dLn−1 f λ(x) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ · [ g(x) adfg(x) . . . adn−1 f g(x) ] = (3.3) ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ dλ(x)g(x) dλ(x)adfg(x) . . . dλ(x)adn−2 f g(x) dλ(x)adn−1 f g(x) d(Lfλ(x))g(x) d(Lfλ(x))adfg(x) . . . d(Lfλ(x))adn−2 f g(x) ∗ ... ... ... ... d(Ln−1 f λ(x))g(x) ∗ . . . . . . ∗ ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ Lgλ(x) Ladf gλ(x) . . . Ladn−2 f gλ(x) Ladn−1 f gλ(x) LgLfλ(x) Ladf gLfλ(x) . . . Ladn−2 f gLfλ(x) ∗ ... ... ... ... LgLn−1 f λ(x) ∗ ∗ . . . ∗ ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ (3.4) Vemos que os elementos da matriz acima são da forma Ladl f gLk fλ(x), onde 0 ≤ k, l ≤ n − 1, k, l ∈ N. Então os elementos da diagonal secundária, LgLn−1 f λ(x), Ladf gLn−2 f λ(x), . . . ,Ladn−2 f gLfλ(x), Ladn−1 f gλ(x) , são da forma Ladl f gLk fλ(x), onde 0 ≤ k, l ≤ n − 1 e l + k = n − 1, k, l ∈ N. Assim, para que tenhamos os elementos da diagonal em questão não nulos e os elementos superiores a ela nulos, basta que Ladl f gLk fλ(x) = 0 para l + k < n − 1; k, l ∈ N (3.5) e Ladl f gLk fλ(x) = 0 para l + k = n − 1; k, l ∈ N. (3.6) 40 Vamos provar por indução sobre l. • Para l = 0, como λ(x) tem grau relativo n, a primeira coluna da matriz (3.4), tem seus elementos todos nulos exceto pelo n-ésimo termo. • Para l = 1, usando a Identidade de Jacobi e o grau relativo de λ(x) igual a n, temos que (3.5) e (3.6) são, respectivamente iguais a Ladf gLk fλ(x) = LfLgLk fλ(x) − LgLk+1 f λ(x) = 0 para 1 + k < n − 1 e Ladf gLk fλ(x) = LfLgLk fλ(x) − LgLk+1 f λ(x) = −LgLk+1 f λ(x) = 0 para 1 + k = n − 1. • Se (3.5) e (3.6) são verdadeiras para l, provaremos para l + 1, isto é, Ladl+1 f gLk fλ(x) = 0 para l + k < n − 2; k, l ∈ N pois l + 1 + k < n − 1 ⇔ l + k < n − 2 e Ladl+1 f gLk fλ(x) = 0 para l + k = n − 2; k, l ∈ N. pois l + 1 + k = n − 1 ⇔ l + k = n − 2 De fato, para k + l < n − 2, usando a Identidade de Jacobi e a afirmação (3.5) verdadeira para l, temos Ladl+1 f gLk fλ(x) = LfLadl f gLk fλ(x) − Ladl f gLk+1 f λ(x) = 0 pois, l + k < l + k + 1 < n − 1. Para l + k = n − 2, usando a Identidade de Jacobi e supondo a afirmação (3.6) verdadeira para l, temos 41 Ladl+1 f gLk fλ(x) = LfLadl f gLk fλ(x) − Ladl f gLk+1 f λ(x) = −Ladl f gLk+1 f λ(x) = 0 pois l + k + 1 = n − 1. Logo, os elementos superiores a diagonal secundária são todos nulos e o deter- minante da matriz (3.4) é diferente de zero. Segue que (3.4) é não singular. Então, as matrizes no produto (3.3) são não singulares. Portanto, (i), (ii) são verdadeiras. � Mostraremos em seguida que a solubilidade do (PLEE) implica a existência de uma função λ(x) de grau relativo n em relação a (2.2) em x0. 3.2 Condições Necessárias à Solvabilidade do PLEE Mostraremos agora que a solução para o (PLEE) esta ligada à existência de uma função de grau relativo n. Supondo o (PLEE) solúvel, então a transformação z = T (x), combinada com a retroalimentação u = α(x) + β(x)v, produzem o sistema linear (3.1). Das definições das variáveis, isso ocorre se, e somente se, ∂T ∂x (f(x) + g(x)u) = NT (x) + qv, (3.7) onde a igualdade é verdadeira para todo u = α(x) + β(x)v, com v arbitrário. De fato, z′ = NT (x) + qv ⇒ T ′(x)x′ = NT (x) + qv ⇒ ∂T ∂x (f(x) + g(x)u) = NT (x) + qv. Considerando u = 0, temos 0 = α(x) + β(x)v ⇒ v = −α(x)β−1(x) onde β−1(x) = 1 β(x) , e ∂T ∂x (f(x) + g(x)u) = NT (x) + qv ⇒ ∂T ∂x f(x) = NT (x) + q(−α(x)β−1(x)) ⇒ ∂T ∂x (f(x)) = NT (x) − qα(x)β−1(x) (3.8) E agora fazendo u = 1, temos 42 1 = α(x) + β(x)v ⇒ v = (1 − α(x))β−1(x), e então, usando (3.8) ∂T ∂x (f(x)+g(x)) = NT (x)+ qv ⇒ ∂T ∂x (f(x))+ ∂T ∂x (g(x)) = NT (x)+ qv ⇒ ∂T ∂x (g(x)) = NT (x) + q((1 − α(x))β−1(x)) − (NT (x) − qα(x)β−1(x)) ⇒ ∂T ∂x (g(x)) = NT (x) + qβ−1(x) − qα(x)β−1(x) − NT (x) + qα(x)β−1(x) . Assim, ∂T ∂x g(x) = qβ−1(x) . Vemos que se (3.7) está satisfeita, o sistema de duas equações diferenciais parciais se verifica: ∂T ∂x f(x) = NT (x) − qα(x)β−1(x) (3.9) ∂T ∂x g(x) = qβ−1(x) (3.10) Se T (x) = [ T1(x) T2(x) . . . Tn(x) ]T , então NT (x)−qα(x)β−1(x) = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . . . . 0 0 0 1 0 . . . 0 ... ... ... 1 0 . . . . . . 0 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ T1(x) T2(x) T3(x) ... Tn(x) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ − ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ α(x)β−1(x) = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ T2(x) T3(x) ... Tn(x) 0 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ − ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 α(x)β−1(x) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ = [ T2(x) T3(x) . . . Tn(x) −α(x)β−1(x) ]T . 43 Então, usando (3.9) dTk(x)f(x) = Tk+1(x), k = 1, 2, . . . , n − 1 Como dTk(x)f(x) = LfTk(x), LfTk(x) = Tk+1(x), k = 1, 2, . . . , n − 1 (3.11) Portanto, T2(x) = LfT1(x) ⇒ T3(x) = LfT2(x) = LfLfT1(x) = L2 fT1(x) ⇒ . . . ⇒ Tk+1(x) = Lk fT1(x), k = 1, 2, . . . , n − 1 (3.12) e para k = n, dTn(x)f(x) = −α(x)β−1(x) ⇒ LfTn(x) = −α(x)β−1(x) ⇒ Ln fT1(x) = −α(x)β−1(x) (3.13) Portanto todas as linhas de T(x) são determinadas em função da primeira (T1(x)) e a última equação (3.13) especifica a razão −α(x)β−1(x) em termos de T1(x). Analogamente, de (3.10), ∂T ∂x g(x) = qβ−1(x) = [ 0 0 . . . 0 β−1(x) ]T . Logo, dTk(x)g(x) = 0, k = 0, . . . , n − 1, e dTk(x)g(x) = LgTk(x) = LgLfTk−1(x) = LgLk−1 f T1(x) = 0, k = 1, 2, . . . , n − 1 (3.14) Para k = n, β−1(x) = dTn(x)g(x) = LgLn−1 f T1(x), e então LgLn−1 f T1(x) = β−1(x) = 0 . (3.15) 44 Por (3.14) e (3.15), vemos que a solução do (PLEE) requer uma função vetorial T1(x) que tenha grau relativo n. Dada T1(x), as outras linhas de T (x) são obtidas a partir de T1(x) usando (3.12). E a retroalimentação exigida será u = α(x) + β(x)v onde α(x) e β(x) serão determinadas através de (3.13) e (3.15). De fato, α(x) = − Ln fT1(x) LgLn−1 f T1(x) e β(x) = 1 LgLn−1 f T1(x) (3.16) Com esses resultados podemos enunciar o teorema a seguir: Teorema 3.2.1 Se o sistema (2.2) pode ser levado por uma transformação local de coordenadas z = T (x) aliada a uma retroalimentação u = α(x) + β(x)v numa vizinhança de x0 para a forma linear controlável z′ = Nz + qv, então existe uma função vetorial λ(x) com grau relativo n em relação a (2.2) no ponto x0. Neste caso, T (x) é determinada por (3.11) definindo a primeira linha T1(x) = λ(x) e o estado de retroalimentação u = α(x) + β(x)v é determinado por (3.16). 3.3 O Resultado Principal Teorema 3.3.1 O sistema (2.2) definido numa região aberta G ⊂ R n pode ser levado por uma transformação local de coordenadas z = T (x) aliada a um estado de retroalimentação u = α(x) + β(x)v numa vizinhança de x0 para a forma linear controlável z′ = Nz+qv se, e somente se, existe uma função λ(x) com grau relativo n em relação a (2.2) no ponto x0. Neste caso, T (x) é determinada por (3.11) definindo a primeira linha T1(x) = λ(x) e o estado de retroalimentação é determinado por (3.16). Demonstração: (⇒) Pelo desenvolvimento de (3.7), vimos na seção anterior que existem uma função de grau relativo n, λ(x) = T1(x), uma transformação de coor- 45 denadas z = T (x) = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ λ(x) Lfλ(x) ... ... Ln−1 f λ(x) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ e um estado de retroalimentação determinado por (3.16) que levam (2.2) à forma controlável z′ = Nz + qv. (⇐) Se existe uma função vetorial λ(x) de grau relativo n em relação (2.2) em x0, tomamos z = T (x) = ⎡ ⎢⎢⎢⎢⎢⎢⎣ λ(x) Lfλ(x) ... Ln−1 f λ(x) ⎤ ⎥⎥⎥⎥⎥⎥⎦ . Temos: z′ = ∂T ∂x (x) · x′ = ⎡ ⎢⎢⎢⎢⎢⎢⎣ ∂λ ∂x1 (x) . . . ∂λ ∂xn (x) Lf λ ∂x1 (x) . . . Lf λ ∂xn (x) ... ... Ln−1 f λ ∂x1 (x) . . . Ln−1 f λ ∂xn (x) ⎤ ⎥⎥⎥⎥⎥⎥⎦ · (f(x) + g(x)u) = ⎡ ⎢⎢⎢⎢⎢⎢⎣ dλ(x) dLfλ(x) ... dLn−1 f λ(x) ⎤ ⎥⎥⎥⎥⎥⎥⎦ · (f(x) + g(x)u) = ⎡ ⎢⎢⎢⎢⎢⎢⎣ dλ(x) · f(x) + dλ(x) · g(x)u dLfλ(x) · f(x) + dLfλ(x) · g(x)u ... ... dLn−1 f λ(x) · f(x) + dLn−1 f λ(x) · g(x)u ⎤ ⎥⎥⎥⎥⎥⎥⎦ = ⎡ ⎢⎢⎢⎢⎢⎢⎣ Lfλ(x) + Lgλ(x)u L2 fλ(x) + LgLfλ(x)u ... ... Ln fλ(x) + LgLn−1 f λ(x)u ⎤ ⎥⎥⎥⎥⎥⎥⎦ (3.17) 46 Como o grau relativo de λ em relação a (2.2) é igual a n, (3.17) é igual a⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ Lfλ(x) + 0 L2 fλ(x) + 0 ... ... Ln−1 f λ(x) 0 Ln fλ(x) + (LgLn−1 f λ(x)) −Ln fλ(x) + v LgLn−1 f λ(x) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ Lfλ(x) ... ... Ln−1 f λ(x) 0 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 v ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ = ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 1 0 . . . . . . 0 0 0 1 0 . . . 0 ... ... ... 1 0 . . . . . . 0 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ · ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ λ(x) Lfλ(x) ... ... Ln−1 f λ(x) ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣ 0 0 ... 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦ v = Nz + qv � Exemplo 3.3.1 Considere o sistema x′ 1 = senx2 x′ 2 = −x2 1 + u perto do ponto de equiĺıbrio x0 = 0 onde x = (x1, x2) ∈ R2. Temos f(x) = [ senx2 −x2 1 ]T e g(x) = [ 0 1 ]T ; f e g em R2. Se T1(x) tem grau relativo 2, então LgT1(x) = 0; (3.18) e, por (3.11) LgT2(x) = LgLfT1(x) = 0. (3.19) Agora, 47 LgT1(x) = dT1(x) · g(x) = [ ∂T1 ∂x1 (x) ∂T1 ∂x2 (x) ] · [ 0 1 ]T = ∂T1 ∂x2 (x) De (3.18), temos que ∂T1 ∂x2 (x) = 0 Conclúımos que T1(x) é independente de x2, dT1(x) = [ ∂T1 ∂x1 (x) 0 ] e que T2(x) = LfT1(x) = dT1(x) ·f(x) = [ ∂T1 ∂x1 (x) 0 ] · [ senx2 −x2 1 ]T = ∂T1 ∂x1 (x)senx2. (3.20) Por outro lado, LgT2(x) = dT2(x)·g(x) = [ ∂T2 ∂x1 (x) ∂T2 ∂x2 (x) ] · [ 0 1 ]T = ∂T2 ∂x2 (x) = ∂ ∂x2 (∂T1 ∂x1 (x)senx2) e pela independência de T1(x) em relação a x2, LgT2(x) = ∂T1 ∂x1 (x) · ∂(senx2) ∂x2 = ∂T1 ∂x1 (x) · cosx2 = 0. (3.21) Assim, ∂T1 ∂x1 (x) e cosx2 são diferentes de zero, próximos de x0 = 0. Como x1 tem grau relativo 2 em relação a x0 (Exemplo 2.2.1, 2o Caso), tomemos T1(x) = x1. Temos, pelo visto acima, T2(x) = senx2 e T (x) = [ T1(x) T2(x) ]T = [ x1 senx2 ]T Agora vamos determinar a retroalimentação u(x) = α(x) + β(x)v. Temos, β−1(x) = LgLfT1(x) =︸︷︷︸ (3.21) ∂T1 ∂x1 (x) · cosx2 = cosx2 ⇒ β(x) = 1 cosx2 = secx2. 48 α(x) = −L2 fT1(x) cosx2 = −LfLfT1(x) cosx2 = −LfT2(x) cosx2 = −Lfsen(x2) cosx2 = −dsen(x2) · f(x) cosx2 = [ 0 cosx2 ] · [ senx2 −x2 1 ]T cosx2 = −x2 1cosx2 cosx2 = −x2 1 Logo, u(x) = −x2 1 + secx2 · v. Vamos verificar agora que T (x) aliada à retroalimentação u(x) produz a forma z′ = Nz + qv. z′ = ∂T ∂x · x′ = ⎡ ⎣ 1 0 0 cosx2 ⎤ ⎦ · ⎡ ⎣ senx2 −x2 1 + u ⎤ ⎦ = ⎡ ⎣ senx2 −x2 1 · cosx2 + u · cosx2 ⎤ ⎦ = ⎡ ⎣ senx2 −x2 1 · cosx2 + (−x2 1 + secx2 · v) · cosx2 ⎤ ⎦ = ⎡ ⎣ senx2 −x2 1 · cosx2 − x2 1cosx2 + v ⎤ ⎦ = ⎡ ⎣ senx2 v ⎤ ⎦ = ⎡ ⎣ senx2 0 ⎤ ⎦ + ⎡ ⎣ 0 v ⎤ ⎦ = ⎡ ⎣ 0 1 0 0 ⎤ ⎦T (x) + qv . Em geral, T não é única. Escolhendo T1(x) = x1 − x2 1, T1 também tem grau relativo 2 em x0 = 0. De fato, LgT1(x) = dT1(x) · g(x) = [ ∂T1 ∂x1 (x) ∂T1 ∂x2 (x) ] · [ 0 1 ]T = [ 1 − 2x1 0 ] · [ 0 1 ]T = 0 para todo x e LgLfT1(x) = Lg(dT1(x) · f(x)) = Lg ([ 1 − 2x1 0 ] · [ senx2 −x2 1 ]T ) = Lg(senx2 − 2x1senx2) = d(senx2 − 2x1senx2) · g(x) = 49 [ −2senx2 cosx2 − 2x1cosx2 ] · [ 0 1 ]T = cosx2 − 2x1cosx2. Portanto, em x0 = 0, LgLfT1(0) = cos0 − 2 · 0 · cos0 = 1 Além disso, T2(x) = LfT1(x) = dT1(x)·f(x) = [ 1 − 2x1 0 ] · [ senx2 −x2 1 ]T = senx2−2x1senx2 . Assim, obtemos T (x) = [ T1(x) T2(x) ]T = [ x1 − x2 1 senx2 − 2x1senx2 ]T . Exemplo 3.3.2 Usando o teorema 3.3.1 podemos mostrar que x′ = f(x) + g(x)u = ⎡ ⎢⎢⎢⎣ e−x2 x1 1 2 x2 1 ⎤ ⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎣ 1 0 0 ⎤ ⎥⎥⎥⎦u onde x ∈ R3 e u ∈ R não é entrada-sáıda linearizável. Suponha λ(x) uma função suave com grau relativo 3. Então, 0 = Lgλ(x) = dλ(x) · g(x) = [ ∂λ(x) ∂x1 ∂λ(x) ∂x2 ∂λ(x) ∂x3 ] · [ 1 0 0 ]T = ∂λ(x) ∂x1 . Segue que λ é linearmente independente de x1 em U , uma vizinhança de x0, e 0 = LgLfλ(x) = Lg(dλ(x)·f(x)) = Lg ([ 0 ∂λ(x) ∂x2 ∂λ(x) ∂x3 ] · [ e−x2 x1 1 2 x2 1 ]T ) = Lg ( ∂λ(x) ∂x2 x1 + 1 2 ∂λ(x) ∂x3 x2 1 ) = d ( ∂λ(x) ∂x2 x1 + 1 2 ∂λ(x) ∂x3 x2 1 ) · [ 1 0 0 ]T = ∂(x1) ∂x1 ∂λ(x) ∂x2 + ∂( 1 2 x2 1) ∂x1 ∂λ(x) ∂x3 = ∂λ(x) ∂x2 + ∂λ(x) ∂x3 · x1. Logo, ∂λ(x) ∂x2 = −∂λ(x) ∂x3 · x1 (Absurdo! λ é independente de x1). Portanto, não há função de grau relativo 3 em relação ao sistema num aberto de R3, isto é, o sistema não é entrada-sáıda linearizável. 50 3.3.1 Aplicação Considere a figura abaixo que representa um mecanismo com junta flex́ıvel e conexão única (braço de robô) impulsionado por um motor através de uma mola torsional de amortecimento despreźıvel no plano vertical . (ver [7], pg 528 e [6], pg 242) Suas equações de movimento podem ser obtidas como ⎧⎪⎨ ⎪⎩ Iq′′1 + MGLsenq1 + k(q1 − q2) = 0 Jq′′2 − k(q1 − q2) = u, onde q1 e q2 são posições angulares, I e J são momentos de inércia, k é a constante da mola, M é uma massa, G é a constate gravitacional, L representa uma distância e u é o torque de entrada do motor. Note que as não linearidades aparecem na primeira equação, enquanto o controle u aparece somente na segunda equação, onde não é posśıvel obter um vasto controle de maneira óbvia. Vamos agora analisar se uma linearização estado de entrada é posśıvel. Primeiro, vamos colocar a dinâmica do sistema em um espaço de repre- sentação escrevendo x = [ q1 q′1 q2 q′2 ]T , então o sistema acima pode ser escrito na forma 51 x′ = f(x) + g(x)u ≡ ⎡ ⎢⎢⎢⎢⎢⎢⎣ x2 −asenx1 − b(x1 − x3) x4 c(x1 − x3) ⎤ ⎥⎥⎥⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎢⎢⎢⎣ 0 0 0 e ⎤ ⎥⎥⎥⎥⎥⎥⎦u , (3.22) usando as constantes positivas a = MGL I , b = k I , c = k J e e = 1 J . Vamos analisar o sistema próximo ao ponto de equiĺıbrio x0 = 0. Se existir uma função T1(x) de grau relativo 4, pelo teorema 3.3.1, esse sistema é levado à forma linear controlável z′ = Nz + dv através de uma transformação T aliada a retroalimentação u. De fato, Vamos escolher T1(x) = x1. • LgT1(x) = dT1(x) · g(x) = [ 1 0 0 0 ] · [ 0 0 0 e ]T = 0. • LgLfT1(x) = Lg (dT1(x) · f(x)) = Lg ([ 1 0 0 0 ] · f(x) ) = Lg(x2) = d(x2) · g(x) = [ 0 1 0 0 ] · [ 0 0 0 e ]T = 0. • LgL2 fT1(x) = LgLf (dT1(x) · f(x)) = LgLf ([ 1 0 0 0 ] · f(x) ) = LgLf (x2) = Lg(d(x2) · f(x)) = Lg [ 0 1 0 0 ] · f(x) = Lg(−asenx1 − b(x1 − x3)) = [ −acosx1 − b 0 b 0 ] · [ 0 0 0 e ]T = 0. • LgL3 fT1(x) = LgLfL2 fT1(x) = LgLf (−asenx1 − b(x1 − x3)) = Lg ([ −acosx1 − b 0 b 0 ] · f(x) ) = Lg(−ax2cosx1 − bx2 + bx4) = [ ax2senx1 −acosx1 − b 0 b ] · [ 0 0 0 e ]T = b.e = 0, pois b, e > 0. • L4 fT1(x) = LfL3 fT1(x) = Lf (−ax2cosx1 − b(x2 − x4)) = 52 = [ ax2senx1 −acosx1 − b 0 b ] · ⎡ ⎢⎢⎢⎢⎢⎢⎣ x2 −asenx1 − b(x1 − x3) x4 c(x1 − x3) ⎤ ⎥⎥⎥⎥⎥⎥⎦ = = ax2 2senx1 + (−acosx1 − b)(−asenx1 − b(x1 − x3)) + bc(x1 − x3) Logo T1(x) = x1 tem grau relativo 4 em x0 = 0 e pelo Teorema 3.3.1, existe uma transformação T (x) que aliada a uma retroalimentação u(x) leva o sistema (3.22) para a forma linear controlável z′ = Nz + dv numa vizinhança de x0. Além disso, • T2(x) = LfT1(x) = x2 • T3(x) = L2 fT1(x) = −asenx1 − b(x1 − x3) • T4(x) = L3 fT1(x) = −ax2cosx1 − b(x2 − x4) Logo, z = T (x) = ⎡ ⎢⎢⎢⎢⎢⎢⎣ x1 x2 −asenx1 − b(x1 − x3) −ax2cosx1 − b(x2 − x4) ⎤ ⎥⎥⎥⎥⎥⎥⎦ e u(x) = α(x)+β(x)v = − L4 f T1(x) LgL3 f T1(x) + v LgL3 f T1(x) = ax2 2senx1+(−acosx1−b)(−asenx1−b(x1−x3))+bc(x1−x3)+v b.e . Portanto, (3.22) é equivalente ao sistema ⎡ ⎢⎢⎢⎢⎢⎢⎣ 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 ⎤ ⎥⎥⎥⎥⎥⎥⎦ ⎡ ⎢⎢⎢⎢⎢⎢⎣ x1 x2 −asenx1 − b(x1 − x3) −ax2cosx1 − b(x2 − x4) ⎤ ⎥⎥⎥⎥⎥⎥⎦ + ⎡ ⎢⎢⎢⎢⎢⎢⎣ 0 0 0 1 ⎤ ⎥⎥⎥⎥⎥⎥⎦ v . Referências Bibliográficas [1] Terrell, W. J. Some Fundamental Control Theory I: Controllability, Observability, and Duality. American Mathematical Monthy, v.106, n.8, p.705-719, 1999. [2] Terrell, W. J. Some Fundamental Control Theory II: Feedback Lin- earization of Single Input Nonlinear Systems. American Mathematical Monthy, v.106, n.8, p.812-828, 1999. [3] Pavani, M. Controlabilidade de Sistemas de Equações Diferenciais Lineares. Dissertação (Mestrado em Matemática) - Departamento de Matemática, Ibilce-Unesp, São José do Rio Preto, 58p, 2008. [4] Burghes, D.; Graham, A. Control and Optimal Control Theories with Applications. Chichester: Horwood, 2004. [5] van der Schaft, A.J.;Nijmeijer, H. Nonlinear Dynamical Control Sys- tems. New York: Springer-Verlag, 1991. [6] Slotine, J.J.E; Li,W. Applied Nonlinear Control. Englewood Cliffs: Prentice Hall, 1991. 461p. [7] Khalil, H. K. Nonlinear Sistems. 2ed. Upper Saddle River: Prentice Hall, 1996. 734p. 53 FOLHA DE ROSTO COMISSÃO EXAMINADORA DEDICATÓRIA AGRADECIMENTOS EPÍGRAFE RESUMO ABSTRACT SUMÁRIO INTRODUÇÃO 1 CONTROLABILIDADE DE SISTEMAS DE EQUAÇÕES DIFERENCIAIS LINEARES 1.1 Equivalência 1.2 Controlabilidade e Observabilidade 1.3 Retroalimentação Linear 2 LINEARIZAÇÃO DE ENTRADA E SAÍDA 2.1 Linearização de Entrada e Saída 2.2 Funções de Grau Relativo n 3 LINEARIZAÇÃO DO ESTADO DE ENTRADA 3.1 Preliminares 3.2 Condições Necessárias à Solvabilidade do PLEE 3.3 O Resultado Principal REFERÊNCIAS