Keide Tukamoto Oyafuço Classificação de Cônicas e Quádricas São José do Rio Preto 2015 Ficha catalográfica elaborada pela Biblioteca do IBILCE UNESP - Câmpus de São José do Rio Preto Oyafuço, Keide Tukamoto. Classificação de cônicas e quádricas / Keide Tukamoto Oyafuço. -- São José do Rio Preto, 2015 75 f. : il., tab. Orientador: Parham Salehyan Dissertação (mestrado profissional) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Instituto de Biociências, Letras e Ciências Exatas 1. Matemática - Estudo e ensino. 2. Geometria - Estudo e ensino. 3. Seções cônicas. 4. Quádricas. 5. Tecnologia educacional. 6. Ensino auxiliado por computador. I. Salehyan, Parham. II. Universidade Estadual Paulista "Júlio de Mesquita Filho". Instituto de Biociências, Letras e Ciências Exatas. III. Título. CDU – 513(07) Keide Tukamoto Oyafuço Classificação de Cônicas e Quádricas Dissertação apresentada como parte dos requi- sitos para obtenção do título de Mestre, junto ao Programa de Pós-Graduação Mestrado Profis- sional em Matemática PROFMAT - Instituto de Biociências, Letras e Ciências Exatas da Uni- versidade Estadual Paulista “Júlio de Mesquita Filho”, Campus de São José do Rio Preto. Orientador: Prof. Dr. Parham Salehyan São José do Rio Preto - SP 2015 Keide Tukamoto Oyafuço Classificação de Cônicas e Quádricas Dissertação apresentada como parte dos requi- sitos para obtenção do título de Mestre, junto ao Programa de Pós-Graduação Mestrado Profissi- onal em Matemática PROFMAT - Instituto de Bi- ociências, Letras e Ciências Exatas da Universi- dade Estadual Paulista “Júlio de Mesquita Filho”, Campus de São José do Rio Preto. Comissão Examinadora Prof. Dr. Parham Salehyan UNESP - São José do Rio Preto - SP Orientador Profa. Dra. Flávia Souza Machado da Silva UNESP - São José do Rio Preto - SP Prof. Dr. Miguel Vinícius Santini Frasson USP - São Carlos - SP São José do Rio Preto 25 de fevereiro de 2015 AGRADECIMENTOS Primeiramente agradeço a Deus por me dar saúde e forças todos os dias. Obrigado ao meu orientador Prof. Dr. Parhan Salehyan pela paciência e dedicação. Obrigado aos meus pais Luis Massayuki Oyafuço e Marie Tukamoto Oya- fuço e a minha irmã Akemi Oyafuço pelo amor, carinho, dedicação e incen- tivo constante. Obrigado aos professores do Departamento de Matemática do IBILCE pela dedicação com o PROFMAT e pela oportunidade. Obrigado a CAPES pelo importante apoio financeiro. Obrigado a todos os meus amigos e familiares. Obrigado a todos os colegas de curso pelo companheirismo e ajuda com os estudos. Agradecimento especial para uma grande amiga e companheira Carla Usai pela dedicação, apoio e incentivo. “A matemática é o alfabeto que Deus usou para escrever o Universo.” (Galileu Galilei) RESUMO O principal objetivo deste estudo é classificar as curvas cônicas e as super- fícies quádricas que são representadas através de equações do tipo Ax2 + By2 + Cz2 +Dxy + Exz + Fyz +Gx+Hy + Iz + J = 0, com A,B,C,D,E.F,G,H, I, J ∈ R. Antes da classificação dessa curvas e superficies vamos apresentar alguns conceitos e resultados dentro da Álgebra Linear como os espaços vetoriais com produto interno, operadores adjuntos e as formas bilineares. Os con- ceitos e resultados apresentados servirão de suporte à classificação tanto das cônicas como das quádricas. Além da classificação das cônicas e das quádricas, vamos apresentar uma proposta de atividade com o software GEOGEBRA para que alunos do En- sino Médio entendam melhor o conceito das cônicas (elipse, hipérbole e parábola). Palavras chave: Cônicas, Quádricas, Classificação das Cônicas, Classifi- cação das Quádricas, Software Geogebra. ABSTRACT The main objective of this study is to classify the conics curves and the quadrics surfaces that are represented through equations Ax2 + By2 + Cz2 +Dxy + Exz + Fyz +Gx+Hy + Iz + J = 0 whit A,B,C,D,E.F,G,H, I, J ∈ R. Before the classification of these curves and surfaces we will present some concepts and results of Linear Algebra such as the vector spaces with an inner product, adjoints operators and the bilinear forms. The concepts and results presented will be the supported for the classification of the conics as of the quadrics. Beyond the classification of the conics and the quadrics , we go to present a proposal of activity with software GEOGEBRA so that students of Ensino Médio better understand the concept of the conics (ellipse, hyperbola and parabola). Key words: Conics, Quadrics, Classification of Conics, Classification of Quadrics, Software Geogebra. Sumário 1 INTRODUÇÃO 9 2 ESPAÇOS VETORIAIS COM PRODUTO INTERNO 11 2.1 Produto Interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2 Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.1 Norma (ou comprimento) de um vetor . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.2 Vetores Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.3 Conjunto Ortogonal e Conjunto Ortonormal . . . . . . . . . . . . . . . . . . . . . . 16 2.2.4 Processo de Ortogonalização de Gram-Schmidt . . . . . . . . . . . . . . . . . . . 17 2.3 Subespaço Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.4 Transformações Lineares que Preservam Produtos Internos . . . . . . . . . . . . . . . . . 21 3 OPERADORES ADJUNTOS 23 3.1 Funcionais Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.2 Operadores Adjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3 Matriz de uma Transformação Linear e Operadores Adjunto . . . . . . . . . . . . . . . . . 26 3.4 Operadores Auto-Adjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.5 Operadores Unitários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.6 Operadores Normais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4 FORMAS BILINEARES 36 4.1 Formas Bilineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.2 Matriz de uma forma bilinear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 4.3 Formas Simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.4 Formas Quadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5 RECONHECIMENTO DE CÔNICAS E QUÁDRICAS 44 5.1 Classificação das Superfícies Quádricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 5.1.1 Tabela de Classificação das Quádricas . . . . . . . . . . . . . . . . . . . . . . . . 45 5.2 Classificação das Cônicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 6 AS CURVAS CÔNICAS E O SOFTWARE GEOGEBRA COMO FERRAMENTA DE APRENDIZAGEM 58 6.1 Curvas Cônicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.1.1 Circunferência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.1.2 Equação da Circunferência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.1.3 Elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.1.4 Equação da Elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.1.5 Hipérbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 6.1.6 Equação da Hipérbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.1.7 Parábola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.1.8 Equação da Parábola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.2 Atividades com o Software Geogebra: Propriedades das Cônicas . . . . . . . . . . . . . 67 6.2.1 Atividade 01: Definindo as Cônicas . . . . . . . . . . . . . . . . . . . . . . . . . . 68 6.2.2 Atividade 02: Excentricidade (e) e parâmetro (p) . . . . . . . . . . . . . . . . . . . 70 6.2.3 Considerações e Aplicação das Atividades . . . . . . . . . . . . . . . . . . . . . . 72 7 REFERÊNCIAS 75 8 1 INTRODUÇÃO O principal objetivo deste trabalho é classificar as cônicas e as quádricas representadas por equações do tipo ax2 + by2 + cz2 + 2pxy + 2qxz + 2ryz + Ex + Fy + Gz + d = 0 no caso das quádricas e, ax2 + 2bxy + cy2 + Ex+ Fy + d = 0 no caso das cônicas, onde, a, b, c, d, E, F,G, p, q, r ∈ R. Para entender melhor nosso objetivo considere a seguinte equação: x2 + 2xy + y2 + 2x+ y = 0. (1) Note que, x2 + 2xy + y2 = (x+ y)2 é um quadrado perfeito, então, x2 + 2xy + 2y2 + 2x+ y = 0⇔ (x+ y)2 + 2x+ y = 0. Fazendo uma mudança de base, x+ y = k e, consequentemente, y = k − x, então, k2 + 2x+ k − x = 0⇔ k2 + k + x = 0. Completando quadrados, k2 + k + 1 4 + x = 1 4 ⇔ ( k + 1 2 )2 + x = 1 4 . Fazendo uma nova mudança de base, k + 1 2 = k′, k′2 + x = 1 4 ⇔ x = −k′2 + 1 4 . (2) Esta última equação é a equação de uma parábola. Figura 1: Parábola de equação x 2 + 2xy + y 2 + 2x+ y = 0 Fixando o sistema de coordenadas cartesinas usual para o plano {O,~i,~j} a parábola em questão tem equação como dada em (1). Agora mudando a base do sistema de coordenadas, através de rotações e translações no plano, para um sistema de coordenadas {O′, v1, v2} a equação da mesma parábola tem a sua equação simplificada nesse novo sistema de coordenadas como mostra a equação (2). Observe também que, todo o processo é reversível, ou seja, assim como partimos da equação (1) 9 e chegamos em (2), também podemos fazer o processo inverso. Em outras palavras, as rotações e translações feitas para simplificar as equações são reversíveis. É claro que este exemplo acima se trata de um caso particular de uma cônica. Assim, nosso objetivo será estudar um procedimento geral, que sirva para simplificar todas as equações das cônicas e das quádricas citadas acima. Concluido os estudos das equações das cônicas e das quádricas, apresentaremos duas propostas de atividades pedagógicas para alunos do Ensino Médio. Uma dessas atividade consiste em apresentar alguns roteiros de construções geométricas no software GeoGebra para observação das propriedades das cônicas (elipse, hipérbole e parábola) afim que o aluno consiga distinguir através dessas observa- ções a principal característica de cada uma das três cônicas. A outra atividade também são roteiros de construções no software GeoGebra para a observação da excentricidade das cônicas e do parâmetro da parábola. 10 2 ESPAÇOS VETORIAIS COM PRODUTO INTERNO Durante esse texto, sempre K representa o corpo dos números reais R, ou dos números complexos C. Nesta seção, estudaremos os espaços vetoriais com produto interno. O Produto Interno completa e enriquece a estrutura de um espaço vetorial, permitindo a utilização de uma linguagem geométrica altamente sugestiva, e que será de extrema importância para o desenvolvimento deste trabalho. 2.1 Produto Interno Definição 2.1.1 Seja V um K-espaço vetorial. Definimos um Produto Interno sobre V como uma função: 〈 , 〉 : V × V −→ K que satisfaz as seguintes propriedades: P1: 〈u+ v, w〉 = 〈u,w〉+ 〈v, w〉, ∀u, v, w ∈ V ; P2: 〈λu, v〉 = λ〈u, v〉, ∀u, v ∈ V e ∀λ ∈ K; P3: 〈u, v〉 = 〈v, u〉; P4: 〈u, u〉 > 0, u 6= 0. A partir da definição acima, observamos: (a) 〈0, v〉 = 〈v, 0〉 = 0, ∀v ∈ V . De fato, como V é um K-espaço vetorial, 0 · v = 0, ∀v ∈ V . Logo, 〈0, v〉 = 〈0v, v〉 = 0 〈v, v〉 = 0. Por outro lado, 〈v, 0〉 = 〈0, v〉 = 0. � (b) 〈v, v〉 = 0⇔ v = 0. (⇒) Suponha v 6= 0. Pela propriedade P4, 〈v, v〉 > 0⇒ 〈0 + v, 0 + v〉 > 0 P1⇒ 〈0, 0 + v〉+ 〈v, 0 + v〉 > 0 P3⇒ 〈0, 0 + v〉+ 〈0 + v, v〉 > 0⇒ P1⇒ 〈0, 0 + v〉+ 〈0, v〉+ 〈v, v〉 > 0 (3) Pelo item (a), 〈0, 0 + v〉 = 〈0, v〉 = 0, além disso, por hipótese 〈v, v〉 = 0. Logo, por 3, concluímos que, 0 + 0̄ + 0̄ > 0⇒ 0 > 0, o que é um absurdo. Portanto, v = 0. (⇐) É caso particular do item (a) para v = 0. � (c) P5: 〈u, v + w〉 = 〈u, v〉+ 〈u,w〉, ∀u, v, w ∈ V . De fato, 〈u, v + w〉 P3= 〈v + w, u〉 P1= 〈v, u〉+ 〈w, u〉 = 〈v, u〉+ 〈w, u〉 P3= 〈u, v〉+ 〈u,w〉 . � (d) P6: 〈u, λv〉 = λ 〈u, v〉, ∀u, v ∈ V e ∀λ ∈ K. De fato, 〈u, λv〉 P3= 〈λv, u〉 P2= λ 〈v, u〉 = λ 〈v, u〉 P3= λ 〈u, v〉 11 � (e) 〈 n ∑ i=1 αiui, m ∑ j=1 βjvj 〉 = n ∑ i=1 m ∑ j=1 αiβj 〈ui, vi〉, ∀ ui, vj ∈ V e ∀ αi, βj ∈ K. De fato, 〈 n ∑ i=1 αiui, m ∑ j=1 βjvj 〉 = 〈α1u1 + α2u2 + . . .+ αnun, β1v1 + β2v2 + . . .+ βmvm〉 P1= 〈α1u1, β1v1 + β2v2 + . . .+ βmvm〉+ . . .+ 〈αnun, β1v1 + β2v2 + . . .+ βmvm〉 P5= 〈α1u1, β1v1〉+ 〈α1u1, β2v2〉+ . . .+ 〈α1u1, βmvm〉+ . . .+ 〈αnun, β1v1〉+ . . .+ 〈αnun, βmvm〉=P2 P6 α1β1 〈u1, v1〉+ α1β2 〈u1, v2〉+ . . .+ α1βm 〈u1, vm〉+ . . .+ αnβ1 〈un, v1〉+ . . .+ αnβm 〈un, vm〉 = n ∑ i=1 m ∑ j=1 αiβj 〈ui, vj〉 . � Exemplo 2.1.1 (a) Produto Interno Canônico em V = K n. Sejam u = (x1, . . . , xn) e v = (y1, . . . , yn). Definimos 〈u, v〉 := n ∑ i=1 xiyi. A seguir verificaremos que esta função define um interno interno em K n, cha- mado de produto interno canônico em K n. P1: Sejam u = (x1, . . . , xn), v = (y1, . . . , yn), w = (z1, . . . , zn) ∈ K n. 〈u+ v, w〉 = 〈(x1, . . . , xn) + (y1, . . . , yn), (z1, . . . , zn)〉 = 〈(x1 + y1, . . . , xn + yn), (z1, . . . , zn)〉 = (x1 + y1)z1 + . . .+ (xn + yn)zn = x1z1 + y1z1 + . . .+ xnzn + ynzn = (x1z1 + x2z2 + . . .+ xnzn) + (y1z1 + y2z2 + . . .+ ynzn) = 〈u,w〉+ 〈v, w〉 P2: Sejam u = (x1, . . . , xn), v = (y1, . . . , yn) ∈ K n e λ ∈ K. 〈λu, v〉 = 〈λ(x1, . . . , xn), (y1, . . . , yn)〉 = 〈(λx1, . . . , λxn), (y1, . . . , yn)〉 = λx1y1 + . . .+ λxnyn = λ(x1y1 + . . .+ xnyn) = λ 〈u, v〉 P3: Sejam u = (x1, . . . , xn), v = (y1, . . . , yn) ∈ K n. 〈u, v〉 = 〈(x1, . . . , xn), (y1, . . . , yn)〉 = x1y1 + . . .+ xnyn = x1y1 + . . .+ xnyn = x1y1 + . . .+ xnyn = y1x1 + . . .+ ynxn = 〈v, u〉 P4: Seja u = (x1, . . . , xn) ∈ K n, u 6= 0. 〈u, u〉 = 〈(x1, . . . , xn), (x1, . . . , xn)〉 Como u 6= 0, existe pelo menos um xi 6= 0, i = 1, . . . , n. Então, 〈u, u〉 = x1x1 + . . . + xnxn = |x1|2 + . . .+ |xn|2 > 0. 12 (b) Produto Interno Canônico em V = Mn(K). Sejam A = (aij) e B = (bij) matrizes de Mn(K). Definimos 〈A,B〉 = n ∑ i,j=1 aijbij (4) A seguir verificaremos que esta função define um interno interno em Mn(K), chamado de produto interno canônico em Mn(K). P1: Sejam A = (aij), B = (bij), C = (cij) ∈ V . 〈A+ C,B〉 = n ∑ i,j=1 (aij + cij)bij = n ∑ i,j=1 (aijbij + cijbij) = n ∑ i,j=1 aijbij + n ∑ i,j=1 cijbij = 〈A,B〉+ 〈C,B〉 P2: Sejam A = (aij), B = (bij) ∈ V e λ ∈ K. 〈λA,B〉 = n ∑ i,j=1 λaijbij = λ n ∑ i,j=1 aijbij = λ 〈A,B〉 P3: Sejam A = (aij), B = (bij) ∈ V . 〈A,B〉 = n ∑ i,j=1 aijbij = n ∑ i,j=1 aijbij = n ∑ i,j=1 aijbij = n ∑ i,j=1 aijbij = n ∑ i,j=1 bijaij = 〈B,A〉 P4: Seja A = (aij) ∈ V . A 6= 0. 〈A,A〉 = n ∑ i,j=1 aijaij = n ∑ i,j=1 |aij |2 Como, A 6= 0, existe pelo menos um aij 6= 0, i, j = 1, . . . , n. Então, 〈A,A〉 = n ∑ i,j=1 |aij |2 > 0. (c) Sejam V e W espaços vetoriais sobre K e 〈 , 〉 um produto interno em V . Se T : W −→ V é uma transformação linear injetora, podemos definir um produto interno de W da seguinte forma: 〈u, v〉T = 〈T (u), T (v)〉 , ∀u, v ∈W. Vamos verificar que 〈 , 〉T é um produto interno de W , ou seja, vamos provar que ele satisfaz as quatro propriedades da definição. P1: Sejam u, v, w ∈W . 〈u+ w, v〉T = 〈T (u+ w), T (v)〉 = 〈T (u) + T (w), T (v)〉 = 〈T (u), T (v)〉+ 〈T (w), T (v)〉 = 〈u, v〉T + 〈w, v〉T P2: Sejam u, v ∈W e λ ∈ K. 〈λu, v〉T = 〈T (λu), T (v)〉 = 〈λT (u), T (v)〉 = λ 〈T (u), T (v)〉 = λ 〈u, v〉T . P3: Sejam u, v ∈W . 〈u, v〉T = 〈T (u), T (v)〉 = 〈T (v), T (u)〉 = 〈v, u〉T . 13 P4: Seja u ∈W , u 6= 0. 〈u, u〉T = 〈T (u), T (u)〉 . (5) Como T é uma transformação linear injetora, então, ker(T ) = {0}, ou seja, se u 6= 0⇒ T (u) 6= 0. Assim, pela propriedade P4 da definição de produto interno 〈T (u), T (u)〉 > 0. (6) Logo, por (5) e (6), 〈u, u〉T > 0. Portanto, 〈 , 〉T é um produto interno em W . (d) Seja V = Mn(K) um espaço vetorial sobre K com produto interno, então, 〈A,B〉 = tr ( B t A ) é um produto interno sobre V . Vamos verificar que ele satisfaz as propriedades da definição. P1 : Sejam A,B,C ∈Mn(C), 〈A+B,C〉 = tr ( C t (A+B) ) = tr ( C t A+ C t B ) = tr ( C t A ) + tr ( C t B ) = 〈A,C〉+ 〈B,C〉 P2 : Sejam A,B ∈Mn(C) e λ ∈ K, 〈λA,B〉 = tr ( B t (λA) ) = tr ( λB t A ) = λtr ( B t A ) = λ 〈A,B〉 P3 : Sejam A,B ∈Mn(C) 〈A,B〉 = tr ( B t A ) = tr ( B t A )t = tr ( B t A )t = tr ( AtB ) = tr ( A t B ) = 〈B,A〉 P4 : Sejam A ∈Mn(C), A 6= 0, 〈A,A〉 = tr ( A t A ) > 0 De fato, seja A = (aij)i,j , então, A t = (aji)i,j . Logo, A t A = (cij)i,j , onde, cij = n ∑ i=1 aijaij = n ∑ i=1 |aij |2 , j = 1, . . . , n Por outro lado, tr ( A t A ) = n ∑ j=1 cjj = n ∑ j=1 n ∑ i=1 |aij |2 Como A 6= 0, existe aij 6= 0, logo, tr ( A t A ) > 0. 2.2 Ortogonalidade 2.2.1 Norma (ou comprimento) de um vetor Definição 2.2.1 Seja V um K-espaço vetorial com um produto interno 〈 , 〉. Para cada v ∈ V , chama- mos de norma de v o número real dado por ‖v‖ = √ 〈v, v〉. Proposição 2.2.1 Seja V um K-espaço vetorial com produto interno 〈 , 〉. (a) ‖u‖ ≥ 0, ∀u ∈ V e ‖u‖ = 0⇔ u = 0. (b) ‖αu‖ = |α| ‖u‖, ∀α ∈ K e ∀u ∈ V 14 Demonstração: (a) É basicamente a propriedade P4 e observação (b) feita logo depois da definição 2.1.1. (b) Da definição de norma, ‖αu‖ = √ 〈αu, αu〉 = √ αα 〈u, u〉. (7) Observe que, na última igualdade utilizamos as propriedades P2 e P6 de produto interno. Como αα = |α|2, ∀α ∈ K, √ αα 〈u, u〉 = √ |α|2 〈u, u〉 = √ |α|2 √ 〈u, u〉 = |α| ‖u‖ . (8) Portanto, de (7) e (8), ‖αu‖ = |α| ‖u‖. � Exemplo 2.2.1 (a) A norma de u = (1, 2) ∈ R 2 em relação ao produto interno canônico definido em R 2 é ‖u‖ = √ 〈u, u〉 = √ 〈(1, 2), (1, 2)〉 = √ 1 · 1 + 2 · 2 = √ 5. (b) Em V = R 2 considere o produto 〈(x1, y1), (x2, y2)〉 := 2x1x2 + 16y1y2. A norma de u = (1, 2) em relação a esse produto interno é |u| = √ 2.1.1 + 16.2.2 = √ 66. (c) Sejam V = R 3 munido de produto interno canônico e, v1 = (x1, y1, z1), v2 = (x2, y2, z2) ∈ V . Se calcularmos a norma de v1 − v2, ‖v1 − v2‖ = √ 〈v1 − v2, v1 − v2〉 = √ 〈(x1 − x2, y1 − y2, z1 − z2), (x1 − x2, y1 − y2, z1 − z2)〉 ⇒ ‖v1 − v2‖ = √ (x1 − x2)2 + (y1 − y2)2 + (z1 − z2)2. Logo, ‖v1 − v2‖ é a distância usual entre dois os pontos v1 e v2 do espaço usual. Portanto, R3 com o produto interno canônico é o espaço euclidiano usual. (d) Generalizando a ideia do exemplo anterior, seja V = R n um R-espaço vetorial com produto interno canônico, temos que a distância entre os vetores u = {x1, x2, . . . , xn} e v = {y1, y2, . . . , yn} é dado por, ‖u− v‖ = √ 〈u− v, u− v〉 = √ 〈(x1 − y1, x2 − y2, . . . , xn − yn), (x1 − y1, x2 − y2, . . . , xn − yn)〉 ⇒ ‖u− v‖ = √ (x1 − y1)2 + (x2 − y2)2 + . . .+ (xn − yn)2 2.2.2 Vetores Ortogonais Definição 2.2.2 Sejam V um espaço vetorial sobre K com produto interno 〈 , 〉 e u, v ∈ V . Diremos que u e v são ortogonais, se 〈u, v〉 = 0. Exemplo 2.2.2 (a) Os vetores u = (2, 1) e v = ( −1 2 , 1 ) são ortogonais em relação ao produto interno canônico de R 2, pois, 〈 (2, 1), ( −1 2 , 1 )〉 = 2. ( −1 2 ) + 1.1 = 0 15 (b) Se considerarmos o produto interno canônico de M2(R) (ver (4) na pág. 13), veremos que as matrizes A = [ 1 0 1 1 ] e B = [ 1 2 0 −1 ] , são ortogonais, pois, 2 ∑ i,j=1 aijbij = a11b11 + a12b12 + a21b21 + a22b22 = 1.1 + 0.2 + 1.0 + 1.(−1) = 0 2.2.3 Conjunto Ortogonal e Conjunto Ortonormal Definição 2.2.3 Sejam V um espaço vetorial sobre K com produto interno 〈 , 〉 e A ⊂ V . Diremos que A é ortogonal se os seus elementos são ortogonais dois a dois; e diremos que A é ortonormal se A for ortogonal e se ‖u‖ = 1, ∀u ∈ A. Quando dois vetores u e v são ortogonais, escreveremos u⊥v. Observação 2.2.1 O vetor nulo u = 0 é ortogonal a todos os elementos de V , pois como já provamos, 〈0, u〉 = 〈u, 0〉 = 0, para todo u ∈ V . Exemplo 2.2.3 (a) As bases canônicas doR 2 eR 3 são conjuntos ortonormais com relação ao produto interno canônico. A base canônica do R 2 é o conjunto B1 = {(1, 0), (0, 1)} e a base canônica do R 3 é o conjunto B2 = {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Em R 2, (1, 0)⊥(0, 1), pois, 〈(1, 0), (0, 1)〉 = 1.0 + 0.1 = 0. Logo B1 é um conjunto ortogonal. Além disso, ‖(1, 0)‖ = √ 〈(1, 0), (1, 0)〉 = √ 12 + 02 = 1, ‖(0, 1)‖ = √ 〈(0, 1), (0, 1)〉 = √ 02 + 12 = 1. Portanto B1 = {(1, 0), (0, 1)} é ortonormal. Em R 3, 〈(1, 0, 0), (0, 1, 0)〉 = 1.1 + 0.1 + 0.0 = 0, 〈(1, 0, 0), (0, 0, 1)〉 = 1.0 + 0.0 + 0.1 = 0, 〈(0, 1, 0), (0, 0, 1)〉 = 0.0 + 1.0 + 0.1 = 0. Portanto, a base canônica do R 3 é um conjunto ortogonal. Além disso, ‖(1, 0, 0)‖ = √ 〈(1, 0, 0), (1, 0, 0)〉 = √ 12 + 02 + 02 = 1, ‖(0, 1, 0)‖ = √ 〈(0, 1, 0), (0, 1, 0)〉 = √ 02 + 12 + 02 = 1, ‖(0, 0, 1)‖ = √ 〈(0, 0, 1), (0, 0, 1)〉 = √ 02 + 02 + 12 = 1. Portanto B2 = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} é ortonormal. (b) Verifique que o conjunto A = {( − √ 2 2 , √ 2 2 ) , (√ 2 2 , √ 2 2 )} é ortonormal em relação ao produto interno canônico do R 2. 16 Antes de tudo para o conjuntoA ser ortonormal, as normas dos vetores ( − √ 2 2 , √ 2 2 ) e (√ 2 2 , √ 2 2 ) têm de ser iguais a 1. ∥ ∥ ∥ ∥ ∥ ( − √ 2 2 , √ 2 2 )∥ ∥ ∥ ∥ ∥ = √ √ √ √ 〈( − √ 2 2 , √ 2 2 ) , ( − √ 2 2 , √ 2 2 )〉 = ( − √ 2 2 )2 + (√ 2 2 )2 = 1 ∥ ∥ ∥ ∥ ∥ (√ 2 2 , √ 2 2 )∥ ∥ ∥ ∥ ∥ = √ √ √ √ 〈(√ 2 2 , √ 2 2 ) , (√ 2 2 , √ 2 2 )〉 = (√ 2 2 )2 + (√ 2 2 )2 = 1 Além disso, ( − √ 2 2 , √ 2 2 ) ⊥ (√ 2 2 , √ 2 2 ) , pois, 〈( − √ 2 2 , √ 2 2 ) , (√ 2 2 , √ 2 2 )〉 = − √ 2 2 √ 2 2 + √ 2 2 √ 2 2 = 0. Portanto, o conjunto A é ortonormal com relação ao produto interno canônico de R 2. 2.2.4 Processo de Ortogonalização de Gram-Schmidt O Processo de Ortogonalização de Gram-Schmidt nos permite obter uma base ortogonal para qualquer K-espaço vetorial V 6= {0} de dimensão finita, a partir de uma base qualquer de V . Antes de explicitar o processo de ortogonalização, demonstraremos algumas propriedades importantes. Proposição 2.2.2 Sejam V um K-espaço vetorial com produto interno e A ⊂ V ortogonal e formado por vetores não nulos. (a) Se v ∈ [v1, . . . , vn], com vi ∈ A, então v = n ∑ i=1 〈v, vi〉 ‖vi‖2 vi. (b) A é linearmente independente. Demonstração: (a) Seja v = n ∑ i=1 αivi, com αi ∈ K, i = 1, . . . , n. Então para j = 1, . . . , n 〈v, vj〉 = 〈 n ∑ i=1 αivi, vj 〉 = 〈α1v1 + . . .+ αjvj + . . .+ αnvn, vj〉 . Utilizando as propriedades da definição de produto interno, 〈v, vj〉 = 〈α1v1, vj〉+ . . .+ 〈αjvj , vj〉+ . . .+ 〈αnvn, vj〉 ⇒ 〈v, vj〉 = α1 〈v1, vj〉+ . . .+ αj 〈vj , vj〉+ . . .+ αn 〈vn, vj〉 . (9) Como B = {v1, . . . , vn} é um conjunto ortogonal, para i 6= j, 〈vi, vj〉 = 0, i = 1, . . . , n. Logo, da igualdade (9), 〈v, vj〉 = αj 〈vj , vj〉 = αj ‖vj‖2 =⇒ αj = 〈v, vj〉 ‖vj‖2 , j = 1, . . . , n. Portanto, v = n ∑ i=1 〈v, vi〉 ‖vi‖2 vi. (b) Sejam α1, . . . , αn ∈ K e v1, . . . , vn ∈ A vetores não nulos tais que α1v1+. . .+αnvn = 0. Devemos mostrar α1 = . . . = αn = 0. Para i = 1, . . . , n, 0 = 〈0, vi〉 = 〈α1v1 + . . .+ αnvn, vi〉 ⇒ 17 0 = 〈α1v1, vi〉+ . . .+ 〈αivi, vi〉+ . . .+ 〈αnvn, vi〉 ⇒ 0 = α1 〈v1, vi〉+ . . .+ αi 〈vi, vi〉+ . . .+ αn 〈vn, vi〉 . Como A é um conjunto ortogonal, para i 6= j, 〈vi, vj〉 = 0, i = 1, . . . , n 0 = αi 〈vi, vi〉 = αi ‖vi‖2 . Por hipótese, vi 6= 0, então, ‖vi‖2 6= 0, logo, αi = 0. Portanto, αi = 〈0, vi〉 ‖vi‖2 = 0, i = 1, . . . , n. � Corolário 2.2.1 Sejam V um K-espaço vetorial com produto interno e B = {v1, . . . , vn} uma base ortonormal de V . Então para todo v ∈ V , v = n ∑ i=1 〈v, vi〉 vi. Demonstração: Aplique o item (a) da Prop. 2.2.2, observe que ‖vi‖ = 1. � Processo de Ortogonalização de Gram-Schmidt. Sejam V um K-espaço vetorial com produto interno 〈 , 〉 e A = {v1, . . . , vn} ⊂ V um conjunto linearmente independente. Construiremos B = {w1, . . . , wn} ⊂ V ortogonal tal que os subespaços gerados por A e B sejam os mesmos. Essa cons- trução é feita pelo seguinte procedimento: • Seja w1 := v1; • Para 1 ≤ k < n, definiremos wk+1 = vk+1 − 〈vk+1, w1〉 ‖w1‖2 w1 − . . .− 〈vk+1, wk〉 ‖wk‖2 wk = = vk+1 − k ∑ j=1 〈vk+1, wj〉 ‖wj‖2 wj . Como B = {w1, . . . , wn} é ortogonal, segue da proposição 2.2.2 que B é linearmente independente. Observe também que, para cada i = 1, . . . , n, wi ∈W = [v1, . . . , vn]. Como dimK W = n, temos que , B é uma base de W , o que mostra que os subespaços gerados por A e B são os mesmos. Exemplo 2.2.4 (a) Considere o R-espaço vetorial V = R 3 com produto interno canônico. Vamos determinar uma base ortogonal B = {w1, w2, w3} para V a partir da base A = {(1, 2, 1), (1, 0, 1), (0, 2, 1)}. Sejam v1 = (1, 2, 1), v2 = (1, 0, 1) e v3 = (0, 2, 1), aplicando o processo de ortogonalização de Gram-Schmidt, w1 = v1 = (1, 2, 1), w2 = (1, 0, 1)− 〈(1, 0, 1), (1, 2, 1)〉 ‖(1, 2, 1)‖2 (1, 2, 1) = (1, 0, 1)− 2 6 (1, 2, 1) = (1, 0, 4)− ( 1 3 ,−2 3 , 1 3 ) ⇒ 18 w2 = ( 2 3 ,−2 3 , 2 3 ) , w3 = (0, 2, 1)− 〈(0, 2, 1), (1, 2, 1)〉 ‖(1, 2, 1)‖2 (1, 2, 1)− 〈 (0, 2, 1), ( 2 3 ,−2 3 , 2 3 )〉 ∥ ∥ ∥ ∥ ( 2 3 ,−2 3 , 2 3 )∥ ∥ ∥ ∥ 2 ( 2 3 ,−2 3 , 2 3 ) ⇒ w3 = (0, 2, 1)− 5 6 (1, 2, 1)− 1 2 ( 2 3 ,−2 3 , 2 3 ) = (0, 2, 1)− ( 5 6 , 10 6 , 5 6 ) + ( 2 6 ,−2 6 , 2 6 ) ⇒ w3 = ( −1 2 , 0, 1 2 ) . Portanto obtemos a seguinte base ortogonal para V = R 3 B = { (1, 2, 1) , ( 2 3 ,−2 3 , 2 3 ) , ( −1 2 , 0, 1 2 )} . (b) Considere o C-espaço vetorial V = C 3 com o seguinte produto interno: 〈(x1, x2, x3), (y1, y2, y3)〉 = 2x1y1 + 4x2y2 + x3y3. Vamos determinar uma base ortogonalB = {w1, w2, w3} deC 3 contendo o vetor (1, 2i, 0). Primeiro consideremos uma base A qualquer de C 3 contendo o vetor (1, 2i, 0). Por exemplo A = {(1, 2i, 0), (0, 1, 0), (0, 0, 1)}. Aplicando o processo de ortogonalização de Gram-Schmidt, w1 = v1 = (1, 2i, 0), e w2 = (0, 1, 0)− 〈(0, 1, 0), (1, 2i, 0)〉 ‖(1, 2i, 0)‖2 (1, 2i, 0) = (0, 1, 0)− 2.0.1 + 4.1.(−2i) + 0.0 2.1.1 + 4.2i.(−2i) + 0.0 (1, 2i, 0)⇒ w2 = (0, 1, 0) + 8i 14 (1, 2i, 0) = (0, 1, 0) + ( 4i 7 ,−8 7 , 0 ) = ( 4i 7 ,−1 7 , 0 ) , w3 = (0, 0, 1)− 〈(0, 0, 1), (1, 2i, 0)〉 ‖(1, 2i, 0)‖2 (1, 2i, 0)− 〈 (0, 0, 1), ( 4i 7 ,−1 7 , 0 )〉 ∥ ∥ ∥ ∥ ( 4i 7 ,−1 7 , 0 )∥ ∥ ∥ ∥ 2 ( 4i 7 ,−1 7 , 0 ) ⇒ w3 = (0, 0, 1) + 0 ‖(1, 2i, 0)‖2 (1, 2i, 0)− 0 ∥ ∥ ∥ ∥ ( 4i 7 ,−1 7 , 0 )∥ ∥ ∥ ∥ 2 ( −4i 7 , 15 7 , 0 ) = (0, 0, 1). Portanto obtemos a seguinte base ortogonal para V = C 3 B = { (1, 2i, 0), ( 4i 7 ,−1 7 , 0 ) , (0, 0, 1) } . A partir do processo de ortogonalização de Gram-Schmidt, podemos enunciar o teorema abaixo que garante que todo K-espaço vetorial V de dimensão finita possui uma base ortonormal. 19 Teorema 2.2.1 Todo K-espaço vetorial V de dimensão finita n ≥ 1 com produto interno possui uma base ortonormal. Demonstração: Sejam V um K-espaço vetorial de dimensão finita e A = {v1, v2, . . . , vn} uma base qualquer de V . Pelo processo de ortogonalização de Gram-Schmidt, podemos determinar uma base B = {w1, w2. . . . , wn} ortogonal a partir de A. Para garantir que esta base seja ortonormal, basta multiplicar cada vetor wi de B por 1 ‖wi‖ , com i = 1, . . . , n. Logo, B = { w1 ‖w1‖ , w2 ‖w2‖ , . . . , wn ‖wn‖ } é uma base ortonormal de V . � Exemplo 2.2.5 Vamos utilizar a base orotogonal encontrada no exemplo anterior item (a) para o R-espaço vetorial V = R 3. A partir da base A = {(1, 2, 1), (1, 0, 1), (0, 2, 1)} encontramos a base ortogonal B = { (1, 2, 1) , ( 2 3 ,−2 3 , 2 3 ) , ( −1 2 , 0, 1 2 )} . Observe que, esta base não é ortonormal, pois, ‖(1, 2, 1)‖ = √ 〈(1, 2, 1) , (1, 2, 1)〉 = √ 6, ∥ ∥ ∥ ∥ ( 2 3 ,−2 3 , 2 3 )∥ ∥ ∥ ∥ = √ 〈( 2 3 ,−2 3 , 2 3 ) , ( 2 3 ,−2 3 , 2 3 )〉 = 2 √ 3 3 , ∥ ∥ ∥ ∥ ( −1 2 , 0, 1 2 )∥ ∥ ∥ ∥ = √ 〈( −1 2 , 0, 1 2 ) , ( −1 2 , 0, 1 2 )〉 = √ 2 2 . Utilizando o teorema 2.2.1, B′ = { 1√ 6 (1, 2, 1) , 3 2 √ 3 ( 2 3 ,−2 3 , 2 3 ) , 2√ 2 ( −1 2 , 0, 1 2 )} é uma base ortonormal para V = R 3. 2.3 Subespaço Ortogonal Definição 2.3.1 Sejam V um K-espaço vetorial com produto interno e S ⊆ V . Chamamos de ortogo- nal a S o conjunto S⊥ := {v ∈ V | 〈v, u〉 = 0,∀u ∈ S} . Proposição 2.3.1 Seja V um K-espaço vetorial com produto interno e S ⊆ V . Então S⊥ é um sub- espaço vetorial de V . Demonstração: Em primeiro lugar, 0 ∈ S⊥, pois como já provamos, 〈0, v〉 = 0,∀v ∈ V . Sejam v1, v2 ∈ S⊥, pela definição, 〈v1, u〉 = 〈v2, u〉 = 0,∀u ∈ S. Assim, por propriedades de produto interno, 〈v1 + v2, u〉 = 〈v1, u〉+ 〈v2, u〉 = 0 + 0 = 0,∀u ∈ S. Logo, v1 + v2 ∈ S⊥. Agora, sejam λ ∈ K e v ∈ S⊥, pela definição, 〈v, u〉 = 0,∀u ∈ S. Assim, por propriedades de produto interno, 〈λv, u〉 = λ 〈v, u〉 = λ0 = 0,∀u ∈ S. 20 Logo, λv ∈ S⊥. Portanto, S⊥ é subespaço vetorial de V . � Observação 2.3.1 • Se S = {0}, então S⊥ = V . • Se S contiver uma base de V , então S⊥ = {0}. 2.4 Transformações Lineares que Preservam Produtos Internos Antes de definir as transformações lineares que preservam produto interno e algumas de suas propri- edades, vamos relembrar a definição de isomorfismo e espaços vetoriais isomorfos. Denotaremos o conjunto das transformações lineares entre dois espaços vetoriais V e W por L(V,W ). Definição 2.4.1 Sejam U e V espaços vetoriais sobre K e T : U −→ V uma transformação linear. (i) Se T for bijetora, diremos que T é um isomorfismo. (ii) Se existir um isomorfismo T : U −→ V , diremos que U e V são espaços vetoriais isomorfos e indicaremos U ∼= V . Definição 2.4.2 Sejam V e W dois K-espaços vetoriais com produto interno. Diremos que uma trans- formação T ∈ L(V,W ) preserva o produto interno se, 〈T (u), T (v)〉 = 〈u, v〉 , ∀ u, v ∈ V. Um isomorfismo entre espaços com produto interno é um isomorfismo que preserva o produto interno. Observação 2.4.1 Uma transformação linear que preserva o produto interno é necessariamente injetora. De fato, para todo v ∈ V , ‖T (v)‖ = 〈T (v), T (v)〉 = 〈v, v〉 = ‖v‖ . Logo, T (v) = 0 implica v = 0, ou seja, T é injetora. Teorema 2.4.1 Sejam V eW doisK-espaços vetoriais de dimensão finita com produto interno, dimKV = dimKW e T ∈ L(V,W ). As afirmações abaixo são equivalentes: (a) T preserva produto interno; (b) T é isomorfismo de espaços com produto interno; (c) T leva toda base ortonormal de V em uma base ortonormal de W . Demonstração: ((a) =⇒ (b)) Se T preserva produto interno, pela observação 2.4.1, T é injetora, então dimK ker(T ) = 0. Utilizando o Teorema de Núcleo e Imagem, dimK V = dimK ker(T ) + dimKIm(T )⇒ dimKV = dimKIm(T ). Por outro lado, dimKV = dimKW = dimKIm(T ). Como Im(T ) é um subespaço de W e ambos de di- mensão finita, podemos concluir que, Im(T ) = W , então, T é sobrejetora. Portanto, T é um isomorfismo que preserva produto interno. 21 ((b) =⇒ (c)) Sejam T um isomorfismo de espaços com produto interno e B = {v1, . . . , vn} uma base ortonormal de V . Então C := {T (v1), . . . , T (vn)} é uma base de W . Como T preserva produto interno, para todo i 6= j, i, j = 1, . . . , n 〈T (vi), T (vj)〉 = 〈vi, vj〉 = 0, e para i = 1, . . . , n ‖T (vi)‖ = √ 〈T (vi), T (vi)〉 = √ 〈vi, vi〉 = ‖vi‖ = 1. Portanto, C é uma base orotonormal de W . ((c) =⇒ (a)) SejaB = {v1, . . . , vn} uma base ortonormal de V , pela hipótese C = {T (v1), . . . , T (vn)} é uma base ortonormal de W . Dados u, v ∈ V , escreva, u = n ∑ i=1 αivi e v = n ∑ j=1 βjvj , onde αi, βj ∈ K. Então 〈u, v〉 = 〈 n ∑ i=1 αivi, n ∑ j=1 βjvj 〉 = 〈α1v1 + . . .+ αnvn, β1v1 + . . .+ βnvn〉 ⇒ 〈u, v〉 = 〈α1v1, β1v1 + . . .+ βnvn〉+ . . .+ 〈αnvn, β1v1 + . . .+ βnvn〉 ⇒ 〈u, v〉 = 〈α1v1, β1v1〉+ . . .+ 〈α1v1, βnvn〉+ . . .+ 〈αnvn, β1v1〉+ . . .+ 〈αnvn, βnvn〉 ⇒ 〈u, v〉 = α1β1 〈v1, v1〉+ . . .+ α1βn 〈v1, vn〉+ . . .+ αnβ1 〈vn, v1〉+ . . .+ αnβn 〈vn, vn〉 . ComoB = {v1, . . . , vn} é uma base ortonormal de V , 〈vi, vi〉 = 1 e 〈vi, vj〉 = 0, para i 6= j, i, j = 1, . . . , n. Logo, 〈u, v〉 = α1β1 + . . .+ αnβn = n ∑ i=1 αiβi. (10) Por outro lado, 〈T (u), T (v)〉 = 〈 T ( n ∑ i=1 αivi ) , T   n ∑ j=1 βjvj   〉 = 〈T (α1v1 + . . .+ αnvn), T (β1v1 + . . .+ βnvn)〉 = = 〈T (α1v1) + . . .+ T (αnvn), T (β1v1) + . . .+ T (βnvn)〉 = = 〈α1T (v1) + . . .+ αnT (vn), β1T (v1) + . . .+ βnT (vn)〉 = = 〈α1T (v1), β1T (v1) + . . .+ βnT (vn)〉+ . . .+ 〈αnT (vn), β1T (v1) + . . .+ βnT (vn)〉 = = 〈α1T (v1), β1T (v1)〉+ . . .+ 〈α1T (v1), βnT (vn)〉+ . . .+ 〈αnT (vn), β1T (v1)〉+ . . .+ 〈αnT (vn), βnT (vn)〉 = = α1β1 〈T (v1), T (v1)〉+ . . .+α1βn 〈T (v1), T (vn)〉+ . . .+αnβ1 〈T (vn), T (v1)〉+ . . .+αnβn 〈T (vn), T (vn)〉 . Como C = {T (v1), . . . , T (vn)} é base ortonormal de W , 〈T (vi), T (vi)〉 = 1 e 〈T (vi), T (vj)〉 = 0, para i 6= j, i, j = 1, . . . , n. Logo, 〈T (u), T (v)〉 = α1β1 + . . .+ αnβn = n ∑ i=1 αiβi. (11) Assim, por (10) e (11), 〈T (u), T (v)〉 = 〈u, v〉, para todo u, v ∈ V , ou seja, T preserva produto interno. � 22 3 OPERADORES ADJUNTOS 3.1 Funcionais Lineares Definição 3.1.1 Seja V um K-espaço vetorial. Um funcional linear f : V −→ K é uma transformação linear entre os espaços vetoriais V e K, ou seja, é uma função f : V −→ K tal que, P1: f(u+ v) = f(u) + f(v), u, v ∈ V P2: f(λv) = λf(v), λ ∈ K, v ∈ V Observação 3.1.1 O conjunto L(V,K) := V ∗ dos funcionais lineares, conhecido como Espaço Dual, é um espaço vetorial sobre K. Definição 3.1.2 Sejam V um K-espaço vetorial com produto interno e w ∈ V . A partir do vetor w, definimos um funcional linear em V ∗ da seguinte maneira fw : V −→ K u 7−→ fw(u) = 〈u,w〉 . Observação 3.1.2 Pelas propriedades do produto interno, fw é linear. 3.2 Operadores Adjunto Proposição 3.2.1 Seja V um K-espaço vetorial com produto interno e de dimensão finita n ≥ 1. Se f ∈ V ∗, então existe um único w ∈ V tal que f(u) = 〈u,w〉, para todo u ∈ V . Demonstração: Pelo teorema 2.2.1, da página 19, V possui uma base ortonormalB = {v1, v2, . . . , vn}. Considere o vetor w = n ∑ i=1 αivi ∈ V e vamos calcular fw(vj) como definida acima. fw(vj) = 〈 vj , n ∑ i=1 αivi 〉 = 〈vj , α1v1 + . . .+ αjvj + . . .+ αnvn〉 ⇒ fw(vj) = 〈vj , α1v1〉+ . . .+ 〈vj , αjvj〉+ . . . 〈αnvn〉 ⇒ fw(vj) = α1 〈vj , v1〉+ . . .+ αj 〈vj , vj〉+ . . .+ αn 〈vj , vn〉 . (12) Como B é uma base ortonormal, concluímos αj = fw(vj). (13) Logo, w = n ∑ j=1 fw(vj)vj . (14) Mostraremos f = fw, ou seja, dado u ∈ V , f(u) = fw(u) = 〈u,w〉: fw(vk) = 〈vk, w〉 = 〈 vk, n ∑ j=1 f(vk)vk 〉 = 〈 vk, f(v1)v1 + . . .+ f(vj)vj + . . .+ f(vn)vn 〉 = 23 〈 vk, f(v1)v1 〉 + . . .+ 〈 vk, f(vk)vk 〉 + . . .+ 〈 vk, f(vn)vn 〉 = f(v1) 〈vk, v1〉+ . . .+ f(vk) 〈vk, vk〉+ . . .+ f(vn) 〈vk, vn〉 . (15) Como B é uma base ortonormal, fw(vk) = f(vk) 〈vk, vk〉 = f(vk). Ou seja, f e fw coincidem em B, então f = fw. Para a unicidade, suponha que existam w1, w2 ∈ V tais que f = fw1 = fw2 . Em particular fw1 (w1 − w2) = fw2 (w1 − w2)⇒ 〈w1 − w2, w1 − w2〉 = 0. Portanto w1 = w2. � Teorema 3.2.1 Seja V um K-espaço vetorial com produto interno e de dimensão finita. Se T ∈ L(V, V ), então existe um único operador T ∗ ∈ L(V, V ), tal que 〈T (u), v〉 = 〈u, T ∗(v)〉, para todo u, v ∈ V . Demonstração: Dado v ∈ V , considere o funcional linear fv: f = fv : V −→ K u 7−→ f(u) = 〈T (u), v〉 . Claramente f é linear. Utilizando a proposição 3.2.1, sabemos que existe w ∈ V tal que f(u) = 〈u,w〉, para todo u ∈ V . Logo, 〈T (u), v〉 = 〈u,w〉, para todo u ∈ V . E como w é determinado de modo único por v, podemos definir T ∗(v) = w. (16) Logo, 〈T (u), v〉 = 〈u, T ∗(v)〉 , ∀u, v ∈ V. Falta mostrar que T ∗ é linear. Sejam u, v1, v2 ∈ V e λ ∈ K, 〈u, T ∗(v1 + λv2)〉 = 〈T (u), v1 + λv2〉 = 〈T (u), v1〉+ 〈T (u), λv2〉 = 〈T (u), v1〉+ λ 〈T (u), v2〉 ⇒ 〈u, T ∗(v1 + λv2)〉 = 〈u, T ∗(v1)〉+ λ 〈u, T ∗(v2)〉 = 〈u, T ∗(v1)〉+ 〈u, λT ∗(v2)〉 ⇒ 〈u, T ∗(v1 + λv2)〉 = 〈u, T ∗(v1) + λT ∗(v2)〉 ⇒ 〈u, T ∗(v1 + λv2)〉 − 〈u, T ∗(v1) + λT ∗(v2)〉 = 0⇒ 〈u, T ∗(v1 + λv2)− T ∗(v1)− λT ∗(v2)〉 = 0. Como o vetor nulo é o único vetor ortogonal a todos os elementos de um K-espaço vetorial V , então T ∗(v1 + λv2)− T ∗(v1)− λT ∗(v2) = 0. Logo, T ∗(v1 + λv2) = T ∗(v1) + λT ∗(v2) e, portanto, T ∗ é linear. � Definição 3.2.1 Seja T ∈ L(V, V ), onde V é um K-espaço vetorial com produto interno. Diremos que T possui um adjunto se existir um operador linear T ∗ ∈ L(V, V ) tal que 〈T (u), v〉 = 〈u, T ∗(v)〉, para todo u, v ∈ V . Neste caso T ∗ é chamado do adjunto de T . 24 Observação 3.2.1 Note que dadas uma base ortonormal B = {v1, v2, . . . , vn} de um K-espaço vetorial V com produto interno e T ∈ L(V, V ), T ∗ pode ser escrito explicitamente: combinando os resultados da proposição 3.2.1 e do teorema 3.2.1, T ∗(v) = n ∑ j=1 〈T (vj), v〉vj , ∀v ∈ V. (17) Exemplo 3.2.1 (a) Seja V = Mn(C) um C-espaço vetorial com produto interno dado por 〈A,B〉 = tr(B t A), para A,B ∈ V . Assim, dada uma matriz M ∈Mn(C), defina o operador linear TM : V −→ V A 7−→ TM (A) = MA . Para determinar o adjunto de T , observe 〈TM (A), B〉 = 〈MA,B〉 = tr ( B t (MA) ) = tr (( B t M ) A ) = tr ( ( M tB )t A ) . Pela propriedade de conjugado: z = z, ∀z ∈ C, 〈TM (A), B〉 = tr ( ( M tB ) t A ) = tr ( ( M tB )t A ) = 〈 A,M t B 〉 ⇒ 〈TM (A), B〉 = 〈 A,M t B 〉 , portanto, T ∗ M (B) = M t B. (b) Considere V = C 2 como C-espaço vetorial e T ∈ L(V, V ) o operador dado por T (1, 0) = (1 + i, 2) e T (0, 1) = (i, i). Considerando em C 2 o produto interno canônico, vamos determinar T ∗. Para isso, observe que B = {(1, 0), (0, 1)} é uma base de V e nessa base (x, y) = x(1, 0)+y(0, 1), portanto T (x, y) = T (x(1, 0) + y(0, 1)) = xT (1, 0) + yT (0, 1) = x(1 + i, 2) + y(i, i), ou seja, T (x, y) = ((1 + i)x+ iy, 2x+ iy) (18) Agora, vamos determinar o adjunto T ∗. Sejam u = (x1, y1), v = (x2, y2) ∈ V , 〈T (u), v〉 = 〈T (x1, y1), (x2, y2)〉 = 〈((1 + i)x1 + iy1, 2x1 + iy1), (x2, y2)〉 ⇒ 〈T (u), v〉 = ((1 + i)x1 + iy1)x2 + (2x1 + iy1) y2 = (1 + i)x1x2 + iy1x2 + 2x1y2 + iy1y2 ⇒ 〈T (u), v〉 = x1 ((1 + i)x2 + 2y2) + y1 (ix2 + iy2) = x1((1 + i)x2 + 2y2) + y1(ix2 + iy2)⇒ 〈T (u), v〉 = x1((1− i)x2 + 2y2) + y1(−ix2 − iy2) = 〈(x1, y1), ((1− i)x2 + 2y2,−ix2 − iy2)〉 ⇒ 〈T (u), v〉 = 〈u, T ∗(v)〉 . Portanto, T ∗(v) = ((1− i)x2 + 2y2,−ix2 − iy2). Proposição 3.2.2 Sejam V um K-espaço vetorial com produto interno, T, S ∈ L(V, V ) operadores lineares que admitem adjuntos T ∗ e S∗, respectivamente e λ ∈ K. Então, (a) T + S admite adjunto (T + S)∗ = T ∗ + S∗; (b) λT admite adjunto (λT )∗ = λT ∗; 25 (c) T ◦ S admite adjunto (T ◦ S)∗ = S∗ ◦ T ∗; (d) T ∗ admite adjunto (T ∗)∗ = T . Demonstração: (a) Sejam u, v ∈ V , 〈(T + S)(u), v〉 = 〈T (u) + S(u), v〉 = 〈T (u), v〉+ 〈S(u), v〉 ⇒ 〈(T + S)(u), v〉 = 〈u, T ∗(v)〉+ 〈u, S∗(v)〉 = 〈u, T ∗(v) + S∗(v)〉 = 〈u, (T ∗ + S∗)(v)〉 . Portanto, T + S admite adjunto e (T + S)∗ = T ∗ + S∗. (b) Sejam u, v ∈ V e λ ∈ K, 〈(λT )(u), v〉 = 〈λT (u), v〉 = λ 〈T (u), v〉 = λ 〈u, T ∗(v)〉 = 〈 u, λT ∗(v) 〉 . Isto é, λT admite adjunto (λT )∗ e (λT )∗ = λT ∗. (c) Sejam u, v ∈ V , 〈(T ◦ S)(u), v〉 = 〈T (S(u)), v〉 = 〈S(u), T ∗(v)〉 = 〈u, S∗(T ∗(v))〉 = 〈u, (S∗ ◦ T ∗)(v)〉 . Ou seja, T ◦ S admite adjunto (T ◦ S)∗ e (T ◦ S)∗ = S∗ ◦ T ∗. (d) Sejam u, v ∈ V , 〈T ∗(u), v〉 = 〈v, T ∗(u)〉 = 〈T (v), u〉 = 〈u, T (v)〉 . Portanto, (T ∗)∗ = T . � Observação 3.2.2 Dado um K-espaço vetorial V com produto interno. Claramente para todo u, v ∈ V , 〈0, v〉 = 〈u, 0〉 . Logo, o operador nulo admite adjunto, e é o próprio operador nulo. Note também, dados T, S ∈ L(V, V ), tais que, T e S admitem adjuntos T ∗ e S∗, respectivamente, e λ ∈ K, e utilizando o resultado da proposição 3.2.2, (λT + S)∗ = (λT )∗ + S∗ = λT ∗ + S∗ Portanto, concluímos que o conjunto dos operadores que admitem adjunto é um subespaço vetorial de L(V, V ). 3.3 Matriz de uma Transformação Linear e Operadores Adjunto Nesta seção vamos ver como podemos determinar um operador adjunto T ∗ de T utilizando as matrizes de uma transformação linear [T ]B . Proposição 3.3.1 Sejam V um K-espaço vetorial com produto interno e de dimensão finita, B = {v1, . . . , vn} uma base ortonormal de V e T ∈ L(V, V ). Se a matriz da transformação linear [T ]B = (aij)i,j , então aij = 〈T (vj), vi〉, para todo i, j = 1, . . . , n. 26 Demonstração: Pela definição de matriz da transformação linear, T (vj) = n ∑ i=1 aijvi, j = 1, . . . , n. (19) Por outro lado, como B é uma base ortonormal, pelo corolário 2.2.1, todo vetor v ∈ V pode ser escrito como v = n ∑ i=1 〈v, vi〉 vi. (20) Em particular, podemos escrever, os vetores T (vj) utilizando (20), T (vj) = n ∑ i=1 〈T (vj), vi〉 vi, j = 1, . . . , n. (21) Comparando as equações (19) e (21), concluímos, aij = 〈T (vj), vi〉 , i, j = 1, . . . , n. � O próximo teorema nos mostra uma maneira de calcular o operador T ∗ através da matriz de uma transformação linear T . Teorema 3.3.1 Sejam V um K-espaço vetorial com produto interno de dimensão finita, T ∈ L(V, V ) e B = {v1, . . . , vn} uma base ortonormal de V . Então [T ∗]B = [T ] t B . Demonstração: Sejam [T ]B = (aij)i,j e [T ∗]B = (cij)i,j . Utilizando o resultado da proposição 3.3.1, para i, j = 1, . . . , n aij = 〈T (vj), vi〉 , cij = 〈T ∗(vj), vi〉 . Assim, utilizando a propriedade P3 de produto interno e a definição de T ∗, cij = 〈T ∗(vj), vi〉 = 〈vi, T ∗(vj)〉 = 〈T (vi), vj〉 = aji. Portanto, [T ] t B = [T ∗]B . � Exemplo 3.3.1 Sejam V = C 3 com produto interno canônico e T : C3 −→ C 3 dada por T (x) = (x + 2y, iz, y − iz). Determinaremos T ∗ utilizando como base ortonormal B = {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Primeiro vamos determinar a matriz da transformação T em relação a base B: T (1, 0, 0) = (1, 0, 0) = 1(1, 0, 0) + 0(0, 1, 0) + 0(0, 0, 1), T (0, 1, 0) = (2, 0, 1) = 2(1, 0, 0) + 0(0, 1, 0) + 1(0, 0, 1), T (0, 0, 1) = (0, i,−i) = 0(1, 0, 0) + i(0, 1, 0)− i(0, 0, 1). Logo, [T ]B =    1 2 0 0 0 i 0 1 −i    , 27 e pelo teorema 3.3.1, [T ∗]B = [T ] t B =    1 0 0 2 0 1 0 −i i    . Portanto, T ∗(x, y, z) = (x, 2x+ z,−iy + iz) 3.4 Operadores Auto-Adjuntos Definição 3.4.1 Sejam V um K-espaço vetorial com produto interno e T ∈ L(V, V ). Dizemos que T é auto-adjunto se T admite adjunto e T ∗ = T . Observação 3.4.1 Na definição de operador auto-adjunto acima, diremos, no caso de K = C, que T é hermitiano e, no caso de K = R, que T é simétrico. Proposição 3.4.1 Sejam V umK-espaço vetorial com produto interno de dimensão finita e T ∈ L(V, V ). Então T é auto-adjunto se, e somente se, [T ] t B = [T ]B , para toda base ortonormal B de V . Demonstração: É consequência direta do teorema 3.3.1. � Exemplo 3.4.1 (a) Considere C-espaço vetorial C2 com produto interno canônico e T : C2 −→ C 2 dada por, T (z, w) = (2z + (1 + i)w, (1− i)z + 3w), ∀z, w ∈ C. Na base canônica B = {(1, 0), (0, 1)} de C 2, T (1, 0) = (2, 1− i) = 2(1, 0) + (1− i)(0, 1), T (0, 1) = (1 + i, 3) = (1 + i)(1, 0) + 3(0, 1). Logo, [T ]B = [ 2 1 + i 1− i 3 ] = [T ] t B = [T ∗]B . Portanto, pela proposição 3.4.1 T é um operador auto-adjunto. (b) Considere C-espaço vetorial C2 com produto interno canônico e T : C2 −→ C 2 dada por, T (x, y) = (ix+ iy, 2x− iy), ∀x, y ∈ C, não é auto-adjunto, pois: na base canônica, T (1, 0) = (i, 2) = i(1, 0) + 2(0, 1), T (0, 1) = (i,−i) = i(1, 0)− i(0, 1). Logo, [T ]B = [ i i 2 −i ] . 28 Por outro lado, [T ] t B = [ −i 2 −i i ] . Ou seja, [T ]B 6= [T ] t B . Lema 3.4.1 Sejam V um C-espaço vetorial com produto interno e T ∈ L(V, V ). As afirmações abaixo são equivalentes: (i) T = 0, (ii) 〈T (u), u〉 = 0, ∀u ∈ V , (iii) 〈T (u), v〉 = 0, ∀u, v ∈ V . Demonstração: (i) =⇒ (ii) é óbvio. (ii) =⇒ (iii) Dados u, v ∈ V e α, β ∈ C, considere w = αu + βv ∈ V . Por hipótese, 〈T (w), w〉 = 0, então, 0 = 〈T (w), w〉 = 〈T (αu+ βv), αu+ βv〉. Utilizando as propriedades de transformação linear e produto interno, 0 = 〈T (αu+ βv), αu+ βv〉 = 〈T (αu) + T (βv), αu+ βv〉 = 〈αT (u) + βT (v), αu+ βv〉 = = 〈αT (u), αu+ βv〉+ 〈βT (v), αu+ βv〉 = 〈αT (u), αu〉+ 〈αT (u), βv〉+ 〈βT (v), αu〉+ 〈βT (v), βv〉 = = αα 〈T (u), u〉+ αβ 〈T (u), v〉+ βα 〈T (v), u〉+ ββ 〈T (v), v〉 ⇒ αβ 〈T (u), v〉+ βα 〈T (v), u〉 = 0. (22) Como a igualdade (22), vale para qualquer α, β ∈ C, considere as seguintes situações: • α = β = 1 =⇒ 〈T (u), v〉+ 〈T (v), u〉 = 0. • α = i, β = 1 =⇒ i 〈T (u), v〉 − i 〈T (v), u〉 = 0. Resolvendo o sistema com as equações obtidas acima, concluímos 〈T (u), v〉 = 〈T (v), u〉 = 0, ∀u, v ∈ V como queríamos. (iii) =⇒ (i) Tome v := T (u). Logo, 〈T (u), T (u)〉 = 0, ∀u ∈ V . Portanto, T (u) = 0, ∀u ∈ V . � Proposição 3.4.2 Sejam V um C-espaço vetorial com produto interno e T ∈ L(V, V ). Então T é um operador hermitiano se, e somente se, 〈T (v), v〉 ∈ R, ∀v ∈ V . Demonstração: (=⇒) Se T é hermitiano, então T admite adjunto e, T = T ∗, ou seja, 〈T (v), v〉 = 〈v, T ∗(v)〉 = 〈v, T (v)〉 = 〈T (v), v〉, ou seja, 〈T (v), v〉 = 〈T (v), v〉, ∀v ∈ V , que é possível somente quando 〈T (v), v〉 é um número real. (⇐=) Para todo v ∈ V , 〈T (v), v〉 = 〈T (v), v〉 = 〈v, T ∗(v)〉 = 〈T ∗(v), v〉, então 〈T (v), v〉 − 〈T ∗(v), v〉 = 0⇒ 〈T (v)− T ∗(v), v〉 = 0, ∀v ∈ V. Pelo lema 3.4.1, T (v)− T ∗(v) = 0, então, T (v) = T ∗(v), para todo v ∈ V , como queríamos. � 29 Observação 3.4.2 • Note que o lema 3.4.1 e a proposição 3.4.2 não são válidas sobre R-espaços vetoriais. • Seja B uma base ortonormal de um C-espaço vetorial com produto interno. Lembre-se que, pela proposição 3.3.1, as entradas da matriz [T ]B são dadas por aij = 〈T (vj), vi〉, para todo i, j = 1, . . . , n. Logo, pela proposição 3.4.2 as entradas da diagonal principal, aii = 〈T (vi), vi〉 ∈ R. 3.5 Operadores Unitários Definição 3.5.1 Sejam V um K-espaço vetorial com produto interno e T ∈ L(V, V ). Diremos que T é unitário, se T for um isomorfismo de espaços com produto interno. Observação 3.5.1 Inverso e composição de operadores unitários, são operadores unitários. Proposição 3.5.1 Seja T ∈ L(V, V ), onde V é um K-espaço vetorial com produto interno. Então, T é unitário se, e somente se, possui adjunto T ∗ e T ∗ = T−1. Demonstração: (=⇒) Seja T é unitário. Para todo u, v ∈ V , 〈T (u), v〉 = 〈 T (u), (T ◦ T−1)(v) 〉 = 〈 T (u), T (T−1(v)) 〉 = 〈 u, T−1(v) 〉 . Portanto, T possui adjunto T ∗ = T−1. (⇐=) Falta provar que T preserva produto interno. Sejam u, v ∈ V , 〈T (u), T (v)〉 = 〈u, T ∗(T (v))〉 = 〈u, (T ∗ ◦ T )(v)〉 = 〈u, Id(v)〉 = 〈u, v〉 . Portanto, T é um isomorfismo que preserva produto interno. � Exemplo 3.5.1 Considere V = Mn×1(C) com produto interno 〈M,N〉 = N t M , onde M,N ∈ V e seja A ∈ Mn×n(C). Definimos T : V −→ V por T (X) = AX. Vamos calcular 〈T (X), T (Y )〉, para todo X,Y ∈ V 〈T (X), T (Y )〉 = 〈AX,AY 〉 = (AY )t(AX) = Y t A t AX. Portanto, podemos concluir que T é unitário se, e somente se, A t A = Id. A partir do exemplo 3.5.1 retiramos a seguinte definição. Definição 3.5.2 Diremos que A ∈ Mn(K) é unitária se AA t = A t A = Id. Se K = R, diremos que A é ortogonal. Exemplo 3.5.2 Vamos descrever todas as matrizes ortogonais 2× 2. Considere A = ( a b c d ) ∈M2(R), 30 Pela definição, A é ortogonal se AA t = A t A = Id2, ou seja, A t = At = A−1, pois a, b, c, d ∈ R. Assim, como det (Id2) = 1, 1 = det (Id2) = det (A−1A) = det (A−1) det (A) = det (At) det (A) = (det (A))2 ⇒ det (A) = ±1. Por outro lado, At = ( a c b d ) . (23) Caso det (A) = 1, A−1 = ( d −b −c a ) , (24) ou caso det (A) = −1, A−1 = ( −d b c −a ) . (25) Utilizando o fato que At = A−1 e comparando as matrizes (23), (24) e (25), se det (A) = 1 A = ( a b −b a ) com a2 + b2 = 1, (26) e se det (A) = −1, A = ( a b b −a ) com a2 + b2 = 1. (27) Como a, b ∈ R, existe um ângulo θ, 0 ≤ θ < 2π, com a = cos θ e b = senθ. Portanto, as matrizes ortogonais 2× 2 são da forma A = ( cos θ senθ −senθ cos θ ) , 0 ≤ θ < 2π. ou, A = ( cos θ senθ senθ − cos θ ) , 0 ≤ θ < 2π. 3.6 Operadores Normais Definição 3.6.1 Sejam V um espaço vetorial com produto interno e T ∈ L(V, V ). Diremos que T é normal se existir T ∗ e T ◦ T ∗ = T ∗ ◦ T . Observação 3.6.1 (a) Todo operador auto-adjunto é normal, pois pela definição T ∗ = T . (b) Todo múltiplo escalar de um operador normal é normal. De fato, sejam V um K-espaço vetorial com produto interno e T ∈ L(V, V ) com T operador normal e α ∈ K. Utilizando o resultado da proposição 3.2.2, (αT )∗ ◦ (αT ) = (αT ∗) ◦ (αT ) = αα(T ∗ ◦ T ) = αα(T ◦ T ∗) = (αT ) ◦ (αT ∗) = (αT ) ◦ (αT )∗. Portanto, αT é normal. Exemplo 3.6.1 31 Considere em C 2 o produto interno usual e seja T : C2 −→ C 2 dada por T (z, w) = (z+ iw, z− iw), para todo z, w ∈ C. Para determinar T ∗, pela observação 3.2.1, na base canônica B = {(1, 0), (0, 1)} de C 2, T ∗(z, w) = 2 ∑ j=1 〈T (vj), (z, w)〉vj ⇒ T ∗(z, w) = 〈T (1, 0), (z, w)〉(1, 0) + 〈T (0, 1), (z, w)〉(0, 1) = 〈(1, 1), (z, w)〉(1, 0) + 〈(i,−i), (z, w)〉(0, 1)⇒ T ∗(z, w) = (z + w)(1, 0) + (−iz + iw)(0, 1) = (z + w, 0) + (0,−iz + iw)⇒ T ∗(z, w) = (z + w,−iz + iw), para todo z, w ∈ C. Agora, fazendo T ◦ T ∗ e T ∗ ◦ T , (T ◦ T ∗)(z, w) = T (T ∗(z, w)) = T (z + w,−iz + iw) = = ((z+w) + i(−iz+ iw), (z+w)− i(−iz+ iw)) = (z+w+ z−w, z+w− z+w) = (2z, 2w) = 2(z, w)⇒ T ◦ T ∗ = 2Id. E (T ∗ ◦ T )(z, w) = T ∗(T (z, w)) = T ∗(z + iw, z − iw) = = (z+ iw+ z− iw,−i(z+ iw) + i(z− iw)) = (z+ iw+ z− iw,−iz+w+ iz+w) = (2z, 2w) = 2(z, w)⇒ T ∗ ◦ T = 2Id. Portanto, T é um operador normal. Proposição 3.6.1 Sejam V um K-espaço vetorial com produto interno e T ∈ L(V, V ) um operador normal. Então, (a) ‖T (v)‖ = ‖T ∗(v)‖ , ∀v ∈ V ; (b) Se T (v) = αv para α ∈ K e v ∈ V , então, T ∗(v) = αv. ∀v ∈ V ; (c) Se T (v1) = α1v1 e T (v2) = α2v2, para v1, v2 ∈ V e α1, α2 ∈ K, com α1 6= α2, então, 〈v1, v2〉 = 0. Demonstração: (a) Seja v ∈ V . Utilizando a definição de operador adjunto, as propriedades da definição de produto interno e a condição que T é normal, 〈T (v), T (v)〉 = 〈v, T ∗(T (v))〉 = 〈v, T (T ∗(v))〉 = 〈T (T ∗(v)), v〉. Como 〈T (v), T (v)〉 é um número real, segue que, 〈T (v), T (v)〉 = 〈T (T ∗(v)), v〉 = 〈T (T ∗(v)), v〉 = 〈T ∗(v), T ∗(v)〉 . Portanto, ‖T (v)‖ = ‖T ∗(v)‖. (b) Se T (v) = αv, para todo v ∈ V e α ∈ K, então, (T − αId)(v) = 0, pois, (T − αId)(v) = T (v)− (αId)(v) = T (v)− αId(v) = αv − αv = 0. Assim podemos concluir que ‖(T − αId)(v)‖ = 0. Utilizando o resultado do item (a), ‖(T − αId)∗(v)‖ = 0, então, (T − αId)∗(v) = 0. Logo, utilizando as propriedades da proposição 3.2.2, (T − αId)∗(v) = T ∗(v)− (αId)∗(v) = T ∗(v)− αId∗(v) = T ∗(v)− αv = 0⇒ T ∗(v) = αv. 32 Portanto, T ∗(v) = αv, para todo v ∈ V e α ∈ K. (c) Para v1, v2 ∈ V e α1, α2 ∈ K, pela definição de adjunto, 〈T (v1), v2〉 = 〈v1, T ∗(v2)〉. Como T (v2) = α2v2, pelo item (b), T ∗(v2) = α2v2, então, 〈T (v1), v2〉 = 〈v1, T ∗(v2)〉 = 〈v1, α2v2〉 = α2 〈v1, v2〉 . (28) Por outro lado, 〈T (v1), v2〉 = 〈αv1, v2〉 = α1 〈v1, v2〉 . (29) Logo, por (28), (29), α1 〈v1, v2〉 = α2 〈v1, v2〉 ⇒ α1 〈v1, v2〉 − α2 〈v1, v2〉 = 0⇒ (α1 − α2) 〈v1, v2〉 = 0. Como α1 6= α2, 〈v1, v2〉 = 0 � Definição 3.6.2 Sejam V um espaço vetorial sobre K de dimensão finita, T : V −→ V um operador linear e C uma base de V . (a) Um autovalor de T é λ ∈ K tal que existe um vetor não nulo v ∈ V com T (v) = λv. (b) Se λ é um autovalor de T , então todo vetor não nulo v ∈ V tal que T (v) = λv é chamado de autovetor de T associado a λ. Denotaremos por AutT (λ) o subespaço de V gerado por todos os autovetores associados a λ. (c) Suponha que dimK V = n <∞. Diremos que T é diagonalizável se existir uma base B tal que [T ]B é diagonal, o que é equivalente a dizer que existe uma base formada por autovetores de T . (d) Chamamos o polinômio pT (x) = det([xId− T ]C) de polinômio característico de T . Teorema 3.6.1 Seja V um K-espaço vetorial de dimensão finita com produto interno. Se T ∈ L(V, V ) é auto-adjunto, então, T possui um autovetor real. Demonstração: Se K = C então, pelo teorema fundamental de álgebra, o polinômio característico pT possui raízes e elas são os autovalores de T . Se K = R, considere B uma base ortonormal de V e A = [T ]B . Como T = T ∗, pelo teorema 3.3.1, A = A t . Considere W = Mn×1(C) com produto interno 〈X,Y 〉 = Y t X e S : W → W o operador linear dado por S(X) = AX. Sabemos, pelo exemplo 3.5.1, que S∗(X) = A t X = AX e, portanto, S é auto-adjunto. Por outro lado, pT = pS . Seja α uma raiz de pS , como W é um espaço vetorial sobre C, segue que α é um autovalor de S. Falta provar que α ∈ R. De fato, se v 6= 0 for um autovetor associado ao autovalor α, então, 〈S(v), v〉 = 〈αv, v〉 = α 〈v, v〉 . Por outro lado, 〈S(v), v〉 = 〈v, S∗(v)〉 = 〈v, S(v)〉 = 〈v, αv〉 = α 〈v, v〉 . Ou seja, α 〈v, v〉 = α 〈v, v〉 ⇒ α 〈v, v〉 − α 〈v, v〉 = 0⇒ (α− α) 〈v, v〉 = 0. Como 〈v, v〉 6= 0, então, α − α = 0. Logo, α = α e, portanto, α ∈ R. Além disso, α é uma raiz de pT (x) e, portanto, α é um autovalor de T . � A definição a seguir vem da necessidade de restrição de uma operador linear T : V −→ V a um determinado subespaço W ⊆ V , pois nem sempre a imagem desta restrição está contida no próprio subespaço. 33 Definição 3.6.3 Seja V um K-espaço vetorial e W ⊆ V um subespaço de V . Dizemos que W é um subespaço T -invariante de V se, para todo w ∈W , T (w) ∈W . Lema 3.6.1 Sejam V um K-espaço vetorial com produto interno e de dimensão finita e T ∈ L(V, V ). Se W é um subespaço T -invariante de V , então W⊥ é T ∗-invariante. Demonstração: Temos de mostrar que T ∗(w) ∈ W⊥, para todo w ∈ W⊥, ou seja, dado v ∈ W , então, 〈v, T ∗(w)〉 = 0. Sejam v ∈W e w ∈W⊥. Por hipótese, W é T − invariante, então, pela definição 3.6.3, T (v) ∈W . Logo, 〈T (v), w〉 = 0. Assim, se T admite adjunto T ∗, 0 = 〈T (v), w〉 = 〈v, T ∗(w)〉 ⇒ 〈v, T ∗(w)〉 = 0. Portanto, W⊥ é T ∗-invariante. � Vamos utilizar o teorema 3.6.1 e o lema 3.6.1 dados acima para mostrar que se T é um operador auto-adjunto em L(V, V ), então V tem uma base ortonormal formada por autovetores de T . Proposição 3.6.2 Seja V um K-espaço vetorial com produto interno e de dimensão finita. Se T ∈ L(V, V ) é auto-adjunto, então, existe uma base ortonormal de V cujos vetores são autovetores de T . Demonstração: Suponha dimK V = n ≥ 1, então, pelo teorema 3.6.1, T possui um autovetor v1. Vamos utilizar o processo de indução finita para demonstrar esse teorema. Se n = 1, então, { v1 ‖v1‖ } é uma base ortonormal, como queríamos. Agora vamos supor, por hipótese de indução, que n > 1 e que o resultado vale para todo espaço vetorial de dimensão n − 1. Seja W = [v1], então W é T -invariante, pois, para w = λv1 ∈ W , λ ∈ K, T (w) = T (λv1) = λT (v1) = λαv1, α ∈ K, então, T (w) ∈ W . Logo, pelo lema 3.6.1, W⊥ é T ∗-invariante. Então, como T é auto-adjunto, ou seja, T = T ∗, W⊥ é T -invariante. Assim, como W⊥ é um espaço de dimensão n− 1 segue da hipótese de indução que W⊥ possui uma base ortonormal {v2, . . . , vn} formada por autovetores. Logo, B = { v1 ‖v1‖ , v2, . . . , vn } é uma base de V . Por construção, todos os elementos de B são autovetores e o resultado está provado. � Teorema 3.6.2 Sejam V um C-espaço vetorial com produto interno e de dimensão finita e T ∈ L(V, V ). Então, T será um operador normal se e somente se existir uma base ortonormal de V cujos vetores sejam autovetores de T . Demonstração: (=⇒) Como V é um espaço vetorial complexo, então, V possui um autovetor v1. Sem perda de generalidade, podemos supor que ‖v1‖ = 1. Considere W = [v1]. Assim, W é T -invariante. Da proposição 3.6.1, segue que, v1 é autovetor de T ∗ e portanto W é T ∗-invariante. Pelo lema 3.6.1, concluímos que W⊥ é invariante por T ∗∗ = T . A restrição de T a W⊥ é um operador normal. Utilizando raciocínio análogo ao da proposição 3.6.2, ou seja, por indução finita, mostramos que existe uma base ortonormal de autovetores de T . (⇐=) Suponha que exista uma base ortonormal B = {v1, . . . , vn} cujo elementos são autovetores de T , ou seja, T (vi) = αivi, com αi ∈ K, i = 1, . . . , n. Assim, como B é base ortonormal, [T ]B =       α1 0 . . . 0 0 α2 . . . 0 ... ... . . . ... 0 0 . . . αn       ⇒ [T ∗]B =       α1 0 . . . 0 0 α2 . . . 0 ... ... . . . ... 0 0 . . . αn       . 34 Agora, se K = R, então, αi = αi, com i = 1, . . . , n. Logo, [T ]B = [T ∗]B , então, T é auto-adjunto. Como todo operador auto-adjunto é normal, T é um operador normal. Por outro lado, se K = C, então, T não é necessariamente auto-adjunto, mas vale a relação [T ]B [T ∗]B = [T ∗]B [T ]B , ou melhor, T comuta com T ∗, logo, T ◦ T ∗ = T ∗ ◦ T e, portanto, T é operador normal. � 35 4 FORMAS BILINEARES 4.1 Formas Bilineares Definição 4.1.1 Sejam U e V espaços vetoriais sobre K. Uma função f : U × V −→ K é chamada de forma bilinear de U × V em K se: (i) f(λu1 + u2, v) = λf(u1, v) + f(u2, v), para todos λ ∈ K, u1, u2 ∈ U e v ∈ V , (ii) f(u, λv1 + v2) = λf(u, v1) + f(u, v2), para todos λ ∈ K, u ∈ U e v1, v2 ∈ V . Em outras palavras, uma função f : U × V −→ K é uma forma bilinear se for linear em cada uma as variáveis quando deixarmos a outra fixa. Denotaremos por B(U, V,K) o conjunto de todas as formas bilineares de U × V em K. Em particular, se U = V , denotaremos esse conjunto por B(V,K) e diremos que seus elementos são formas bilineares sobre V . Exemplo 4.1.1 (a) Todo produto interno sobre um R-espaço vetorial V é uma forma bilinear. Isso não vale para C- espaços vetoriais. Pois, para u, v1, v2 ∈ V e α ∈ C: 〈u, αv1 + v2〉 = 〈u, αv1〉+ 〈u, v2〉 = α 〈u, v1〉+ 〈u, v2〉 , e se α ∈ C \ R, então α 6= α. Logo, a condição (ii) na definição acima não é satisfeita. (b) Sejam U e V espaços vetoriais sobre R com V munido de um produto interno e T ∈ L(U, V ). A função f : U × V −→ R dada por f(u, v) = 〈T (u), v〉, para todo u ∈ U e v ∈ V , é uma forma bilinear. De fato, (i) Sejam u1, u2 ∈ U , v ∈ V e α ∈ R. f(αu1 + u2, v) = 〈T (αu1 + u2), v〉 = 〈αT (u1) + T (u2), v〉 = 〈αT (u1), v〉+ 〈T (u2), v〉 = = α 〈T (u1), v〉+ 〈T (u2), v〉 = f(u1, v) + f(u2, v). (ii) Sejam u ∈ U , v1, v2 ∈ V e α ∈ R. f(u, αv1 + v2) = 〈T (u), αv1 + v2〉 = 〈T (u), αv1〉+ 〈T (u), v2〉 = α 〈T (u), v1〉+ 〈T (u), v2〉 = αf(u, v1) + f(u, v2). Portanto, f definida acima é uma forma bilinear. (c) Sejam V = Mm×n(K) e A = Mm×m(K). Então a função fA : V × V −→ K dada por fA(X,Y ) = tr(XtAY ), é uma forma bilinear sobre V . De fato, (i) Sejam X1, X2, Y ∈ V e α ∈ K fA(αX1 +X2, Y ) = tr((αX1 +X2) tAY ) = tr(αXt 1AY +Xt 2AY ) = tr(αXt 1AY ) + tr(Xt 2AY ) = = αtr(Xt 1AY ) + tr(Xt 2AY ) = αfA(X1, Y ) + fA(X2, Y ). (ii) Sejam X,Y1, Y2 ∈ V e α ∈ K fA(X,αY1 + Y2) = tr(XtA(αY1 + Y2)) = tr(XtAαY1 +XtAY2) = tr(αXtAY1) + tr(XtAY2) = = αtr(XtAY1) + tr(XtAY2) = αfA(X,Y1) + fA(X,Y2). 36 Portanto, fA definida acima é uma forma bilinear. 4.2 Matriz de uma forma bilinear Note que, para o caso de n = 1, a forma bilinear definida no item (c) acima é dada por: fA(X,Y ) = XtAY = m ∑ i=1 m ∑ j=1 xiaijyj . (30) Considere agora U e V espaços vetoriais de dimensão finita sobre K, e B = {u1, . . . , um} e C = {v1, . . . , vn} bases ordenadas de U e V , respectivamente e f ∈ B(U, V,K). Dados u ∈ V e v ∈ V , u = m ∑ i=1 αiui e v = n ∑ j=1 βjvj , onde, αi, βj ∈ K. Então, f(u, v) = f   m ∑ i=1 αiui, n ∑ j=1 βjvj   = m ∑ i=1 αif  ui, n ∑ j=1 βjvj   = m ∑ i=1 n ∑ j=1 αiβjf(ui, vj). Tomando aij := f(ui, vj), f(u, v) = m ∑ i=1 n ∑ j=1 αiβjaij = m ∑ i=1 n ∑ j=1 αiaijβj . Seja A := (aij)i,j , então, f(u, v) = [u] t B A [v]C . Na equação acima, [v]C denota a matriz coluna formada pelas coordenadas do vetor v com relação à base C e [u] t B denota a transposta da matriz coluna formada pelas coordenadas do vetor u com relação à base B. Definição 4.2.1 Sejam U e V espaços vetoriais de dimensão finita sobreK com basesB = {u1 . . . , um} e C = {v1, . . . , vn}, respectivamente. Para cada f ∈ B(U, V,K), definimos a matriz de f com relação às bases ordenadas B e C como sendo a matriz A = (aij)i,j ∈ Mm×n(K) cujas entradas são dadas por aij = f(ui, vj), i = 1, . . . ,m e j = 1, . . . , n. Esta matriz em geral é denotada por [f ]B,C . O próximo resultado nos mostrará que existe uma bijeção entre o espaço das formas bilinearesB(U, V,K) e o espaço das matrizes Mm×n(K), onde dimK U = m e dimK V = n. Proposição 4.2.1 Sejam U e V espaços vetoriais sobre K com dimK U = m ≥ 1 e dimK V = n ≥ 1. Então existe uma bijeção entre B(U, V,K) e Mm×n(K). Demonstração: Sejam B = {u1 . . . , um} e C = {v1, . . . , vn} bases de U e V , respectivamente. Considere a transformação linear T : B(U, V,K) −→ Mm×n(K) f 7−→ T (f) = [f ]B,C . Provaremos que T é bijetora. Sejam f, g ∈ B(U, V,K), então, T (f) = T (g)⇒ [f ]B,C = [g]B,C ⇒ f(ui, vj) = g(ui, vj)⇒ f = g 37 com i = 1, . . . ,m e j = 1, . . . , n. Logo, T é injetora. Para a sobrejetividade, dada A ∈ Mm×n(K), podemos definir fA(u, v) = [u] t B A [v]C . Provaremos que fA é bilinear. (i) Dados u,w ∈ U , v ∈ V e α ∈ K, fA(αu+ w, v) = [αu+ w] t B A [v]C = [αu] t B A [v]C + [w] t B A [v]C = α [u] t B A [v]C + [w] t B A [v]C = = αfA(u, v) + fA(w, v). (ii) Dados u ∈ U , v, w ∈ V e α ∈ K, fA(u, αv + w) = [u] t B A [αv + w]C = [u] t B A [αv]C + [u] t B A [w]C = α [u] t B A [v]C + [u] t B A [w]C = = αfA(u, v) + fA(u,w). Logo, fA é bilinear. E além disso, T (fA) = [fA]B,C = A, então, T é sobrejetora. � Proposição 4.2.2 Sejam U e V espaços vetoriais sobre K com dimK U = m ≥ 1 e dimK V = n ≥ 1. Sejam B = {u1, . . . , um} uma base de U e C = {v1, . . . , vn} uma base de V e B∗ = {h1, . . . , hm} e C∗ = {g1, . . . , gn} bases de U∗ e V ∗ duais a B e C, respectivamente. Defina fij ∈ B(U, V,K) por fij(u, v) = hi(u) · gj(v) para i = 1, . . . ,m e j = 1, . . . , n. Então, D = {fij ; 1 ≤ i ≤ m, 1 ≤ j ≤ n} forma uma base de B(U, V,K). Demonstração: Primeiro vamos provar que fij é uma forma bilinear para cada par i, j. De fato, (i) Sejam u,w ∈ U , v ∈ V e α ∈ K fij(αu+ w, v) = hi(αu+ w) · gj(v) = (αhi(u) + hi(w)) · gj(v) = = αhi(u) · gj(v) + hi(w) · gj(v) = αfij(u, v) + fij(w, v), (ii) Sejam u ∈ U , v, w ∈ V e α ∈ K fij(u, αv + w) = hi(u) · gj(αv + w) = hi(u). (αgj(v) + gj(w)) = = αhi(u) · gj(v) + hi(u) + gj(w) = αfij(u, v) + fij(u,w). Logo, fij ∈ B(U, V,K). Pelo fato que dimD = dimB(U, V,K) = mn, basta provar que D é linear- mente independente. Sejam λij ∈ K, com i = 1, . . . ,m e j = 1, . . . , n, tais que, m ∑ i=1 n ∑ j=1 λijfij = 0. Então, m ∑ i=1 n ∑ j=1 λijfij(u, v) = 0, para todo u ∈ U e v ∈ V. Em particular, para todo, k = 1, . . . ,m e l = 1, . . . , n 0 = m ∑ i=1 n ∑ j=1 λijfij(uk, vl) = m ∑ i=1 n ∑ j=1 λijhi(uk)gj(vl) = m ∑ i=1 n ∑ j=1 λijδikδjl = λkl. Portanto, {fij ; 1 ≤ i ≤ m, 1 ≤ j ≤ n} é uma base de B(U, V,K). � 38 Proposição 4.2.3 Sejam V um espaço vetorial de dimensão finita sobre K e f ∈ B(V,K). Se M for a matriz de mudança de bases de B para B′ de V , então, [f ]B′ = M t [f ]B M . Demonstração: Sejam B = {v1, . . . , vn} e B′ = {v′1, . . . , v′n} bases de V e M a matriz de mudança de base de B para B′. Assim, [v]B = M [v]B′ , para todo v ∈ V. (31) Assim, para u, v ∈ V , f(u, v) = [u] t B [f ]B [v]B (31) = (M [u]B′) t [f ]B (M [v]B′) = [u] t B′ M t [f ]B M [v]B′ . (32) Por outro lado, f(u, v) = [u] t B′ [f ]B′ [v]B′ . (33) Segue então, por 32 e 33, [u] t B′ M t [f ]B M [v]B′ = [u] t B′ [f ]B′ [v]B′ , para todo u, v ∈ V. Portanto, [f ]B′ = M t [f ]B M . � Exemplo 4.2.1 Sejam V = R 2 e B a base canônica de V . Considere a forma bilinear f em R 2 definida por f((x1, x2), (y1, y2)) = 2x1y1 − 3x1y2 + x2y2. Assim, f((1, 0), (1, 0)) = 2.1.1− 3.1.0 + 0.0 = 2, f((1, 0), (0, 1)) = 2.1.0− 3.1.1 + 0.1 = −3, f((0, 1), (1, 0)) = 2.0.1− 3.0.0 + 1.0 = 0, f((0, 1), (0, 1)) = 2.0.0− 3.0.1 + 1.1 = 1. Logo, [f ]B = ( 2 −3 0 1 ) Vamos efetuar a mudança da base B = {(1, 0), (0, 1)} para uma outra base B′ = {(1,−1), (1, 1)} de R 2. Obtemos então a matriz M de mudança da base B para B′ M = ( 1 1 −1 1 ) ⇒M t = ( 1 −1 1 1 ) . Utilizando a proposição 4.2.3, [f ]B′ = ( 1 −1 1 1 )( 2 −3 0 1 )( 1 1 −1 1 ) = ( 2 −4 2 −2 )( 1 1 −1 1 ) = ( 6 −2 4 0 ) . Proposição 4.2.4 Sejam U e V espaços vetoriais sobre K munidos de produto interno. Considere a 39 função Φ tal que, Φ : L(U, V ) −→ B(U, V,R) T 7−→ Φ(T ) : U × V −→ R (u, v) 7−→ 〈T (u), v〉 . Então, Φ é linear e injetora. Demonstração: Primeiramente temos que Φ está bem definida pois, Φ(T ) ∈ B(U, V,R). De fato, (i) Sejam u1, u2 ∈ U , v ∈ V e α ∈ R, Φ(T )(αu1 + u2, v) = 〈T (αu1 + u2), v〉 = 〈αT (u1) + T (u2), v〉 = 〈αT (u1), v〉+ 〈T (u2), v〉 = = α 〈T (u1), v〉+ 〈T (u2), v〉 = αΦ(T )(u1, v) + Φ(T )(u2, v). (ii) Sejam u ∈ U , v1, v2 ∈ V e α ∈ R, Φ(T )(u, αv1 + v2) = 〈T (u), αv1 + v2〉 = 〈T (u), αv1〉+ 〈T (u), v2〉 = α 〈T (u), v1〉+ 〈T (u), v2〉 = = αΦ(T )(u, v1) + Φ(T )(u, v2). Logo, Φ(T ) é uma forma bilinear. Considere agora T, S ∈ L(U, V ) e λ ∈ R, para todo u ∈ U e para todo v ∈ V , Φ(λT + S)(u, v) = 〈(λT + S)(u), v〉 = 〈λT (u) + S(u), v〉 = 〈λT (u), v〉+ 〈S(u), v〉 = = λ 〈T (u), v〉+ 〈S(u), v〉 = λΦ(T )(u, v) + Φ(S)(u, v). Logo, Φ(λT + S) = λΦ(T ) + Φ(S) e, portanto, Φ é linear. Falta mostrar ainda que Φ é injetora. Para isso, considere T ∈ L(U, V ) tal que Φ(T ) = 0, então, 〈T (u), v〉 = 0, para todo u ∈ U e v ∈ V . Pelo lema 3.4.1 isso é equivalente a T = 0, para todo u ∈ U e v ∈ V . Portanto, Φ é injetora. � 4.3 Formas Simétricas Dentro desta seção e da próxima estudaremos se existe alguma condição para que uma forma bilinear f ∈ B(V,K) pode ser diagonalizável, ou seja, se existe uma base B de V tal que a matriz [f ]B seja diagonal. Definição 4.3.1 Sejam V um espaço vetrial sobre K e f ∈ B(V,K). Diremos que f é simétrica se f(u, v) = f(v, u), para todos u, v ∈ V . Denotaremos por Bs(V,K) o conjunto de todas as formas bilineares simétricas sobre um K-espaço vetorial V . Observação 4.3.1 Claramente Bs(V,K) é um subespaço vetorial de B(V,K). Exemplo 4.3.1 (a) Se V é um espaço vetorial sobre K munido um produto interno, então, a função f : V × V −→ R dada por f(u, v) = 〈u, v〉 é uma forma bilinear simétrica sobre V . De fato, pois, para todo u, v ∈ V , f(u, v) = 〈u, v〉 = 〈v, u〉 = f(v, u). 40 (b) Seja g : R2 × R 2 −→ R dada por g((x1, x2), (y1, y2)) = −x1y1 + 3x2y1 + 3x1y2 + 2x2y2 é uma forma bilinear simétrica sobre R 2. De fato, g((y1, y2), (x1, x2)) = −y1x1 + 3y2x1 + 3y1x2 + 2y2x2. Portanto, g((x1, x2), (y1, y2)) = g((y1, y2), (x1, x2)), para todo x1, x2, y1, y2 ∈ R. Teorema 4.3.1 Seja V um espaço vetorial sobre K de dimensão n ≥ 1. As seguintes afirmações são equivalentes para uma forma bilinear f sobre V : (a) f é simétrica; (b) [f ]B é uma matriz simétrica para toda base B de V . Demonstração: (a) =⇒ (b) Seja B uma base de V . Por definição, para todos u, v ∈ V , temos que, f(u, v) = [u] t B [f ]B [v]B . Pela hipótese, f(u, v) = f(v, u) = [v] t B [f ]B [u]B , para todo u, v ∈ V . Logo, [u] t B [f ]B [v]B = [v] t B [f ]B [u]B . (34) Como f(v, u) = [v] t B [f ]B [u]B ∈M1(K), para todo u, v ∈ V , [v] t B [f ]B [u]B = ( [v] t B [f ]B [u]B )t = [u] t B [f ] t B [v]B . (35) Assim, por (34) e por (35), [u]tB [f ]B [v]B = [u] t B [f ] t B [v]B . Portanto, segue que, [f ]B = [f ] t B , ou seja, [f ]B é uma matriz simétrica. (b) =⇒ (a) Seja B uma base qualquer de V tal que [f ]B seja uma matriz simétrica. Por definição, para cada par u, v ∈ V , f(u, v) = [u] t B [f ]B [v]B . Como f(u, v) = [u] t B [f ]B [v]B ∈M1(K), f(u, v) = [u] t B [f ]B [v]B = ( [u] t B [f ]B [v]B )t = [v] t B [f ] t B [u]B . (36) Como por hipótese, [f ]B é uma matriz simétrica, para todo u, v ∈ V , f(u, v) = [v] t B [f ] t B [u]B = [v] t B [f ]B [u]B = f(v, u). Portanto, f é uma forma bilinear simétrica. � 4.4 Formas Quadráticas Definição 4.4.1 Sejam V um espaço vetorial sobre K e f ∈ B(V,K). A função q : V −→ K dada por q(v) = f(v, v) é denominada forma quadrática associada a f. Exemplo 4.4.1 (a) Sejam V = R n com produto interno canônico e f ∈ B(V,R) dada por f(u, v) = 〈u, v〉, para todo u, v ∈ V . Então, a forma quadrática associada a f é dada por q(u) = f(u, u) = x2 1 + x2 2 + · · ·+ x2 n, 41 para cada u = {x1, x2, . . . , xn} ∈ V . Note que, q(u) é o quadrado da norma de u. (b) Seja A = ( −1 2 0 −1 ) ∈M2(R) e f ∈ B(R2,R) dada por f((x1, x2), (y1, y2)) = ( x1 x2 ) ( −1 2 0 −1 )( x1 x2 ) = −x1y1 + 2x1y2 − x2y2. A forma quadrática associada a f será dada por q(x1, x2) = f((x1, x2), (x1, x2)) = −x2 1 + 2x1x2 − x2 2 Considere agora V um espaço vetorial sobre K e f ∈ Bs(V,K). Se q é a forma quadrática associada a f , então, para cada u, v ∈ V , q(u+ v)− q(u)− q(v) = f(u+ v, u+ v)− f(u, u)− f(v, v) = f(u, u+ v)+ f(v, u+ v)− f(u, u)− f(v, v) = = f(u, u) + f(u, v) + f(v, u) + f(v, v)− f(u, u)− f(v, v) = f(u, v) + f(v, u) = 2.f(u, v). Logo, f(u, v) = 1 2 (q(u+ v)− q(u)− q(v)) , para todo u, v ∈ V. (37) A última igualdade (37) é conhecida como forma polar de f . Teorema 4.4.1 Seja V um espaço vetorial sobre K com dimensão n ≥ 1. Se f ∈ Bs(V,K), então, existe uma base B de V na qual [f ]B é uma matriz diagonal. Demonstração: Se f = 0 a matriz [f ]B é uma matriz nula; se dimK V = 1 a matriz [f ]B é uma matriz unitária. Assim, vamos supor f 6= 0 e dimK V = n > 1. Para provar o resultado, basta determinar uma base B = {v1, v2, . . . , vn} de V tal que f(vi, vj) = 0, se i 6= j. Vamos demonstrar esse resultado por indução finita n. Como f é simétrica, existe, v1 ∈ V tal que f(v1, v1) 6= 0. Seja W o subespaço gerado por v1 e considere W ′ := {v ∈ V : f(v1, v) = 0}. Claramente W ′ é subespaço. Podemos afirmar ainda, que V = W ⊕W ′. De fato, se v ∈ W ∩W ′, então, existe α ∈ K tal que v = αv1 e f(v1, αv1) = 0, ou seja, αf(v1, v1) = 0. Como f(v1, v1) 6= 0, então, α = 0. Logo, v = 0 e assim, W ∩W ′ = {0}. Para provar que V = W +W ′. Considere os vetores v ∈ V e w′ = v − f(v1, v) f(v1, v1) v1. Então, f(v1, w ′) = f ( v1, v − f(v1, v) f(v1, v1) v1 ) = f(v1, v)− f(v1, v) f(v1, v1) f(v1, v1) = 0. Assim, w′ ∈ W ′ e v = f(v1, v) f(v1, v1) v1 + w′ ∈ W +W ′. Observe que a restrição f |W ′×W ′ : W ′ ×W ′ −→ K de f é uma forma bilinear simétrica sobre W ′. Como dimK W ′ = n− 1, pela hipótese de indução, existe uma base {v2, v3, . . . , vn} de W ′ tal que f(vi, vj) = 0, para i 6= j e 2 ≤ i, j ≤ n. Decorre da definição de W ′ que f(v1, vj) = 0 para 2 ≤ j ≤ n. Como V = W +W ′ segue que {v1, v2, . . . , vn} é uma base de V. Além disso, temos que f(vi, vj) = 0 se i 6= j e 1 ≤ i, j ≤ n como queríamos. � Proposição 4.4.1 Seja V um espaço vetorial sobre R de dimensão n ≥ 1 munido de um produto interno. Então Bs(V,R) é isomorfo ao subespaço {T ∈ L(V, V ) : T é auto-adjunto} de L(V, V ). 42 Demonstração: Da proposição 4.2.4, sabemos que a função Φ : L(V, V ) −→ B(V,R) dada por Φ(T )(u, v) = 〈T (u), v〉, para todo u, v ∈ V , é um isomorfismo. Assim, para concluir a demonstração, basta mostrar que T é auto-adjunto, se, e somente se, Φ(T ) é simétrica. Observe primeiramente que, Φ(T )(u, v) = 〈T (u), v〉 = 〈u, T ∗(v)〉 = 〈T ∗(v), u〉 para quaisquer u, v ∈ V. Se T = T ∗, para todo u, v ∈ V , Φ(T )(u, v) = 〈T ∗(v), u〉 = 〈T (v), u〉 = Φ(T )(v, u). Logo, Φ(T ) é simétrica. Por outro lado, se Φ(T ) é simétrica, 〈T ∗(v), u〉 = 〈v, T (u)〉 = 〈T (u), v〉 = Φ(T )(u, v) = Φ(T )(v, u) = 〈T (v), u〉 . Logo, T = T ∗. � Observação 4.4.1 Seja V é um R-espaço vetorial com produto interno. Observamos que as proposições 3.6.2, 4.4.1 e o teorema 4.4.1 garantem que se f : V × V −→ R for uma forma bililnear simétrica, então existe uma base ortonormal B de V tal que [f ]B é diagonal. Exemplo 4.4.2 (a) Considere T : R2 −→ R 2 dada por [T ]can = ( a c c b ) com a, b, c ∈ R. O polinômio real homogêneo de 2o. grau em x e y dado por p(x, y) = ax2 + by2 + 2cxy é a forma quadrática associada ao operador auto-adjunto T , pois, q(x, y) = 〈T (x, y), (x, y)〉 = 〈(ax+ cy, cx+ by), (x, y)〉 = = ax2 + by2 + 2cxy = p(x, y) 43 5 RECONHECIMENTO DE CÔNICAS E QUÁDRICAS Dada uma cônica em R 2 ou uma quádrica em R 3, nem sempre é fácil reconhecer essas curvas e super- fícies a partir de suas equações. No entanto, a partir de mudança de bases e translações conseguimos reduzir as equações às formas mais simples e a identificação tanto das curvas cônicas quanto das su- perfícies quádricas tornam-se quase que imediata. Aplicando os resultados apresentados dentro deste trabalho vamos descrever um método para a simplificação das equações. 5.1 Classificação das Superfícies Quádricas No caso das superfícies quádricas estaremos trabalhando com o R-espaço vetorial V = R 3 e usaremos a notação usual {O,~i,~j,~k} para o sistema ortogonal de coordenadas inicial. Isso significa que estare- mos utilizando uma base ortonormal de R 3, indicada pelos vetores ~i, ~j e ~k e fixando o ponto O como origem deste sistema. Definição 5.1.1 Uma quádrica em R 3 é uma superfície formada pelos pontos de R 3 cujas coordenadas em relação a um sistema fixado verificam uma equação da forma, ax2 + by2 + cz2 + 2pxy + 2qxz + 2ryz + Ex+ Fy +Gz + d = 0 (38) onde, a, b, c, d, p, q, r, E, F,G ∈ R e a2 + b2 + c2 6= 0. Os termos de segundo grau em (38) definem a função Q : R3 −→ R dada por Q(x, y, z) = ax2 + by2 + cz2 + 2pxy + 2qxz + 2ryz. (39) Observe que Q é uma forma quadrática em R 3 associada à forma bilinear simétrica f cuja matriz em relação a base canônica de R 3 é dada por, [f ]can =    a p q p b r q r c    . De fato, Q(x, y, z) = ax2 + by2 + cz2 + 2pxy + 2qxz + 2ryz = = ( x y z )    a p q p b r q r c       x y z    = f((x, y, z), (x, y, z)). Segue da observação 4.4.1 que R 3 admite uma base ortonormal B = {v1, v2, v3} tal que [f ]B é uma matriz diagonal. Assim, para cada v ∈ V , v = x′v1 + y′v2 + z′v3, Q(x′, y′, z′) = ( x′ y′ z′ )    λ1 0 0 0 λ2 0 0 0 λ3       x′ y′ z′    . Ou seja, Q(x′, y′, z′) = λ1x ′2 + λ2y ′2 + λ3z ′2. Isso significa que, ao efetuarmos a mudança de base correspondente, eliminamos os termos mistos do segundo grau da equação (39). Isto é a equação da 44 quádrica é simplificada da seguinte forma: λ1x ′2 + λ2y ′2 + λ3z ′2 + E′x′ + F ′y′ +G′z′ + d = 0. (40) Podemos ainda, em (40) completar quadrados e fatorar, obtendo assim uma nova mudança de coorde- nadas da forma      x′′ = x′ − α y′′ = y′ − β z′′ = z′ − γ que corresponde a uma translação. Consequentemente, teremos a equação reduzida da quádrica no sistema (O′′, v1, v2, v3). Em sua forma reduzida, é fácil identificar a quádrica correspondente na tabela 1. 5.1.1 Tabela de Classificação das Quádricas Tabela 1: Tabela com todas as possibilidades para o reconhecimento da equação final de uma quádrica, a menos dos nomes dos eixos a > 0, b > 0 e c > 0 d > 0 elipsóide d = 0 ponto ax2 + by2 + cz2 = d d < 0 vazio d > 0 hiperbolóide de uma folha d = 0 superfície cônica ax2 + by2 − cz2 = d d < 0 hiperbolóide de duas folhas ax2 = by + cz d = 0 cilindro parabólico a > 0 e b > 0 c 6= 0 parabolóide elíptico ax2 + by2 = cz c = 0 reta c 6= 0 parabolóide hiperbólico ax2 − by = cz c = 0 planos concorrentes ax2 = by cilindro parabólico d > 0 cilindro elíptico d = 0 reta ax2 + b2 = d d < 0 vazio d 6= 0 cilindro hiperbólico ax2 − by2 = d d = 0 par de planos concorrentes Exemplo 5.1.1 Vamos reconhecer as quádricas dadas pelas equações em relação ao sistema ortogonal (O,~i,~j,~k). (a) 7x2 + 17y2 + 7z2 − 4xy + 6xz − 4yz − 6x− 12y − 6z + 1 = 0. Seja Q(x, y, z) = 7x2 + 17y2 + 7z2 − 4xy + 6xz − 4yz a forma quadrática dada pelos termos de 2o. grau da equação acima, onde, a = 7, b = 17, c = 7, p = −2, q = 3, r = −2. Assim Q(x, y, z) = f((x, y, z), (x, y, z)) com [f ]can =    7 −2 3 −2 17 −2 3 −2 7    . Segue da observação 4.4.1 que R 3 admite uma base ortonormal B de autovetores tal que [f ]B é diagonal. Logo, para determinar essa base B basta determinar os autovalores de [f ]can e depois 45 seus autovetores associados aos mesmos. Calculando o polinômio característico, pf (t) = det(t.Id3 − [f ]can) = det       t 0 0 0 t 0 0 0 t    −    7 −2 3 −2 17 −2 3 −2 7       = = det    t− 7 −2 3 −2 t− 17 −2 3 −2 t− 7    = t3 − 31t2 + 270t− 648. e suas raízes são t1 = 4, t2 = 9 e t3 = 18. Se x′, y′ e z′ são as coordenadas de um ponto P com relação a B, então Q(x′, y′, z′) = 4x′2 + 9y′2 + 18z′2. Vamos determinar agora os autovetores que formam a B, associados aos autovalores λ1 = 4, λ2 = 9 e λ3 = 18. (i) Autovetores associados a λ1 = 4    −3 −2 3 −2 −13 2 −3 2 −3       x y z    =    0 0 0    ⇐⇒ x = −z e y = 0. Considere então, o vetor unitário v1 = (√ 2 2 , 0,− √ 2 2 ) que gera o subespaço de R 3 dos autoveto- res associados ao autovalor λ1 = 4. (ii) Autovetores associados a λ2 = 9    2 −2 3 −2 −8 2 −3 2 2       x y z    =    0 0 0    ⇐⇒ x = z e 2y = z. Considere então, o vetor unitário v2 = ( 2 3 , 1 3 , 2 3 ) que gera o subespaço de R 3 dos autovetores associados ao autovalor λ2 = 9. (iii) Autovetores associados a λ3 = 18,    11 −2 3 −2 1 2 −3 2 11       x y z    =    0 0 0    ⇐⇒ x = z e y = −4z. Considere então, o vetor unitário v3 = ( 1√ 18 ,− 4√ 18 , 1√ 18 ) que gera o subespaço de R 3 dos autovetores associados ao autovalor λ3 = 18. Agora que determinamos os autovetores associados, a matriz de mudança de de base de {~i,~j,~k} para a base {v1, v2, v3} é dada por M =              √ 2 2 2 3 1√ 18 0 1 3 −4√ 18 − √ 2 2 2 3 1√ 18              . 46 Assim a relação existente entre as coordenadas x, y e z no sistema (O,~i,~j,~k) e x′, y′, z′ no sistema (O, v1, v2, v3) é dada por:    x y z    =              √ 2 2 2 3 1√ 18 0 1 3 −4√ 18 − √ 2 2 2 3 1√ 18                 x′ y′ z′    , ou seja,                          x = √ 2 2 x′ + 2 3 y′ + 1√ 18 z′ y = 1 3 y′ − 4√ 18 z′ z = − √ 2 2 x′ + 2 3 y′ + 1√ 18 z′ Escrevendo a equação da quádrica com as coordenadas dos pontos P em relação ao sistema (O, v1, v2, v3), 4x′2 + 9y′2 + 18z′2 − 6 (√ 2 2 x′ + 2 3 y′ + 1√ 18 z′ ) − 12 ( 1 3 y′ − 4√ 18 z′ ) −6 ( − √ 2 2 x′ + 2 3 y′ + 1√ 18 z′ ) + 1 = 0⇒ 4x′2 + 9y′2 + 18z′2 − 12y′ + 36√ 18 z′ + 1 = 0. Completando quadrado, 4x′2 + 9 ( y′2 − 4 3 y′ + 4 9 ) + 18 ( z′2 + 2√ 18 z′ + 1 18 ) + 1− 4− 1 = 0⇒ ⇒ 4x′2 + 9 ( y′ − 2 3 )2 + 18 ( z′ + 1 3 √ 2 )2 = 4. Fazendo a translação                    x′′ = x′ y′′ = y′ − 2 3 z′′ = z′ + 1 3 √ 2 obtemos a equação 4x′′2 + 9y′′2 + 18z′′2 = 4 que é a equação de um elipsoide. Vale lembrar que esta última equação está dada em relação ao sistema ortogonal {O′′, v′1, v ′ 2, v ′ 3} onde O′′ têm coordenadas ( 0, 2 3 ,− 1 3 √ 2 ) em relação ao sistema ortogonal {O, v1, v2, v3}. 47 Figura 2: Elipsóide de equação 7x2 + 17y2 + 7z2 − 4xy + 6xz − 4yz − 6x− 12y − 6z + 1 = 0 (b) 5x2 + 5y2 + 8z2 + 8xy − 4xz + 4yz − 2x+ 2y + 8z + 1 = 0. Seja Q(x, y, z) = 5x2 + 5y2 + 8z2 + 8xy − 4xz + 4yz a forma quadrática dada pelos termos do segundo grau da equação dada acima: a = 5, b = 5, c = 8, p = 4, q = −2, r = 2. Assim, Q(x, y, z) = f((x, y, z), (x, y, z)) com [f ]can =    5 4 −2 4 5 2 −2 2 8    . Calculando o polinômio característico, pf (t) = det(t.Id3 − [f ]can) = t3 − 18t2 + 81t, e suas raízes são t1 = 9 (raíz dupla) e t2 = 0. A forma quadrática com coordenadas em relação à base de autovetores será dada por Q(x′, y′, z′) = 9x′2 + 9y′2. Vamos determinar a base formada por autovetores associados aos autovalores λ1 = 9 e λ2 = 0. (i) Autovetores associados ao autovalor λ1 = 9.    4 −4 2 −4 4 −2 2 −2 1       x y z    =    0 0 0    ⇐⇒ z = −2x+ 2y. Logo, {(1, 0,−2), (0, 1, 2)} é uma base do subespaço de R 3 dos autovetores associados a 9. Utili- zando o processo de ortogonalização de Gram-Schmidt, v′1 = (1, 0,−2), 48 v′2 = v′1 − 〈(0, 1, 2), (1, 0,−2)〉 5 (1, 0,−2) = ( 4 5 , 1, 2 5 ) . Como queremos uma base ortonormal precisamos de vetores unitários, então vamos dividir v′1 e v′2 pelas suas respectivas normas: v′1 = ( 1√ 5 , 0,− 2√ 5 ) , v′2 = ( 4 3 √ 5 , 5 3 √ 5 , 2 3 √ 5 ) . (ii) Autovetores associados ao autovalor λ2 = 0,    −5 −4 2 −4 −5 −2 2 −2 −8       x y z    =    0 0 0    ⇐⇒ x = 2z e y = −2z. Logo, {(2,−2, 1)} é uma base do subespaço de R 3 dos autovetores associados a 0. Considere então o vetor unitário v′3 = ( 2 3 ,−2 3 , 1 3 ) que gera o subespaço dos autovetores asso- ciados ao autovalor λ2 = 0. Logo, a matriz de mudança de base ortonormal {~i,~j,~k} para base ortonormal {v1, v2, v3} é dada por M =             1√ 5 4 3 √ 5 2 3 0 5 3 √ 5 −2 3 − 2√ 5 2 3 √ 5 1 3             . Assim, a relação entre as coodenadas x, y e z no sistema (O,~i,~j,~k) e x′,y′ e z′ no sistema (O′, v′1, v ′ 2, v ′ 3) é dado por,                        x = 1√ 5 x′ + 4 3 √ 5 y′ + z′ y = 5 3 √ 5 y′ − 2 3 z′ z = − 2√ 5 x′ + 2 3 √ 5 y′ + 1 3 z′ Substituindo na equação da quádrica, 9x′2+9y′2−2 ( 1√ 5 x′ + 4 3 √ 5 y′ + z′ ) +2 ( 5 3 √ 5 y′ − 2 3 z′ ) +8 ( − 2√ 5 x′ + 2 3 √ 5 y′ + 1 3 z′ ) +1 = 0⇒ ⇒ 9x′2 − 18√ 5 x′ + 9y′2 + 18 3 √ 5 y′ + 1 = 0. Completando quadrado, 9 ( x′2 − 2√ 5 x′ + 1 5 ) + 9 ( y′2 + 2 3 √ 5 y′ + 1 45 ) − 9 5 − 9 45 + 1 = 0⇒ 49 ⇒ 9 ( x′ − 1√ 5 )2 + 9 ( y′ + 1 3 √ 5 )2 = 1. Efetuando a translação,                      x′′ = x′ − 1√ 5 y′′ = y′ + 1 3 √ 5 z′′ = z′ obtemos a equação 9x′′2 + 9y′′2 = 1, que é a equação de um cilindro elíptico, no sistema de coordenadas ortonormal (O′′, v′1, v ′ 2, v ′ 3), onde, O′′ = ( 1√ 5 ,− 1 3 √ 5 , 0 ) em relação ao sistema ortogonal {O, v1, v2, v3}. Figura 3: Cilindro Elíptico de equação 5x2 + 5y2 + 8z2 + 8xy − 4xz + 4yz − 2x+ 2y + 8z + 1 = 0 5.2 Classificação das Cônicas Analogamente como fizemos para as superfícies quádricas, vamos criar um processo para a classifica- ção das cônicas. Para a classificação das cônicas estaremos trabalhando com o R-espaço vetorial V = R 2 e usare- mos a notação usual {O,~i,~j} para o sistema ortogonal de coordenadas. Ou seja, estaremos utilizando a base ortonormal de R 2, formada pelos vetores~i e ~j e tomando o ponto O como origem do sistema. 50 Definição 5.2.1 Uma cônica em R 2 é a curva definida por uma equação de grau dois em duas variá- veis: ax2 + 2bxy + cy2 + Ex+ Fy + d = 0, (41) onde, a, b, c, d, E, F ∈ R 2 e a2 + b2 6= 0. A partir dos termos de grau dois em 41 analisaremos a função Q : R2 −→ R definida por Q(x, y) = ax2 + 2bxy + cy2. (42) Observe que Q é uma forma quadrática em R 2 associada à forma bilinear simétrica f cuja matriz em relação à base canônica de R 2 é dada por, [f ]can = ( a b b c ) . De fato, Q(x, y) = ax2 + 2bxy + cy2 = ( x y ) ( a b b c )( x y ) = f((x, y), (x, y)). Segue de 4.4.1 que R 2 admite uma base ortonormal B = {v1, v2} tal que [f ]B admite uma matriz diagonal. Assim, para cada v ∈ V , v = x′v1 + y′v2, Q(x, y) = ( x′ y′ ) ( λ1 0 0 λ2 )( x′ y′ ) . Ou seja, Q(x′, y′) = λ1x ′2 + λ2y ′2 . Isso significa que, ao efetuarmos a mudança de base corres- pondente, eliminamos o termo misto do segundo grau na equação 42, e nessa base a cônica é dada por λ1x ′2 + λ2y 2 + E′x′ + F ′y′ + d = 0. (43) Podemos ainda, em 43 completar quadrados e fatorar, obtendo assim uma nova mudança de coorde- nadas da forma, { x′′ = x′ − α y′′ = y′ − β que corresponde a uma translação. Consequentemente, teremos a equação reduzida da cônica no sistema (O′′, v1, v2, v3). Assim, na forma reduzida é fácil identificar a cônica correspondente. Exemplo 5.2.1 Vamos reconhecer as cônicas dadas pelas equações abaixo em relação ao sistema ortogonal (O,~i,~j). (a) 7x2 − 48xy − 7y2 − 30x− 40y + 75 = 0. Então Q(x, y) = 7x2 − 48xy − 7y2 é a forma quadrática dada pelos termos de grau dois da equação acima. Então Q(x, y) = f((x, y), (x, y)) com [f ]can = ( 7 −24 −24 −7 ) . Calculando o polinômio característico, pf (t) = det(t.Id3 − [f ]can) = det ( t− 7 24 24 t+ 7 ) = 51 = (t− 7)(t+ 7)− 242 = t2 − 625 e suas raízes são t1 = 25 e t2 = −25. A forma quadrática com coordenadas em relação à base de autovetores, B, será dada por Q(x′, y′) = 25x′2 − 25y′2. Vamos determinar agora os autovetores associados aos autovalores que formam a base B. (i) Autovetores associados aos autovalores λ1 = 25: ( 18 24 24 32 )( x y ) = ( 0 0 ) ⇐⇒ x = −4 3 y. Logo, {( 1,−3 4 )} é uma base do subespaço dos autovetores associados ao autovalor 25. O vetor unitário associado a esse vetor é v1 = ( 4 5 ,−3 5 ) . (ii) Autovetores associados aos autovalores λ2 = −25: ( −32 24 24 −18 )( x y ) = ( 0 0 ) ⇐⇒ x = 3 4 y. Logo, {( 1, 4 3 )} é uma base do subespaço dos autovetores associados ao autovalor -25. O vetor unitário associado a esse vetor é v2 = ( 3 5 , 4 5 ) . Então a matriz de mudança de base ortonormal {~i,~j} para a base ortonormal {v1, v2} é dada por M =      4 5 3 5 −3 5 4 5      . Então a relação entre as coordenadas x e y no sistema (O,~i,~j) e x′ e y′ no sistema (O′, v1, v2) é dado por,          x = 4 5 x′ + 3 5 y′ y = −3 5 x′ + 4 5 y′ . Substituindo na equação da cônica obtemos, 25x′2 − 25y′2 − 30 ( 4 5 x′ + 3 5 y′ ) − 40 ( −3 5 x′ + 4 5 y′ ) + 75 = 0⇒ 25x′2 − 25y′2 − 50y′ + 75 = 0. Completando quadrado, 25x′2 − 25 ( y′2 + 2y′ ) = −75⇒ 25x′2 − 25 ( y′2 + 2.1.y′ + 12 ) = −75− 25⇒ 25x′2 − 25 (y′ + 1) 2 = −100⇒ 1 4 (y′ + 1) 2 − 1 4 x′2 = 1. 52 Fazendo a translação { x′′ = x′ y′′ = y′ + 1 , obtemos a equação reduzida de uma hipérbole no sistema de coordenadas ortonormal (O′′, v′1, v ′ 2), onde, O′′ = (0,−1) é 1 4 y′′2 − 1 4 x′′2 = 1. Figura 4: Hipérbole de equação 7x2 − 48xy − 7y2 − 30x− 40y + 75 = 0 (b) 9x2 − 30xy + 25y2 + 82x+ 22y − 157 = 0. Seja Q(x, y) = 9x2 − 30xy + 25y2 a forma quadrática dada pelos termos de grau dois da equação acima. Assim,Q(x, y) = f((x, y), (x, y)) onde, [f ]can = ( 9 −15 −15 25 ) . Calculando o polinômio característico, pf (t) = det(t.Id3 − [f ]can) = det ( t− 9 15 15 t− 25 ) = (t− 9)(t− 25)− 152 ⇒ ⇒ pf (t) = t2 − 34t e suas raízes são t1 = 0 e t2 = 34. Então a forma quadrática com coordenadas em relação à base de autovetores será dada por Q(x′, y′) = 34y′2. Vamos determinar agora os autovetores 53 associados aos autovalores aos autovalores que formam a base B. (i) Autovetores associados ao autovalor λ1 = 0: ( −9 15 15 −25 )( x y ) = ( 0 0 ) ⇐⇒ x = 5 3 y. Logo, {( 1, 3 5 )} é uma base do subespaço dos autovetores associados ao autovalor 0. O vetor unitário associado a esse vetor é ( 5√ 34 , 3√ 34 ) . (ii) Autovetores associados ao autovalor λ2 = 34: ( 25 15 15 9 )( x y ) = ( 0 0 ) ⇐⇒ x = −3 5 y. Logo, {( 1,−5 3 )} é uma base do subespaço dos autovetores associados ao autovalor 34. O vetor unitário associado a esse vetor é v2 = ( 3√ 34 ,− 5√ 34 ) . Então, a matriz de mudança de base ortonormal {~i,~j} para a base ortonormal {v1, v2} é dada por M =       5√ 34 3√ 34 3√ 34 − 5√ 34       . Então, a relação entre as coordenadas x e y no sistema (O,~i,~j) e x′ e y′ no sistema (O′, v1, v2) é dado por            x = 5√ 34 x′ + 3√ 34 y′ y = 3√ 34 x′ − 5√ 34 y′ . Substituindo na equação da cônica, 34y′2 + 82 ( 5√ 34 x′ + 3√ 34 y′ ) + 22 ( 3√ 34 x′ − 5√ 34 y′ ) − 157 = 0⇒ 476√ 34 x′ + 34y′2 + 136√ 34 y′ = 157. Completando quadrado, 476√ 34 x′ + 34 ( y′2 + 4√ 34 y′ ) = 157⇒ 476√ 34 x′ + 34 ( y′2 + 2 2√ 34 y′ + 22 34 ) = 157 + 4⇒ ⇒ 476√ 34 x′ + 34 ( y′ + 2√ 34 )2 = 161. Fazendo a translação,    x′′ = x′ y′′ = y′ + 2√ 34 54 obtemos a equação reduzida de uma parábola no sistema de coordenadas ortonormal (O′′, v′1, v ′ 2), onde, O′′ = ( 0,− 2√ 34 ) é 476√ 34 x′′ + 34y′′2 = 161. Figura 5: Parábola de equação 9x2 − 30xy + 25y2 + 82x+ 22y − 157 = 0 (c) 19x2 − 4xy + 16y2 − 34x− 28y − 44 = 0. Seja Q(x, y) = 19x2 − 4xy + 16y2 a forma quadrática com os termos de grau dois da equação acima. Assim,Q(x, y) = f((x, y), (x, y)) tal que [f ]can = ( 19 −2 −2 16 ) . Calculando o polinômio característico, pf (t) = det(t.Id3 − [f ]can) = det ( t− 19 2 2 t− 16 ) = (t− 19)(t− 16)− 22 ⇒ ⇒ pf (t) = t2 − 35t+ 300 e suas raízes são t1 = 15 e t2 = 20. Logo, a forma quadrática com coordenadas em relação a base de autovetores será dada por Q(x′, y′) = 15x′2 + 20y′2. Vamos determinar agora os autovetores associados aos autovalores aos autovalores que formam 55 a base B. (i) Autovetores associados ao autovalor λ1 = 15: ( −4 2 2 1 )( x y ) = ( 0 0 ) ⇔ 2x = y. Logo, {(1, 2)} é uma base do subespaço dos autovetores associados ao autovalor 15. O vetor unitário associado a esse vetor é v1 = ( 1√ 5 , 2√ 5 ) . (ii) Autovetores associados ao autovalor λ1 = 20 ( 1 2 2 4 )( x y ) = ( 0 0 ) ⇔ x = −2y. Logo, {(2,−1)} é uma base do subespaço dos autovetores associados ao autovalor 20. O ve- tor unitário associado a esse vetor é v2 = ( 2√ 5 ,− 1√ 5 ) . Então a matriz de mudança de base ortonormal {~i,~j} para a base ortonormal {v1, v2} é dada por M =       1√ 5 2√ 5 2√ 5 − 1√ 5       . A relação entre as coordenadas x e y no sistema (O,~i,~j) e x′ e y′ no sistema (O′, v1, v2) é dado por,            x = 1√ 5 x′ + 2√ 5 y′ y = 2√ 5 x′ − 1√ 5 y′ . Substituindo na equação da cônica, 15x′2 + 20y′2 − 34 ( 1√ 5 x′ + 2√ 5 y′ ) − 28 ( 2√ 5 x′ − 1√ 5 y′ ) − 44 = 0⇒ ⇒ 15x′2 + 20y′2 − 34√ 5 x′ − 68√ 5 y′ − 56√ 5 x′ + 28√ 5 y′ = 44⇒ 15x′2 + 20y′2 − 90√ 5 x′ − 40√ 5 y′ = 44. Completando quadrado, 15 ( x′2 − 2 3√ 5 x′ + 32 5 ) + 20 ( y′2 − 2 1√ 5 y′ + 12 5 ) = 44 + 18 + 4⇒ ⇒ 15 ( x′ − 3√ 5 )2 + 20 ( y′ − 1√ 5 )2 = 66⇒ 15 66 ( x′ + 3√ 5 )2 + 20 66 ( y′ − 1√ 5 )2 = 1. Fazendo a translação,            x′′ = x′ − 3√ 5 y′′ = y′ − 1√ 5 56 obtemos a equação reduzida de uma elipse no sistema de coordenadas ortonormal (O′′, v′1, v ′ 2), onde, O′′ = ( 3√ 5 , 1√ 5 ) 15 66 x′′2 + 20 66 y′′2 = 1. Figura 6: Elipse de equação 19x2 − 4xy + 16y2 − 34x− 28y − 44 = 0 57 6 AS CURVAS CÔNICAS E O SOFTWARE GEOGEBRA COMO FERRAMENTA DE APRENDIZAGEM Nesta seção vamos definir as cônicas: elipse, hipérbole e parábola, como são apresentadas para os alunos do Ensino Médio. Em seguida apresentaremos uma proposta de atividade utilizando o software Geogebra para que os alunos consigam visualizar e entender como as cônicas são definidas. No currículo das escolas públicas do Estado de São Paulo, o assunto cônicas é previsto para ser ensinado durante o 3o Ano do Ensino Médio durante o 1o. bimestre. O conteúdo sobre as cônicas (elipse, hipérbole e parábola) no material fornecido pela Secretaria de Estado da Educação de São Paulo (SEE-SP) aos alunos regularmente matriculados, está junto com o estudo das circunferências e da sua equação reduzida. As competências e habilidades a serem contempladas para o assunto em questão são de desen- volver a capacidade do aluno se expressar por meio da linguagem algébrica as propriedades carac- terísticas de curvas muito frequentes na natureza, como a circunferência e as cônicas; capacidade de reconhecer em diversos contextos a presença das circunferências e das cônicas, expressas por meio de suas equações; capacidade de lidar com as equações das circunferências e das cônicas para resolver problemas simples em diferentes contextos. 6.1 Curvas Cônicas Por volta do século III a.C., mais precisamente, por volta dos anos 262 a.C. a 200 a.C. viveu um ma- temático chamado Apolônio de Perga, conhecido como o “Grande Geômetra”. Embora bem menos reconhecido que Euclides e Arquimedes, é um dos maiores matemáticos de todos os tempos. Assim como os “Elementos” de Euclides substituíram textos anteriores com propostas semelhantes, o tratado sobre “Cônicas” de Apolônio superou todos os rivais nesse campo, inclusive escritos do próprio Eu- clides. A obra “Cônicas” de Apolônio é composta de oito livros e nessa obra o matemático aborda as seções cônicas: Elipse, Hipérbole e Parábola a partir de um cone de duas folhas simplesmente variando a inclinação do plano de secção. Figura 7: Cone de duas folhas e formação das curvas cônicas Notação: A distância entre dois pontos A e B de um plano será denotada por d(A,B). 58 6.1.1 Circunferência A propriedade característica de uma circunferência é que todos os seus pontos P são equidistantes de um ponto fixo C que chamaremos de centro, e essa distância de C a P é chamada de raio que geralmente denotamos por r. Mais formalmente podemos definir uma circunferência como: Definição 6.1.1 Dados um ponto fixo C (centro) de um plano e uma constante r (raio), chamamos de circunferência o conjunto de pontos P do plano tal que d(P,C) = r. 6.1.2 Equação da Circunferência Figura 8: Circunferência Para obtermos a equação de uma circunferência λ considere um ponto da circunferência P = (x, y), C = (a, b) o centro e r o raio. Temos que a distância de P a C é sempre a constante r, d(P,C) = r ⇒ √ (x− a)2 + (y − b)2 = r ⇒ (x− a)2 + (y − b)2 = r2 (44) Esta última equação é que chamamos de equação reduzida da circunferência. Exemplo 6.1.1 A equação reduzida da circunferência λ de centro C = (−2, 3) e raio r = 4 é dada por (x− (−2))2 + (y − 3)2 = 42 ⇒ (x+ 2)2 + (y − 3)2 = 16 59 Logo a equação reduzida da circunferência λ é dada por (x+ 2)2 + (y − 3)2 = 16. Se desenvolvermos os quadrados da equação reduzida, x2 + 4x+ 4 + y2 − 6y + 9− 16 = 0⇒ x2 + y2 + 4x− 6y − 3 = 0 Obteremos a equação geral da circunferência λ de centro C = (−2, 3) e raio r = 4. 6.1.3 Elipse Definição 6.1.2 Dados dois pontos fixos F1 e F2 de um plano, tais que d(F1, F2) = 2c, com c > 0, chamamos de elipse o conjunto de pontos P do plano tal que d(F1, P ) + d(F2, P ) = 2a, com 2a > 2c. Figura 9: Elipse Observação 6.1.1 • Os pontos F1 e F2 são chamados de focos da elipse. A d(F1, F2) = 2c é a distância focal e, c é a semidistância focal. • Seja AB um segmento de reta cujo extremos são pontos de uma elipse, chamamos AB de corda da elipse. A corda AB da elipse que passa pelos focos F1 e F2 é chamada de eixo maior da elipse. • O ponto médio C do eixo maior é chamado de centro da elipse. • A corda MN que passa por C e é perpendicular ao eixo maior, é o eixo menor da elipse. A medida deste eixo MN será de 2b • Os pontos A, B, M e N são os vértices da elipse • Note que o triângulo MCF2 é retângulo em C e por isso vale a relação: a2 = b2 + c2 (Teorema de Pitágoras) • Chamaremos de excentricidade da elipse o número e = c a . 60 6.1.4 Equação da Elipse Como o objetivo é abordar o assunto para alunos do Ensino Médio, trataremos nesta seção apenas das equações das elipses onde seus eixos são paralelos aos eixos do sistema de coordenadas cartesiana. Primeiro vamos considerar uma elipse centrada na origem do sistema cartesiano, ou seja, C = (0, 0). Uma maneira bem fácil de se obter a equação desta elipse com eixo maior paralelo ao eixo das abs- cissas é considerar ela como uma circunferência “achatada”. Assim, basta reduzir, proporcionalmente todas as cordas perpendiculares a um determinado diâmetro de uma circunferência centrada na origem do sistema certesiano. Para este caso, em particular, basta tomar o diâmetro que coincide com o eixo maior da elipse. Considere um ponto P ′ = (x, y′) da circunferência λ de centro C = (0, 0) e raio a que satisfaz a equação x2 + y′2 = a2. Os pontos P = (x, y) da elipse centrada na origem do sistema e com eixo maior paralelo ao eixo das abscissas obtida reduzindo todas as ordenadas na proporção de a para b (a > b > 0) são tais que, y′ y = a b ⇒ y′ = y a b Substituindo o valor de y′ na equação da circunferência λ, x2 + y′2 = a2 ⇒ x2 + ( y a b )2 = a2 Portanto, a equação da elipse centrada na origem com eixo maior paralelo ao eixo das abscissas é dada por x2 a2 + y2 b2 = 1 Podemos também determinar a equação da elipse, centrada na origem com eixo maior paralelo ao eixo das abscissas, pela definição, ou seja, dado um ponto P = (x, y) de uma elipse com focos F1 = (−c, 0) e F2 = (c, 0) d(P, F1) + d(P, F2) = 2a⇒ √ (x+ c)2 + (y − 0)2 + √ (x− c)2 + (y − 0)2 = 2a⇒ √ (x+ c)2 + (y − 0)2 = 2a √ (x− c)2 + (y − 0)2 Elevando ambos os membros da última igualdade ao quadrado, (x+ c)2 + y2 = 4a2 + (x− c)2 + y2 − 4a √ (x− c)2 + y2 ⇒ x2 + 2cx+ c2 + y2 = 4a2 + x2 − 2cx+ c2 + y2 − 4a √ (x− c)2 + y2 ⇒ 4cx− 4a2 = −4a √ (x− c)2 + y2 ⇒ a2 − cx = a √ (x− c)2 + y2 Elevando ambos os membros da última igualdade ao quadrado, a4 − 2cxa2 + c2x2 = a2 ( (x− c)2 + y2 ) ⇒ a4 − 2cxa2 + c2x2 = a2 ( x2 − 2cx+ c2 + y2 ) ⇒ a4 − 2cxa2 + c2x2 = a2x2 − 2cxa2 + a2c2 + a2y2 ⇒ a4 + c2x2 = a2x2 + a2c2 + a2y2 ⇒ c2x2 − a2x2 − a2y2 = a2c2 − a4 ⇒ (c2 − a2)x2 − a2y2 = a2(c2 − a2) (45) Utilizando o fato que, a2 = b2 + c2 ⇒ −b2 = c2 − a2, voltando e substituindo em (45), −b2x2 − a2y2 = −b2a2 ⇒ −b2x2 −b2a2 − a2y2 −b2a2 = −b2a2 −b2a2 61 Portanto, chegamos na mesma a equação da elípse centrada na origem e com eixo real paralelo ao eixo das abscissas encontrada anteriormente. x2 a2 + y2 b2 = 1 De maneira análoga podemos determinar que a equação da elipse centrada na origem e com eixo maior paralelo ao eixo das ordenadas é dada por x2 b2 + y2 a2 = 1 Agora, se as elipses possuirem centro qualquer C = (m,n), fora da origem do sistema cartesiano, basta aplicar um novo sistema de coordenadas cartesianas x′Cy′ e fazer uma translação, { x′ = x−m y′ = y − n Portanto, a equação da elipse com centro C = (m,n) e eixo maior paralelo ao eixo das abscissas é dada por (x−m)2 a2 + (y − n)2 b2 = 1 e a equação da elipse com centro C = (m,n) e eixo maior paralelo ao eixo das ordenadas é dada por (x−m)2 b2 + (y − n)2 a2 = 1 6.1.5 Hipérbole Definição 6.1.3 Fixados dois pontos F1 e F2 de um plano, tais que, d(F1, F2) = 2c, com c > 0, chama- se hipérbole o conjunto de pontos P do plano cujas diferenças, em módulo, das distâncias são iguais a uma constante 2a, com 0 < 2a < 2c. Ou seja, |d(F1, P )− d(F2, P )| = 2a. Figura 10: Hipérbole 62 Observação 6.1.2 • Os pontos F1 e F2 são os focos da hipébole. • A medida 2c é a distância focal e c é a semidistância focal. • Os pontos A e B, onde a hipérbole intercepta o segmento F1F2 são chamados de vértices da hipérbole. • O segmento AB é chamado de eixo real da hipérbole, e sua medida é igual a 2a. • O ponto médio C do segmento AB que também é ponto médio do segmento F1F2 é chamado de centro da hipérbole. • O segmento MN tal que AM = AN = BM = BN = c é chamado de eixo imaginário da hipérbole (Note que o segmento MN está sobre a mediatriz do eixo real). Os segmentos MC e NC tem medidas iguais a b. Note que o triângulo MCF2 é retângulo em C e por isso vale a relação: a2 = b2 + c2 (Teorema de Pitágoras). • Chama-se de retângulo de referência da hipérbole o retângulo PQRS cujos pontos médios dos lados são A, B, M e N . As retas PR e QS são chamadas de assíntotas da hipérbole. • Chamamos de excentricidade da hipérbole o número e = c a . 6