Universidade Estadual Paulista “Júlio de Mesquita Filho” Instituto de Geociências e Ciências Exatas Campus de Rio Claro Álgebra motivada pela Geometria Denis Fermino Dissertação apresentada ao Programa de Pós-Graduação – Mestrado Profissional em Matemática Universitária como requisito par- cial para a obtenção do grau de Mestre Orientador Prof. Dr. Vanderlei Marcos do Nascimento 2013 TERMO DE APROVAÇÃO Denis Fermino Álgebra motivada pela Geometria Dissertação aprovada como requisito parcial para a obtenção do grau de Mestre no Curso de Pós-Graduação Mestrado Profissional em Matemática Universitária do Instituto de Geociências e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, pela seguinte banca examina- dora: Prof. Dr. Vanderlei Marcos do Nascimento Orientador Prof. Dr. Thiago de Melo Departamento Matemática - UNESP/Rio Claro Profa. Dra. Rita de Cássia Pavani Lamas Departamento de Matemática - UNESP/São José do Rio Preto Rio Claro, 09 de Dezembro de 2013 Dedico aos meu pais, Sebastião Fermino e Sueli Pedroso Fermino. Agradecimentos Agradeço a Deus por ter me dado suporte para concluir este trabalho. Aos meus pais que sempre estiveram me apoiando em todas as circunstâncias. Aos amigos que estiveram por perto vivenciando minhas angustias e alegrias em todo este processo e aos que não tão próximos literalmente, mas estiveram intercedendo por mim. De modo especial, ao Prof. Vanderley Marcos do Nascimento por ter acreditado em mim e me dado esta oportunidade. Ao Prof. Dr. Thiago de Melo e a Profa. Dra. Rita de Cássia Pavani Lamas pelos auxílios e opiniões. Mais uma vez a Deus por ter colocado grandes pessoas no meu caminho para que eu pudesse crescer mais. A mente que se abre para um nova ideia jamais voltará ao seu tamanho original. Albert Einstein Resumo Este trabalho se inicia em busca de uma resposta para a construtibilidade de números reais baseado nas construções fundamentais no plano com compasso e uma régua não graduada. Com a tal resposta apresentamos uma solução para os três prob- lemas Gregos. Para dar uma solução para um outro problema Grego famoso, o prob- lema de construir polígonos regulares, reunimos conceitos e resultados da Algebra que são fundamentais na formulação algébrica da construtibilidade geométrica. Com estes resultados, apresentamos uma condição necessária para o n-ágono regular ser con- strutível. Palavras-chave: Construtibilidade, Polinômio, Extensão. Abstract This work begins in search of an answer to the constructability of real numbers based on the fundamental constructions in the plane using compass and no graduated ruler. With this response we present a solution to the three Greek problems. To give a solution to another famous Greek problem, the construction of regular polygons, we ’ve used some Algebra concepts and results that are fundamental in algebraic formulation of geometric constructability. With these results, we shows a necessary condition to the regular polygons being constructible. Keywords: Constructibility, Polynomials, Extension. Lista de Figuras 1.1 Segmento AD de comprimento a− b e AC de comprimento a+ b. . . . 22 1.2 Segmento AD de comprimento ab. . . . . . . . . . . . . . . . . . . . . . 22 1.3 Segmento AD de comprimento a/b. . . . . . . . . . . . . . . . . . . . . 23 1.4 Construção da raiz quadrada de um comprimento a. . . . . . . . . . . . 24 1.5 Um arco de 20◦. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.1 O n-ágono regular no círculo unitário. . . . . . . . . . . . . . . . . . . . 57 3.2 Ângulos externos do n-ágono regular. . . . . . . . . . . . . . . . . . . . 58 3.3 Representação geométrica de um número complexo. . . . . . . . . . . . 60 3.4 Raízes n-ésimas da unidade no círculo unitário. . . . . . . . . . . . . . 61 Sumário 1 Os Três Problemas Gregos 21 1.1 Comprimentos Construtíveis . . . . . . . . . . . . . . . . . . . . . . . . 21 1.2 Duplicação do Cubo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 1.3 Trissecção do Ângulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.4 Quadratura do Círculo . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2 Polinômios: conceitos fundamentais 37 2.1 Aritmética dos Polinômios . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2 Raízes de Polinômios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3 Extensão de Corpos 51 3.1 Extensões Simples, Múltiplas e Finitas . . . . . . . . . . . . . . . . . . 51 3.2 Revendo as Construções Geométricas . . . . . . . . . . . . . . . . . . . 56 3.3 Raízes de Números Complexos . . . . . . . . . . . . . . . . . . . . . . . 58 3.4 Construtibilidade de Polígonos Regulares . . . . . . . . . . . . . . . . . 62 Referências 69 Introdução Problemas de construções geométricas sempre foram um assunto predileto da Geo- metria. Com a utilização apenas da régua e do compasso, uma grande diversidade de construções pode ser executada. Contudo, provas da impossibilidade de construções são, em geral, difíceis de serem obtidas via argumentos geométricos. Os três problemas gregos clássicos e a questão de construtibilidade de polígonos regulares desempenharam papel fundamental no desenvolvimento de grande parte da Matemática. A simplicidade com que esses problemas podem ser enunciados é uma forte aliada para motivação no ensino da Matemática. Contudo, o tratamento que a maioria dos textos dá para o assunto apresenta-o como um subproduto da Teoria de Galois, a qual, em geral, não é apresentada nos cursos de Licenciatura. Assim, torna-se interessante disponibilizar um texto que apresenta um tratamento alternativo. Isso é feito de forma bastante interes- sante na referência básica para este trabalho que é [1]. De nossa parte, a maioria das vezes, nos propusemos a explicitar mais detalhes técnicos; noutras vezes explicitamos passos conceituais que acreditamos colocar mais luz sobre o assunto. No Capítulo 1 apresentamos a tradução algébrica da construtibilidade geométrica e, segundo ela, abordamos os problemas gregos clássicos. Ainda que essa abordagem possa ser considerada motivadora para os próximos capítulos, a intensidade dessa motivação é de difícil quantificação já que em casos particulares podemos utilizar argumentos específicos. Perceber que esses argumentos são, de fato, particularidades é que faz grandiosa a teoria que os contemplam como tais. Apenas no Capítulo 3 é que poderemos apreciar essa grandiosidade; todo o Capítulo 2 é dedicado a apresentar os conceitos da Álgebra que serão ferramentas para isso. No Capítulo 3, além de considerar os problemas gregos clássicos sob um novo olhar, também abordaremos a questão de construtibilidade dos polígonos regulares sob esse novo olhar. 19 1 Os Três Problemas Gregos 1.1 Comprimentos Construtíveis Um passo importante para abordar os problemas gregos clássicos de construções geométricas será dado nesta seção, na qual devemos responder a seguinte questão: Dado um segmento de reta de comprimento 1 no plano, para quais a ∈ R podemos construir um segmento de comprimento a? Como usual na Geometria, devemos considerar comprimentos sendo não-negativos. Naturalmente, precisamos pôr um olhar muito cuidadoso para as regras que regem às construções. Construção será entendida como sendo uma sequência finita de passos com um compasso ou com uma régua não graduada. Os passos que podem ser feitos com estes instrumentos são chamadas de construções fundamentais. São eles: 1. Dados 2 pontos, podemos desenhar um segmento de reta unindo eles. 2. Dados 2 pontos, o segmento da reta que os une pode ser estendido ao longo dessa reta tanto quanto desejado. 3. Dados um ponto e um segmento de reta, podemos desenhar um círculo centrado nesse ponto e de raio igual ao comprimento do segmento tomado. Seguirá facilmente do Lema 1.1 que dado um segmento de comprimento unitário, todo segmento de comprimento racional é construtível. Vejamos: Lema 1.1. Dados segmentos de comprimento 1, a e b, é possível construir segmentos de comprimento a+ b, a− b (quando a > b), ab, e a/b (quando b ̸= 0). Demonstração. Considere uma reta s. Sobre ela, marque o segmento AB de compri- mento a e o segmento BC de comprimento b. Construa uma circunferência com centro em B e raio BC. Logo, a circunferência intercepta s nos pontos C e D tais que B está entre A e C, e D está entre A e B. Como BD tem o mesmo comprimento que BC, o segmento AD tem comprimento a− b e AC tem comprimento a+ b. 21 22 Os Três Problemas Gregos Figura 1.1: Segmento AD de comprimento a− b e AC de comprimento a+ b. Para obtermos ab, primeiro construímos duas semirretas não colineares de mesma origem P . Sobre uma destas semi-retas marquemos o segmento PA de comprimento a e na outra, o segmento PB de comprimento 1. Conectemos as extremidades dos segmentos, formando o triângulo ∆PBA. Sobre a semirreta na qual o comprimento 1 foi marcado, marquemos o segmento BC de comprimento b. Se uma semirreta é construída através do ponto C paralela ao lado AB do ∆APB, ela intercepta a semirreta que passa por PA em um ponto D criando um segmento AD. Pelo teorema de Tales, a 1 = AD b . Logo, ab = AD. Figura 1.2: Segmento AD de comprimento ab. Para obtermos a/b, analogamente construímos duas semirretas não colineares de origem P . Sobre uma dessas semirretas marquemos o segmento PA de comprimento a e na outra, o segmento PB de comprimento b. Conectemos as extremidades dos segmentos, formando o triângulo ∆PBA. Sobre a semirreta no qual o comprimento b foi marcado, marquemos o segmento BC de comprimento 1. Se uma semirreta é construída através do ponto C paralela ao lado AB do ∆APB, ela intercepta a semirreta que passa por PA em um ponto D criando um segmento AD. Pelo teorema de Tales, a b = AD 1 . Logo, a/b = AD. Comprimentos Construtíveis 23 Figura 1.3: Segmento AD de comprimento a/b. Chamamos um número real a de construtível se a = 0 ou se, dado um segmento de comprimento 1, é possível construir um segmento de comprimento |a|. Pelo Lema 1.1, se x, y ∈ R são números construtíveis, podemos concluir que x+ y, x− y, xy e x/y com y ̸= 0 também são construtíveis. Disto, segue que todos os números racionais são construtíveis, pois qualquer número inteiro pode ser construído por adição ou subtração de um número apropriado de 1’s e assim, qualquer quociente de inteiros pode ser obtido (números racionais). Seja F um subconjunto dos números reais. Dizemos que F é um corpo se ele satis- faz duas condições: (1) F é fechado sob as “operações racionais"(adição, subtração, multiplicação e di- visão), isto é, sempre que estas operações são aplicadas a pares de elementos de F , o resultado é um elemento de F . (2) O número 1 é um elemento de F . (Tal condição exclui os casos: F = ∅ e F = {0}). Vale observar que sendo as operações em F aquelas de R, as propriedades distribu- tiva e associativa valem para os elementos de F. É claro que o conjunto dos números racionais Q e dos números reais R são corpos, e pelo Lema 1.1 o conjuntos dos números construtíveis também é um corpo. Em nossa busca de uma descrição para números construtíveis, é importante notar que é possível, utilizando-se apenas elementos do corpo F construir um elemento que não pertence ao corpo F . Este é o caso em que F não é fechado sob a operação de extrair a raiz quadrada de um número positivo: Lema 1.2. Dados segmentos de comprimentos 1 e a, um segmento de comprimento √ a pode ser construído. 24 Os Três Problemas Gregos Figura 1.4: Construção da raiz quadrada de um comprimento a. Demonstração. Considere uma reta s. Sobre ela marque o segmento AB de compri- mento a e o segmento BC de comprimento 1 com A−B−C. Marque o ponto D sobre s como sendo o ponto médio do segmento AC. Trace a circunferência de centro em D e raio AD. Trace a reta perpendicular a s passando por B de modo a interceptar a circunferência em um ponto P. Assim, o segmento BP terá comprimento √ a pela semelhança entre os triângulos △ABP e △PBC. Pelos lemas 1.1 e 1.2, se todos os números de um corpo F são construtíveis, então todos os números da forma a+ b √ k também são, onde a, b e k pertencem a F e k > 0. É claro, se √ k está em F , esse conjunto é simplesmente o próprio F . Mas se √ k não está em F , este novo conjunto contém F como um subconjunto próprio. Neste caso F ( √ k) é chamado de uma extensão quadrática de F . Lema 1.3. Se F é um corpo e se k ∈ F , k > 0, então F ( √ k) também é um corpo. Demonstração. Como 1 ∈ F , 1 ∈ F ( √ k). Tudo que precisamos mostrar agora é que a soma e o produto de elementos de F ( √ k) estão em F ( √ k) (ou seja, F ( √ k) é fechado sob as operações racionais). Sejam a, b, c e d pertencentes F . (1) soma: (a+ b √ k) + (c+ d √ k) = (a + c) + (b + d) √ k, (2) produto: (a+ b √ k) (c+ d √ k) = (ac+ bdk) + (ad+ bc) √ k. Comprimentos Construtíveis 25 Sabemos agora que todo número racional é construtível e que todo número que pode ser calculado a partir de racionais por uma sequência finita de operações racionais ou de extração de raiz quadrada também é construtível. Por exemplo, o número 4 √ 13 + 4 3 √√ 6 + √ 1 + 2 √ 7 é construtível. Podemos construí-lo com a seguinte sequência de operações: 7, √ 7, √ 7 + √ 7 = 2 √ 7, 1, 1 + 2 √ 7, √ 1 + 2 √ 7, 6, √ 6, √ 6 + √ 1 + 2 √ 7, √ √ 6 + √ 1 + 2 √ 7, 4 3 , 4 3 √ √ 6 + √ 1 + 2 √ 7, 13, √ 13, √√ 13 = 4 √ 13, 4 √ 13 + 4 3 √ √ 6 + √ 1 + 2 √ 7. Estas operações podem ser convenientemente reescritas em termos de corpos: Lema 1.4. Seja a ∈ F. Se existe uma sequência finita de corpos Q = F0 ⊂ F1 ⊂ · · · ⊂ Fn−1 ⊂ Fn, com a ∈ Fn, tal que para cada j, 0 6 j 6 n − 1, Fj+1 é uma extensão quadrática de Fj, então a é construtível. Demonstração. Por indução sobre n. Temos que se n = 0, a é racional e portanto construtível. Supondo agora que o teorema é válido para n = r, mostremos que ele é válido para n = r + 1. Seja a ∈ Fr+1. Logo, a é da forma a = ar + br √ kr. Pela construção de Fr+1, ar, br e kr pertencem a Fr. Por hipótese de indução, Fr é construtível e portanto todos seus elementos são construtíveis. Pelos Lemas 1.1 e 1.2, segue que a = ar + br √ kr é construtível. Como exemplo, uma tal sequência de corpos para o número 4 √ 13+4 3 √√ 6 + √ 1 + 2 √ 7, temos a seguinte: F0 = Q, F1 = F0( √ 7), F2 = F1( √ 1 + 2 √ 7), F3 = F2( √ 6), F4 = F3( √ √ 6 + √ 1 + 2 √ 7), F5 = F4( √ 13), F6 = F5( √√ 13). O lema 1.4 dá uma condição suficiente para um número ser construtível. Seria também, esta condição necessária? A resposta é sim. A fim de ver isso, vamos fazer uso de um pouco de geometria analítica elementar. 26 Os Três Problemas Gregos Se F é um corpo, o conjunto de todos os pontos (x, y) no plano Cartesiano tais que x e y estão em F será denominado como plano de F e denotado por F 2. A idéia é que, quando os elementos de F são construtíveis, também são os elementos de F 2 os quais fornecem pontos para novas construções, conforme as definições 1.1 e 1.2. Um subconjunto S ⊂ R2 é dito ser uma reta em R2, se S é o conjunto solução de uma equação da forma ax+ by + c = 0, com a, b e c constantes, sendo a ̸= 0 ou b ̸= 0, e x, y incógnitas. (Nesse caso, dizemos que ax+ by + c = 0 é uma equação de S). Definição 1.1. Uma reta S em R2 é dita ser uma F − reta se existem (x1, y1) ̸= (x2, y2) ∈ F 2 tais que (x1, y1) ∈ S e (x2, y2) ∈ S. Um subconjunto S ⊂ R2 é dito ser uma circunferência em R2, se S é o conjunto solução de uma equação da forma x2 + y2 + ax+ by + c = 0, com a, b, c constantes sendo, a2 4 + b2 4 − c > 0 e x, y incógnitas. Proposição 1.1. Um subconjunto S ⊂ R2 é uma circunferência se, e somente se, existem (x1, y1) ̸= (x2, y2) ∈ R2 tais que S é o conjunto solução de uma equação da forma (x− x1) 2 + (y − y1) 2 = (x2 − x1) 2 + (y2 − y1) 2. Demonstração. (⇒) Seja S ⊂ R2. Suponha que existam (x1, y1) ̸= (x2, y2) ∈ R2 tais que S é o conjunto solução de (x− x1) 2 + (y − y1) 2 = (x2 − x1) 2 + (y2 − y1) 2. Temos, x2 − 2xx1 + x2 1 + y2 − 2yy1 + y21 = x2 2 − 2x2x1 + x2 1 + y22 − 2y2y1 + y21, x2 + y2 − 2x1x− 2y1y − x2 2 − y22 + 2x2x1 + 2y2y1 = 0. Logo, S é uma equação da circunferência com a = −2x1, b = −2y1 e c = −x2 2 − y22 + 2x2x1 + 2y2y1 (⇐) Agora, suponha que S tenha uma equação da forma x2+y2+ax+by+c = 0 com os coeficientes a, b, c constantes, sendo a2 4 + b2 4 − c > 0 e x, y incógnitas. Completando quadrados temos (x+ a 2 )2+(y+ b 2 )2− a2 4 − b2 4 + c = 0. Tomando (x1, y1) = ( −a 2 ; −b 2 ) e (x2, y2) = ( −a 2 + √ a2 4 + b2 4 − c; −b 2 ) vemos que (x1, y1) ∈ S e que (x+ a 2 )2+(y+ b 2 )2 = (x1 − x2) 2 + (y1 − y2) 2. Comprimentos Construtíveis 27 Definição 1.2. Uma circunferência S em R2 é dita ser uma F − circunferência se existem (x1, y1) ̸= (x2, y2) ∈ F 2 tais que (x2, y2) ∈ S e que (x− x1) 2 + (y − y1) 2 = (x2 − x1) 2 + (y2 − y1) 2. A importância dessas noções está no fato de que qualquer construção fundamental usando somente pontos do plano de um corpo F envolve construções de (ou porções de) uma F − reta ou uma F − circunferência. As duas primeiras construções fundamentais seguem da definição de F − reta, para quaisquer dois pontos dela.Para a terceira construção fundamental, a de um círculo com centro dado e raio igual ao comprimento do segmento que conecta dois pontos dados, suponha que o centro seja (x1, y1) e o raio seja dado pelo segmento conectando (a, b) e (c, d), onde todas as coordenadas estão em F . Está, o círculo definido por esses elementos no plano de F e é um F−círculo, pois seu centro está no plano de F e ele passa pelo ponto (x2, y2) = (x1 + (c− a), y1 + (d− b)). Lema 1.5. Um subconjunto S de R2 é uma F − reta se, e somente se, S tem uma equação da forma ax+ by + c = 0 com os coeficientes a, b e c ∈ F. Demonstração. (⇒) Seja S ⊂ R2 uma F − reta; por definição existem (x1, y1) ̸= (x2, y2) ∈ F 2 tais que, (x1, y1) ∈ S e (x2, y2) ∈ S. Por ser uma reta, temos que S é o conjunto solução de uma equação da forma ax+ by + c = 0, com a ̸= 0 ou b ̸= 0. Consideremos os casos para os possíveis a, b, c e para os possíveis (x1, y1) e (x2, y2). Se c = 0, a equação é ax + by = 0. Caso b = 0 e a ̸= 0, a equação é ax = 0 que (dividindo por a) é equivalente a 1x = 0. Assim, basta tomar a = 1. Caso a = 0 e b ̸= 0, é análogo. Portanto, nestes casos temos a, b e c ∈ F. Se c = 0, a ̸= 0 e b ̸= 0 a equação ax+ by = 0 é equivalente a a b x+ 1y = 0. Como (x1, y1) e (x2, y2) ∈ S temos, a b x1 + 1y1 = 0 e a b x2 + 1y2 = 0. Caso x1 = 0 e x2 = 0 teremos que y1 = y2, o que é impossível (pois, (x1, y1) ̸= (x2, y2) por hipótese). Vejamos então o caso em que x1 ̸= 0 ou x2 ̸= 0. Suponha x1 ̸= 0. Da primeira equação temos, a b = −y1 x1 ∈ F. Assim, −y1 x1 x+ 1y = 0 é uma equação da reta com coeficientes em F. Supondo agora x2 ̸= 0, de modo análogo conseguiremos uma equação com coefi- cientes em F. 28 Os Três Problemas Gregos Se c ̸= 0, a equação ax+ by + c = 0 é equivalente a a c x+ b c y + 1 = 0. Como (x1, y1) e (x2, y2) ∈ S temos, a c x1 + b c y1 + 1 = 0 e a c x2 + b c y2 + 1 = 0. A fim de facilitar a escrita consideremos a′ = a c e b′ = b c . Então as equações acima ficam, a′x1 + b′y1 + 1 = 0 e a′x2 + b′y2 + 1 = 0. Caso x1 ̸= 0, isolando a′ na primeira equação, temos a′ = −b′y1 − 1 x1 . Substituindo a′ na segunda equação, (−b′y1 − 1) x1 x2 + b′y2 + 1 = 0, −b′y1x2 − x2 + b′y2x1 + x1 x1 = 0, b′(y2x1 − y1x2)− x2 + x1 = 0. Se y2x1 − y1x2 ̸= 0, temos b′ = x2 − x1 y2x1 − y1x2 ∈ F. Substituindo b′ em a′ = −b′y1−1 x1 obtemos a′ = x1−x2 y2x1−y1x2 · y′1−1 x1 ∈ F. Assim, x1 − x2 y2x1 − y1x2 · y ′ 1 − 1 x1 x+ x2 − x1 y2x1 − y1x2 y + 1 = 0, é uma equação da reta com coeficientes em F. Caso y2x1 − y1x2 = 0, segue que x1 = x2 e portanto temos a′x1 + b′y1 + 1 = 0 e a′x1 + b′y2 + 1 = 0. Subtraindo uma equação da outra, obtemos b′(y1 − y2) = 0. Como x1 = x2, necessariamente y1 ̸= y2. Logo y1 − y2 ̸= 0 e b′ = 0. Portanto, nesse caso temos a′ = −1 x1 ∈ F. Comprimentos Construtíveis 29 Assim, −1 x1 x+ 0y + 1 = 0 é uma equação da reta com coeficientes em F. Se y1 ̸= 0 ou x2 ̸= 0 ou y2 ̸= 0, de modo análogo conseguiremos uma equação com coeficientes em F. O caso em que x1 = 0 e x2 = 0 é impossível de ocorrer, pois a′0 + b′0 + 1 = 0 ⇒ 1 = 0, o que é um absurdo. Já para o caso x1 = 0 e y1 ̸= 0, temos b′y1 + 1 = 0 e a′x2 + b′y2 + 1 = 0. Isolando b′ na primeira equação temos b′ = −1 y1 ∈ F. Substituindo na segunda obtemos, a′x2 + −1 y1 + 1 = 0 ⇒ a′x2 = 1 y1 − 1. Se x2 = 0, teríamos subtraindo as equações deste caso uma da outra que b′(y1−y2) = 0, o que implica b′ = 0 (pois, y1 − y2 ̸= 0). Mas isso é impossível pois temos b′ = −1 y1 da primeira equação. Logo x2 ̸= 0, e portanto a′ = 1 y1 − 1 x2 ∈ F . Assim, 1 y1 − 1 x2 x+ −1 y1 y + 1 = 0, é uma equação da reta com coeficientes em F. Agora, caso x1 ̸= 0 e y1 = 0, de modo análogo conseguiremos uma equação com coeficientes em F. Portanto, em todos os casos conseguiremos uma equação da forma ax+ by + c = 0, com coeficientes em F. (⇐) Seja S ⊂ R2 uma reta com equação ax + by + c = 0 com a, b, c ∈ F e a ̸= 0 ou b ̸= 0. Suponha, sem perda de generalidade, que a ̸= 0. Então considere os pontos (−b− c/a, a), (−b2−c a , b) ∈ F 2; facilmente se nota que estes pontos pertencem a reta S o que conclui a demonstração. 30 Os Três Problemas Gregos Lema 1.6. Se um subconjunto S de R2 é uma F − circunferência, então S tem uma equação da forma x2 + y2 + ax+ by + c = 0 com os coeficientes a, b e c ∈ F. Demonstração. Seja S ⊂ R2 uma F − circunferência. Então existem (x1, y1) ̸= (x2, y2) ∈ F 2 tais que (x2, y2) ∈ S e que (x− x1) 2 + (y− y1) 2 = (x2 − x1) 2 + (y2 − y1) 2. Temos, x2 − 2xx1 + x2 1 + y2 − 2yy1 + y21 = x2 2 − 2x2x1 + x2 1 + y22 − 2y2y1 + y21, x2 + y2 − 2x1x− 2y1y − x2 2 − y22 + 2x2x1 + 2y2y1 = 0. Logo, S tem uma equação da forma esperada com a = −2x1, b = −2y1 e c = −x2 2 − y22 + 2x2x1 + 2y2y1 ∈ F. Como o único caminho para construir um segmento é pela construção de seus pontos extremos, e como os únicos caminhos para construir um ponto são pela intersecção de duas retas; ou pela intersecção de uma reta e uma circunferência, ou pela intersecção de duas circunferências, é importante determinar a natureza dessas intersecções. Lema 1.7. O ponto de intersecção de duas F − retas está em F 2. Os pontos de intersecções de uma F − reta e uma F − circunferência, assim como os pontos de intersecções de duas F − circunferências, ou estão no plano de F ou no plano de alguma extensão quadrática de F . Demonstração. No caso da intersecção de duas F − retas, ela é a solução simultânea de duas equações a1x+ b1y + c1 = 0, a2x+ b2y + c2 = 0, em que os coeficientes estão, pelo Lema 1.5, todos em F . Como a solução simultânea das duas equações envolve operações racionais com seus coeficientes que estão em F , segue que as soluções x e y estão em F , o que significa que (x, y) está no plano de F . No caso de uma F − reta e uma F − circunferência, também é a solução simultânea de duas equações a1x+ b1y + c1 = 0, x2 + y2 + a2x+ b2y + c2 = 0, nos quais os coeficientes estão todos em F . Como a1 e b1 não podem ser ambos 0, digamos que b1 ̸= 0 e suponhamos (x, y) uma solução. Então, da primeira equação, y = −c1 b1 − a1 b1 x. Quando substituímos este y na segunda equação, vemos que x satisfaz uma equação quadrática com coeficientes em F . Portanto x é da forma A±B √ k, com A,B e k em Comprimentos Construtíveis 31 F , sendo k > 0 (caso contrário, se k < 0, não haveria solução). Substituindo tal x na expressão para y também encontraremos uma expressão da forma A′ ± B′ √ k. Assim os pontos resultantes disto ou estão no plano de F , quando √ k ∈ F , ou ambos estão no plano de F ( √ k), quando √ k /∈ F . (Quando k = 0, temos somente um ponto de intercessão e ele está no plano de F .) No caso de duas F − circunferências, suponha (x, y) uma solução de x2 + y2 + a1x+ b1y + c = 0 e x2 + y2 + a2x+ b2y + c = 0, e subtraindo a primeira igualdade da segunda teremos que x e y satisfazem uma equação linear com coeficientes em F . Isto reduz a discussão à situação do caso anterior de reta e circunferência. Finalmente chegamos ao ponto em que é possível estabelecer e provar o resultado principal relativo a construtibilidade, e assim responder a pergunta feita na primeira parte desse capítulo. Teorema 1.1. As afirmações a seguir são equivalentes: (i) O número a é construtível. (ii) Existe uma sequência finita de corpos Q = F0 ⊂ F1 ⊂ · · · ⊂ Fn−1 ⊂ Fn, com a ∈ Fn, tal que para cada j, 0 6 j 6 n− 1, Fj+1 é uma extensão quadrática de Fj. Demonstração. (ii) ⇒ (i) É justamente o Lema 1.4. (i) ⇒ (ii) Se nos são dados os pontos (0, 0) e (1, 0) no plano cartesiano, por hipótese um segmento de comprimento |a| pode ser construído. Podemos usar o ponto (0, 0) e uma reta através de (0, 0) e (1, 0), para construir o ponto (a, 0), o qual chamaremos de P . É suficiente mostrar que P está em F 2 n para um corpo Fn do tipo descrito em (ii), isto é, um corpo cujos elementos podem ser obtidos de Q por uma sequência de extensões quadráticas. A construção de P envolve um número finito de construções fundamentais, cada uma dos quais resulta em um número finito de novos pontos como intersecções de vários tipos. Listamos todas essas na ordem de construção, onde os pontos resultantes no mesmo passo podem ser listados em qualquer ordem. O ponto P está nesta lista, digamos na M − ésima posição. Omitindo a lista depois de P (que incluiria apenas pontos construídos no mesmo passo que P ), temos: P1, P2, · · · , PM−1, PM . O teorema estará provado quando estabelecermos a seguinte afirmação: Existe um corpo F , obtido de Q por uma sequência de extensões quadráticas, tal que P1, P2, · · · , PM−1, PM estão todos F 2. Como P1 e P2 devem ser os dois pontos indicados (0, 0) e (1, 0), os quais estão no plano de Q, a afirmação está provada para M = 1 e M = 2. Mostremos que é válido para qualquer M . Lembremos que a construção de PM envolve apenas figuras construídas usando os pontos de P1 até PM−1, e pela hipótese 32 Os Três Problemas Gregos de indução, figuras no plano de algum corpo F̃ obtido de Q por uma sequência de extensões quadráticas. Mas então, pelo Lema 1.7, ou PM está no plano de F̃ ou no plano de F̃ ( √ k), para algum k ∈ F̃ com √ k /∈ F̃ . Em ambos os casos, tanto PM quanto os outros P ′ is estão todos no plano de um corpo do tipo requerido. Vale observar que esse teorema estabelece uma equivalência entre duas propriedades, uma geométrica e uma algébrica. Através deste teorema, temos a reformulação dos problemas geométricos para problemas algébricos. 1.2 Duplicação do Cubo Iniciaremos lembrando o problema clássico da “duplicação do cubo”: Dado um segmento de reta representando a aresta de um cubo, é possível construir outro segmento de reta representando a aresta de um cubo com o dobro do volume do primeiro? Se tomarmos nossa unidade de comprimento para ser o comprimento do segmento dado, então o desejado segmento deverá ter comprimento 3 √ 2. Então o problema é simplesmente verificar se 3 √ 2 é construtível ou não. Pelo Teo- rema 1.1, se 3 √ 2 fosse construtível, deveria existir uma sequência de extensões quadráti- cas de corpos associados a ele. Que isto é impossível, seguirá facilmente do lema a seguir. Lema 1.8. Seja F ( √ k) uma extensão quadrática de um corpo F . Se 3 √ 2 está em F ( √ k), então 3 √ 2 deve estar em F . Demonstração. Nos é dado que 3 √ 2 pode ser escrito da forma a+ b √ k, com a, b, k ∈ F ,√ k /∈ F . Temos que mostrar que b dever ser 0. O cálculo 3 √ 2 = (a+ b √ k) 2 = (a+ b √ k)3 2 = a3 + 3a2b √ k + 3ab2k + b3k √ k 2 = [a3 + 3ab2k] + [3a2b+ b3k] √ k implica que 3a2b+ b3k = 0, pois caso contrário √ k teria que ser um elemento de F . Mas, então, (a− b √ k)3 = [a3 + 3ab2k]− [3a2b+ b3k] √ k = 2 o que nos dá a− b √ k como raíz cúbica de 2. Por outro lado, como a função y = x3 é estritamente crescente, deve haver no máximo uma raíz cúbica para 2. Logo b deve ser 0 como queríamos. Trissecção do Ângulo 33 E agora segue o resultado principal: Teorema 1.2. É impossível “duplicar um cubo”. Demonstração. Como observado na introdução dessa seção, duplicar o cubo é equiva- lente a construir 3 √ 2. Se 3 √ 2 fosse construtível, pelo Teorema 1.1 existiria um sequência de corpos Q = F0 ⊂ F1 ⊂ · · · ⊂ Fn−1 ⊂ Fn, sendo que cada um é extensão quadrática do corpo anterior, de tal forma que 3 √ 2 ∈ Fn. A aplicação repetida do Lema 1.8 impli- caria em 3 √ 2 ∈ Q, mas é simples mostrar que 3 √ 2 /∈ Q. A ideia básica desta seção será ligeiramente generalizada na próxima seção, na qual será fornecida uma solução para o problema da trissecção do ângulo. 1.3 Trissecção do Ângulo Outro problema clássico levantado pelos gregos é se todo ângulo pode ser trissec- tado. A resposta é não como veremos em seguida. Como o ângulo de 60◦ pode ser construído, se ele pudesse ser trissectado, então o ângulo de 20◦ poderia se construído. Mas então, como ilustrado na figura 1.5, o valor de cos 20◦ poderia ser construído. Será mostrado, porém, que o número cos 20◦ é raiz de uma equação cúbica a qual não tem raiz construtível. Figura 1.5: Um arco de 20◦. Das fórmulas elementares de trigonometria temos, cos 3θ = cos(2θ + θ) = cos 2θ cos θ − sen 2θ sen θ = (cos2 θ − sen2 θ) cos θ − (2 sen θ cos θ) sen θ = cos3 θ − 3 sen2 θ cos θ = cos3 θ − 3(1− cos2 θ) cos θ = 4 cos3 θ − 3 cos θ. Quando θ = 20◦, cos 3θ = 1 2 , então o número cos 20◦ deveria ser uma raiz da equação cúbica: 8u3 − 6u− 1 = 0. 34 Os Três Problemas Gregos Fazendo nesta equação uma simples mudança de variável x = 2u temos, x3 − 3x− 1 = 0. Se cos 20◦ fosse construtível, então deveria ser possível construir uma raiz dessa equação. Como primeiro passo para a demonstração de que isto é impossível, faremos uma observação muito similar ao Lema 1.8. Lema 1.9. Seja F ( √ k) uma extensão quadrática de um corpo F . Se a equação x3 − 3x− 1 = 0 tem uma raiz em F ( √ k), então ela tem uma raiz em F . Demonstração. Se a equação tem uma raiz em F ( √ k), podemos denota-la por a + b √ k, em que a, b e k estão em F . Se b = 0, não temos nada a fazer, pois a ∈ F e então a é a raiz desejada. Se b ̸= 0, mostraremos que −2a é uma raiz e que ela está em F . Substituindo a raiz dada na equação temos, (a+ b √ k)3 − 3(a+ b √ k)− 1 = 0 a3 + 3a2b √ k + 3ab2k + b3k √ k − 3a− 3b √ k − 1 = 0 (a3 + 3ab2k − 3a− 1) + (3a2b+ b3k − 3b) √ k = 0. Como √ k /∈ F seque que (3a2b + b3k − 3b) = 0, pois caso contrário resolvendo a equação para √ k teremos √ k ∈ F . Logo, a3+3ab2k−3a−1 = 0. Dividindo a primeira igualdade por b (o qual não é zero), temos 3a2 + b2k − 3 = 0 a3 + 3ab2k − 3a− 1 = 0. Isolando b2k na primeira equação e substituindo o resultado na segunda temos a3 + 3a(3− 3a2)− 3a− 1 = 0 −8a3 + 6a− 1 = 0 (−2a)3 − 3(−2a)− 1 = 0 da qual podemos ver que −2a, que está em F , é uma solução da equação original. Agora o resultado principal torna-se mais acessível. Teorema 1.3. Nem todo ângulo pode ser trisectado. Demonstração. Se fosse possível trissectar todo ângulo, deveria ser possível trissectar o ângulo de 60◦ que é construtível. Mas, como observado anteriormente, isso deve implicar a construtibilidade de cos 20◦ e consequentemente a construtibilidade de uma raiz para a equação cúbica x3 − 3x− 1 = 0. Pelo Teorema 1.1, tal raiz deve pertencer a um corpo Fn situado numa sequência Q = F0 ⊂ F1 ⊂ · · · ⊂ Fn−1 ⊂ Fn em que cada corpo é uma extensão quadrática do corpo anterior. Pela repetida aplicação do Lema Quadratura do Círculo 35 1.9 deve existir uma raiz racional para a equação x3 − 3x− 1 = 0. Mostremos que isso é impossível. Se um número racional M/N , na forma irredutível, fosse uma raiz da equação, teríamos M3 N3 − 3M N − 1 = 0 e, então, M3 − 3MN2 −N3 = 0. Assim poderíamos reescrever M3 = N [3MN +N2] (1.1) e N3 = M [M2 − 3N2]. (1.2) De (1.1) concluímos que se N tem um fator primo p, então p deve dividir M3 e, portanto divide M . De (1.2) concluímos que se M tem um fator primo q, então q deve dividir N3 e, portanto divide N . Como M e N foram supostos não terem um fator em comum, os únicos valores possíveis para M e N são ±1, e então as únicas raízes racionais possíveis são ±1. Contudo nenhuma dessas raízes satisfaz a equação. Logo, a equação não tem raiz racional. Com isso podemos concluir que é impossível trissectar todo ângulo. 1.4 Quadratura do Círculo O terceiro problema clássico de construção, que é a quadratura do círculo, apresenta uma dificuldade muito superior às apresentadas nos problemas anteriores. A questão é: Dado um círculo, é possível construir um quadrado com a mesma área do círculo? Se tomarmos como unidade de comprimento o raio de um círculo, sua área é π, então a construção de um quadrado de mesma área implica na construção de um segmento de comprimento √ π ao qual necessita da construtibilidade de π. Mostrando que π não é construtível, concluímos que é impossível quadrar o círculo. A prova que π não é construtível consiste de duas partes principais: primeira, todo número cons- trutível é raiz de uma equação polinomial com coeficientes racionais; segunda, que π não pode ser uma raiz de equação polinomial com coeficientes racionais. Não incluiremos tal demonstração, mas o leitor interessado pode encontrá-la em todo detalhe na referência [1]. 2 Polinômios: conceitos fundamentais 2.1 Aritmética dos Polinômios Um polinômio p sobre um corpo F na indeterminada λ é uma soma formal p(λ) := ∞∑ i=0 aiλ i, em que ai ∈ F para todo i ∈ N e existe n tal que ai = 0 para todo i > n. Se ai = 0 para todo i > 1 dizemos que o polinômio é constante. Se além disso, a0 = 0 dizemos que o polinômio é nulo, e reciprocamente. Se p(λ) é um polinômio tal que ai = 0, ∀i > n, às vezes escreveremos p(λ) = a0 + a1λ+ · · ·+ anλ n. Reciprocamente se escrevemos p(λ) = a0 + a1λ + · · · + anλ n fica entendido que ai = 0, ∀i > n. Vale observar que nessa convenção não estamos supondo que n é o menor natural com a propriedade ai = 0, ∀i > n. Dado um polinômio p(λ) = a0 + a1λ+ · · ·+ anλ n, se ak ̸= 0 para algum 0 6 k 6 n e ai = 0 para todo i > k, dizemos que k é o grau do polinômio p(λ) e escrevemos deg(p(λ)) = k. Destacamos que não está definido grau para o polinômio nulo. Dado um corpo F , denotamos por F [λ] o conjunto de todos os polinômios sobre um corpo F na indeterminada λ. Definição 2.1. Sejam p(λ) = a0 + a1λ+ · · ·+ anλ n e q(λ) = b0 + b1λ+ · · ·+ bmλ m em F [λ]. Definimos p(λ) + q(λ) = c0 + c1λ+ · · ·+ ciλ i, onde ci = (ai + bi) e p(λ) · q(λ) = d0 + d1λ+ · · ·+ dkλ k, onde dj = j∑ i=0 aibj−i, j = 0, 1, . . . , k, sendo k = deg (p(λ)) + deg (q(λ)). 37 38 Polinômios: conceitos fundamentais A fim de facilitar a escrita no texto, denotaremos um polinômio p(λ) simplesmente por p e deg (p(λ)) por deg (p). É importante observar que (F [λ],+, ·) é um domínio de integridade, em que o polinômio nulo é o elemento neutro de F [λ] e o polinômio constante 1 é identificado como a unidade de F [λ]. Em se tratando do conjunto F [λ], observa-se nele várias propriedades muito si- milares às do conjunto Z. Em F [λ] nem todo elemento tem inverso multiplicativo. Similarmente à “divisão com resto” em Z, temos o algoritmo da divisão para polinômios, explicitado no Teorema 2.1 que segue: Teorema 2.1. Sejam f e g polinômios em F [λ], g ̸= 0. Então existem únicos polinômios q e r ∈ F [λ], tais que f = g · q + r, com r ou sendo identicamente nulo ou com grau menor que o de g (q é chamado quociente de f dividido pelo g, e r é chamado de resto da divisão). Demonstração. (Existência) Escrevamos: f(λ) = a0 + a1λ+ · · ·+ anλ n, g(λ) = b0 + b1λ+ · · ·+ bmλ m, com m > 0 e bm ̸= 0. Mostremos tal resultado considerando os casos: (i) Caso f = 0 (polinômio nulo), basta tomar q = r = 0; (ii) Caso f ̸= 0 e deg (f) < deg (g). Basta tomar q = 0 e r = f , assim temos f = 0 · g + f ; (iii) Caso f ̸= 0 e deg (f) > deg (g). Mostremos este caso por indução sobre o grau de f . Para o primeiro passo no argumento da indução, se deg (f) = 0 teremos que deg (g) = 0 (pois, caso contrário, deg (g) > deg (f), e portanto recairíamos no caso anterior). Assim, f = a0 e g = b0, com a0, b0 ̸= 0 ∈ F. Como a0 = a0 b0 b0 + 0, basta tomar q = a0 b0 e r = 0. Suponhamos agora que deg (f) = n > 0 e que o teorema seja válido para todo polinômio de grau k, com 0 6 k < n. Consideremos o polinômio h definido por, h = f − an bm λn−mg Aritmética dos Polinômios 39 e escrevamos f = an bm λn−mg + h. Se deg (h) = 0 ou deg (h) < bmλ n−m e r = h. Caso contrário, tem-se 0 < deg (h) < bmλ n−mg. Logo, pela hipótese de indução, existem polinômios q′ e r′ tais que h = q′g + r′, com r′ = 0 ou deg (r′) < deg (g). Assim, temos f − an bm λn−mg = q′g + r′, f = an bm λn−mg + q′g + r′, f = ( an bm λn−m + q′)g + r′, em que r′ = 0 ou deg (r′) < deg (g). Portanto, basta tomar q = an bm λn−m + q′ e r = r′. Isto prova a existência. (Unicidade) Suponha que se tenha f = q1g + r1 e f = q2g + r2, com ri = 0 ou deg (ri) < deg (g), para i = 1, 2. Subtraindo uma expressão para f da outra, obtemos r1 − r2 = (q2 − q1)g. Se r1 − r2 ̸= 0, temos que q2 − q1 ̸= 0 pois g ̸= 0 e F [λ] é um domínio de integridade. Assim, como deg (r1 − r2) < deg (g) e deg (r1 − r2) = deg ((q1 − q2)g) > deg (g) temos uma contradição. Devemos então ter, necessariamente r1−r2 = 0. Assim, (q2−q1)g = 0 o que implica q2 − q1 = 0 e que garante a unicidade. Observamos que, no contexto do Teorema 2.1, se F̃ ⊂ F é um subcorpo contendo todos os coeficientes de f e g, então a demonstração acima implica que ambos q e r, na realidade, pertencem a F̃ [λ], um subanel de F [λ]. Dizemos que um polinômio g ̸= 0 divide um polinômio f , denotando por g|f , se o resto da divisão de f por g é o polinômio nulo. Neste caso, dizemos que g é um divisor de f . A expressão f/g é usada para o quociente de f dividido por g. Se f ̸= 0 e g é um divisor de f com deg g < deg f, dizemos que g é um divisor próprio de f . 40 Polinômios: conceitos fundamentais Observe que se deg (f) = 0, f não admite divisor próprio. Dizemos ainda que g é um divisor não-trivial se seu grau é maior que 0. Com estes conceitos de divisibilidade, podemos introduzir em F [λ] o conceito análogo a números primos em Z. Definição 2.2. Um polinômio não constante f ∈ F [λ] é chamado irredutível em F [λ] ou irredutível sobre F se ele não tem um divisor próprio não-trivial em F [λ]. Em outras palavras f é irredutível se não pode ser escrito como um produto de dois polinômios em F [λ] de graus menores. Como exemplo, λ2 + 1 é irredutível sobre Q. Mas irredutibilidade depende do corpo em questão. O mesmo polinômio λ2 + 1 é também irredutível sobre R, mas sobre C é redutível, ou seja, λ2 + 1 pode ser escrito pelo produto (λ−i)(λ+i). De fato, sobre C todo polinômio é completamente redutível, isto é, pode ser escrito como um produto de fatores de grau um. Dado um polinômio sobre um corpo F , em geral, é bastante difícil determinar se ele é irredutível ou não. Para o corpo Q, um critério útil será dado pelo Teorema 2.2. Felizmente, este é o caso que detém a maior importância para o que faremos. Para a demonstração deste Teorema, devemos fazer uso do Lema de Gauss. Lema 2.1 (Gauss). Se um polinômio com coeficientes inteiros pode ser escrito como um produto de dois polinômios de graus menores com coeficientes racionais, então ele pode ser escrito como um produto de dois polinômios de graus menores com coeficientes inteiros. Demonstração. Suponha que f = gh, onde f tem coeficientes inteiros e g e h têm coeficientes racionais. (Aqui e em outros lugares, justaposição será entendido como significando multiplicação de polinômios). Sem perda de generalidade, podemos as- sumir que os coeficientes de f são relativamente primos (i.e., o maior divisor comum dele é 1). Escrevamos g(λ) = an bn λn + an−1 bn−1 λn−1 + · · ·+ a0 b0 , h(λ) = cm dm λm + cm−1 dm−1 λm−1 + · · ·+ c0 d0 , onde os ai, bi, cj, dj ∈ Z, ∀i = 1, . . . , n e ∀j = 1, . . . ,m. Multiplicando o polinômio g pelo produto B = bnbn−1 · · · b0 temos como resultado um polinômio com coeficientes inteiros. Agora, dividindo Bg por A, sendo A o maior divisor comum dos coeficientes inteiros de Bg, temos (B/A)g(λ) = Anλ n + An−1λ n−1 + · · ·+ A0, um polinômio com coeficientes relativamente primos. Analogamente, obtemos (D/C)h(λ) = Cmλ m + Cm−1λ m−1 + · · ·+ C0, Aritmética dos Polinômios 41 que também é um polinômio com coeficientes relativamente primos. De f = gh, obtemos BDf = (AC)[(B/A)g] · [(D/C)h]. Como o produto BD é o maior divisor comum dos coeficientes do polinômio BDf (pois os coeficientes de f são relativamente primos) no lado esquerdo da igualdade e o produto AC é um divisor comum dos coeficientes do polinômio do lado direto, então AC|BD. Definindo E = BD/AC, um inteiro, temos Ef(λ) = [Anλ n + An−1λ n−1 + · · ·+ A0]× [Cmλ m + Cm−1λ m−1 + · · ·+ C0]. Mostrando que E = ±1, teremos escrito f na forma desejada. Suponha E ̸= ±1. Logo, E tem um fator primo p. Como p não pode dividir todos os A ′s i , pois eles são relativamente primos, então existe um menor inteiro i > 0 tal que p não divide Ai. Similarmente, existe um menor inteiro j > 0 tal que p não divide Cj. Comparando o coeficiente de λi+j em ambos os lados da igualdade, temos no lado esquerdo, que este coeficiente é divisível por E (pois é o maior divisor comum dos coeficientes desse lado). Logo, este coeficiente também é divisível por p. Do lado direito, o coeficiente de λi+j é, i−1∑ k=0 AkCi+j−k + AiCj + i+j∑ k=i+1 AkCi+j−k. Uma vez que cada Ak na primeira soma é divisível por p, segue que a soma também é. Como cada Ci+j−k na segunda soma é divisível por p, a soma também é. Mas por definição de i e j, os termos AiCj não são divisíveis por p. Assim, toda a soma não pode ser divisível por p, o que é uma contradição (pois se p divide E, então deveria dividir toda a soma também). Então, E = ±1. Agora podemos apresentar uma condição suficiente para irredutibilidade sobre Q dos polinômios com coeficientes inteiros. É o chamado critério de irredutibilidade de Eisenstein. Teorema 2.2. Seja f(λ) = a0+a1λ+ · · ·+an−1λ n−1+anλ n, com coeficientes inteiros. Se existe um primo p tal que: (i) p divide a0, a1, · · · , an−1; (ii) p não divide an; e (iii) p2 não divide a0; então f é irredutível sobre Q. Demonstração. Se f fosse redutível, ele poderia ser escrito como um produto de polinô- mios gh sobre Q cada um com grau > 1. Pelo Lema 2.1, podemos assumir que g e h têm coeficientes inteiros. Se escrevermos g(λ) = bkλ k + bk−1λ k−1 + · · ·+ b0, h(λ) = cmλ m + cm−1λ m−1 + · · ·+ c0, então an = bkcm, de modo que p não divida bk nem cm. Como p divide a0 = b0c0, p divide b0 ou c0. Mas como p2 não divide a0, segue que p não divide b0 e c0. Suponha 42 Polinômios: conceitos fundamentais que p divida b0. Como p não divide bk, deve existir um menor índice j > 1 tal que p não divide bj. Na igualdade polinômial f = gh comparemos os coeficientes de λj em ambos os lados. No lado esquerdo temos o coeficiente aj, o qual é divisível por p uma vez que j 6 k < n. No lado direito, o respectivo coeficiente é a soma b0cj + b1cj−1 + · · ·+ bjc0, a qual não é divisível por p, pois na soma existe um termo que não é divisível por p, o último. Isto dá uma contradição. Analogamente, temos o mesmo resultado se supormos que p divida c0. Portanto, f não pode ser redutível. É importante observar que o teorema acima dá uma condição apenas suficiente para irredutibilidade sobre Q. Por exemplo, ele nos permite concluir que λ5 − 2 e 3λ5+7λ4−14λ2+7λ+56 são irredutíveis em Q (tomando p = 2 e 7 respectivamente), mas não podemos dar uma informação imediata sobre λ3−3λ−1 ou λ4+λ3+λ2+λ+1, ambos os quais são irredutíveis sobre Q. Para analisar situações como essas, algumas vezes uma simples mudança de variável pode ser encontrada para colocar um polinômio na forma ao qual o teorema é aplicável. Por exemplo, fazendo a mudança de variável λ = u + 1 em λ3 − 3λ − 1, obtemos u3 + 3u2 − 3, o qual agora vemos ser irredutível (p = 3). Mais a frente mostraremos que para f ∈ Q[λ] e a ∈ Q, f(λ) é irredutível sobre Q se, e somente se, f(λ+ a) também o é (Proposição 3.3). Até agora, o único resultado que temos sobre irredutibilidade de polinômios é para o caso especial de polinômios em Q[λ]. Notando que a definição de irredutibilidade de um polinômio é bastante similar à aquela de um número primo, vamos agora prosseguir para ver que essa analogia se estende muito mais. Um fato sobre números primos que temos usado é que se, um primo divide um produto, ele deve dividir um dos fatores. Uma afirmação semelhante aparecerá para polinômios irredutíveis (Teorema 2.4). Outro fato útil sobre primos é que, todo inteiro pode se escrito unicamente como um produto de primos. Uma afirmação análoga será vista para a fatoração de um polinômio em fatores irredutíveis (Teorema 2.5). De modo a desenvolver estes resultados introduziremos mais alguns conceitos. Definição 2.3. Dados dois polinômios f e g em F [λ], um maior divisor comum de f e g, denotado por (f, g), é qualquer polinômio em F [λ] de grau maximal dentre os que dividem f e g. Isto é, podem existir muitos polinômios (incluindo todos os polinômios constantes, exceto o nulo) que dividem ambos f e g, qualquer um de grau máximo é um maior divisor comum (m.d.c.) de f e g. Na realidade, será visto que todos os m.d.c.’s são múltiplos constantes uns dos outros (Ver Corolário 2.1). Quando escrevermos (f, g), estaremos nos referindo a algum m.d.c., particular ou não cujo contexto deixará claro. O Teorema a seguir, garante uma maneira de se obter um m.d.c. de quaisquer dois polinômios em F [λ]. É o chamado Algoritmo Euclidiano para polinômios. Aritmética dos Polinômios 43 Teorema 2.3. Sejam f e g ∈ F [λ]. Existe (f, g) e existem s e t ∈ F [λ] tais que (f, g) = sf + tg. Demonstração. Começando pela divisão de f por g, temos f = gq1 + r1, com r1 = 0 ou deg (r1) < deg (g). Se r1 = 0, então g|f . Logo, g é um máximo divisor comum de f e g (pois g é um polinômio de grau maximal que divide ele próprio e f). Como g pode ser escrito da forma, g = 0f + 1g, basta tomar s = 0 (polinômio nulo) e t = 1 (polinômio constante). Caso r1 ̸= 0, dividamos o divisor g pelo resto r1. Assim, g = r1q2 + r2, com r2 = 0 ou deg (r2) < deg (r1). Se r2 = 0, então r1|g. Logo, r1 é um máximo divisor de g e r1 (pois r1 é um polinômio de grau maximal que divide ele próprio e g). Do passo anterior, temos que r1|(gq1 + r1) = f , ou seja, r1 é um polinômio de grau maximal que divide f. Logo, r1 é um máximo divisor de f e g também. Assim, r1 pode ser escrito da forma r1 = 1f − q1g e portanto, basta tomar s = 1 e t = −q1. Caso r2 ̸= 0, dividimos o divisor r1 pelo resto r2. Assim, r1 = r2q3 + r3, com r3 = 0 ou deg (r3) < deg (r2). Repetindo o processo, necessariamente existirá um n ∈ N tal que deg (rn) = 0, pois o conjunto formado pelos graus dos restos é um conjunto limitado inferiormente, ou seja, deg (g) > deg (r1) > deg (r2) > · · · > 0. Assim, a divisão do polinômio rn−1 por rn terá resto rn+1 = 0 (polinômio nulo, pois rn é um polinômio constante). Assim, teremos: r1 = r2q3 + r3, r2 = r3q4 + r4, ... rn−2 = rn−1qn + rn, rn−1 = rnqn+1 + 0. 44 Polinômios: conceitos fundamentais Mostremos por indução sobre n que rn pode ser escrito na forma desejada do teo- rema. Para n = 1, temos r1 = 1f + (−q1)g. Para n = 2, temos r2 = g − r1q2 = g − fq2 + q1q2g = (−q2)f + (1 + q1q2)g. Observe que para n = 3, temos r3 = r1 + (−q3)r2 = [1f + (−q1)g] + (−q3)[(−q2)f + (1 + q1q2)g = (1 + q3q2)f + (−q1 − q3 − q3q1q2)g Assumindo ser verdade o passo acima para n = i−1, mostremos para n = i. Temos, ri = ri−2 − ri−1qi. Como ri−1 e ri−2 podem ser escrito da forma desejada pelo teorema, segue que realizando manipulações algébricas convenientes conseguiremos escrever ri = sf + tg, onde s, t ∈ F [λ]. Logo, rn admite a forma desejada do teorema. Agora, resta mostrar que rn é verdadeiramente um m.d.c. Da representação rn = sf + tg, vemos que qualquer maior divisor comum de f e g, digamos (f, g), divide rn e portanto deg(f, g) 6 deg (rn). Pelo sucessivo algoritmo da divisão iniciando de f por g até rn, observamos que rn divide sucessivamente rn−1, rn−2, . . . , r1, g e f . Assim, rn é um divisor comum de f e g, de modo que deg (rn) 6 deg(f, g). Combinando isto com o resultado anterior, temos que deg (rn) = deg(f, g), e assim rn é um m.d.c. de f e g. Corolário 2.1. Se d1 e d2 são máximos divisores de f e g, então d1 e d2 são múltiplos constantes um do outro. Demonstração. Sendo d1 um máximo divisor de f e g, segue do Teorema 2.3 que existem s, t ∈ F [λ] tais que d1 = sf + tg. Pelo fato de d2 dividir f e g, d2 divide d1 (e analogamente d1 divide d2). Como d1 = cd2, para algum polinômio c, temos que deg (d1) = deg (c) + deg (d2). Sendo d1 e d2 de grau maximal dentre os divisores de f e g (por hipótese), concluímos que o grau de c é 0. Portanto é um polinômio constante. Seguindo a terminologia de Z, dizemos que dois polinômios f e g são relativamente primos se eles não têm fatores não-constantes em comum. Nesse caso, escrevemos (f, g) = 1, em que o lado direito naturalmente se refere ao polinômio constante 1. Agora, finalmente, podemos mostrar os dois resultados básicos mencionados anteriormente. Teorema 2.4. Sejam f, g e h ∈ F [λ] e seja f irredutível. Se f |gh, então f |g ou f |h. Demonstração. Suponha que f não divide g. Como f é irredutível, temos que (f, g) = 1. Pelo Teorema 2.3, existem polinômios s e t ∈ F [λ] tais que 1 = sf + tg, Aritmética dos Polinômios 45 de modo que, h = sfh+ tgh, da qual, como f |gh, concluímos que f |h. Teorema 2.5. Seja f ∈ F [λ] − {0}. Então f pode ser escrito como um produto de polinômios irredutíveis em F [λ], e esta decomposição é única a menos de múltiplos constantes de cada fator não constante. Demonstração. Mostremos por indução sobre o grau de f . Quando deg (f) = 1, não há nada a fazer pois f é irredutível (ou seja, f não admite divisor próprio não-trivial). Suponha que deg (f) = n > 1 e que o teorema seja válido para polinômios de graus menores que n. Se f é irredutível, não há nada a fazer. Se f é redutível, então existem polinômios g, h ∈ F [λ] tais que f = gh, com deg (g) > 0 e deg (h) > 0. Como deg (f) = deg (g)+deg (h) e deg (f) = n temos que deg (g) < n e deg (h) < n. Assim, pela hipótese de indução, g e h se escrevem como produto de polinômios irredutíveis. Logo, f pode ser escrito como produto de polinômios irredutíveis. Para mostrar a unicidade, suponha que escrevemos simultaneamente f = p1p2 · · · pn = q1q2 · · · qm, em que os p′s e q′s são polinômios não constantes irredutíveis em F [λ]. Suponha que m > n. Pelo Teorema 2.4, p1 deve dividir algum qi, digamos q1. Pela irredutibilidade de q1 segue que ele é um múltiplo constante de p1, ou seja, q1 = k1p1, k1 ∈ F [λ]. Quando ambos os lados da equação são divididos por p1, temos p2 · · · pn = k1q2 · · · qm, Agora repetindo o processo para p2, p3, . . . , pn teremos, 1 = k1k2 · · · knqn+1 · · · qm, o que é um absurdo pois temos de um lado um polinômio de grau 0 e do outro um polinômio de grau maior que 0. O raciocínio é análogo para n > m. Portanto, segue que n = m. 46 Polinômios: conceitos fundamentais 2.2 Raízes de Polinômios Dizemos que uma função f : F → F é polinomial sobre F se existem a0, a1, · · · , an ∈ F tais que, f(x) = a0 + a1x+ · · ·+ anx n,∀x ∈ F, em que nesta expressão para f(x) a notação é a usual para somas e produtos de elementos de um corpo F. É simples verificar que a soma e o produto de funções polinomiais resultam em funções polinomiais. Na verdade, a aplicação p(λ) = a0 + a1λ 1 + · · ·+ anλ n 7→ p̃(x) = a0 + a1x+ · · ·+ anx n,∀x ∈ F, é um homomorfismo de anéis. Uma raiz de um polinômio p é um valor da variável x para o qual a função polinomial p̃ anula-se. Proposição 2.1. Seja p ∈ F [λ]. Um número r é uma raiz de p se, e somente se, (λ− r) divide p. Demonstração. (⇒) Seja p um polinômio tal que r é raiz de p. Mostremos que (λ− r) divide p. Pelo algoritmo da divisão para polinômios existem q, s ∈ F [λ] tais que, p(λ) = (λ− r)q(λ) + s(λ), com s(λ) = 0 ou deg s(λ) < deg (λ− r). Suponha que s(λ) não seja o polinômio nulo. Como deg s(λ) < deg (λ − r) = 1, segue que deg s(λ) = 0, ou seja, s(λ) é um polinômio constante não nulo. Agora, como r é raiz de p p̃(r) = (̃r − r)q̃(r) + s̃(r), 0 = 0q̃(r) + s̃(r), ou seja, s̃(r) = 0. Logo, r é raiz de s(λ), o que contraria a hipótese de s(λ) ser um polinômio constante não nulo. Assim, s(λ) é o polinômio nulo e portanto, (λ− r) divide p. (⇐) Se (λ− r) divide p temos, p(λ) = (λ− r)g(λ). Calculando p̃(r), temos p̃(r) = (̃r − r)g̃(r), p̃(r) = 0g̃(r), p̃(r) = 0, ou seja, r é raiz de p ∈ F [λ] como queríamos. Raízes de Polinômios 47 O teorema a seguir, que não será demonstrado, é chamado de Teorema Funda- mental da Álgebra: Teorema 2.6. Todo polinômio sobre C de grau > 1 tem pelo menos uma raiz (em C). A demonstração envolve técnicas que fogem um tanto do espírito deste trabalho e preferimos não incluí-las. Ver referência [2]. Se r é raiz de f , definimos a multiplicidade de r como o maior inteiro m tal que (λ− r)m divida f . Teorema 2.7. Todo polinômio sobre C de grau n tem exatamente n raízes, contadas suas multiplicidades. Demonstração. Por indução sobre n, temos que para n = 0 (grau zero), o polinômio é não nulo constante e portanto não tem raiz. Supondo verdade que todo polinômio de grau n− 1 tem n− 1 raízes, mostremos para polinômio de grau n. Sendo f um polinômio de grau n > 1, então pelo Teorema 2.6 ele tem pelo menos uma raiz r. Assim, (λ− r) divide f e podemos fatorar f da seguinte forma, f(λ) = (λ− r)g(λ), onde g(λ) é um polinômio de grau n− 1. Por hipótese de indução, g tem n−1 raízes, o que implica que f têm n raízes, como queríamos. Uma consequência imediata do Teorema 2.7 e o seguinte corolário: Corolário 2.2. Se F é um subcorpo de C, a correspondência p(λ) = a0 + a1λ 1 + · · ·+ anλ n 7→ p̃(x) = a0 + a1x+ · · ·+ anx n, ∀x ∈ F, é uma bijeção entre F [λ] e o conjunto das funções polinomiais. Demonstração. A correspondência é sobrejetora pela definição de função polinomial. Agora, se correspondência não fosse injetiva, para alguma função polinomial existiriam dois polinômios de grau finitos dão origem a mesma função polinomial. Digamos, g(λ) = p̃(x),∀x ∈ F e f(λ) = p̃(x), ∀x ∈ F . Subtraindo uma expressão da outra obtemos g(λ)− f(λ) = 0,∀x ∈ F. Isto implica que g(λ)− f(λ) tem infinitas raízes, que é uma contradição pois tal polinômio deveria ter grau finito e pelo Teorema 2.7 teria um número finito de raízes. A partir de agora, neste trabalho o termo corpo estará se referindo a um subcorpo de C. Dizemos que um número r é algébrico sobre F se existe um polinômio (não nulo) sobre F, do qual r é uma raiz. Caso contrário, dizemos que r é transcendente. Nos casos em que F não estiver identificado, entenderemos F como sendo Q. Assim devemos dizer que 3, i e 3 √ 7 são algébricos, pois eles são raízes dos polinômios sobre Q x− 3, x2 + 1 e x3 − 7, respectivamente. 48 Polinômios: conceitos fundamentais Teorema 2.8. Se F é um corpo, então o conjunto de todos números algébricos sobre F também é um corpo. Demonstração. Suponha que os números r e s são algébricos sobre F e que satisfazem, anr n + an−1r n−1 + · · ·+ a0 = 0, bms m + bm−1s m−1 + · · ·+ b0 = 0, em que todos os coeficientes estão em F e an, bm ̸= 0. Vemos que −s é algébrico sobre F , pois ele satisfaz, (−1)mbm(−s)m + (−1)m−1bm−1(−s)m−1 + · · ·+ b0 = 0. Se s ̸= 0, 1 s é algébrico sobre F , pois é raiz da equação bm + bm−1s+ · · ·+ b0s m = 0. Assim, é suficiente mostrar que r + s e rs são algébricos sobre F . Uma observação a mais: usando as equações originais, rn e sm podem ser expressos em potências menores de r e s, respectivamente. Por exemplo: rn = −(an−1r n−1 + · · ·+ a0)/an. Considere a tabela com mn números: 1 r r2 · · · rn−1 s sr sr2 · · · srn−1 s2 s2r s2r2 · · · s2rn−1 ... ... ... . . . ... sm−1 sm−1r sm−1r2 · · · sm−1rn−1 Listando eles em qualquer ordem, e chamando-os de c1, c2, · · · , cR, em que R = mn, notemos que para todo i, rci pode ser escrito com uma combinação linear de todos os ci’s: rci = di1c1 + di2c2 + · · ·+ diRcR, em que os coeficientes dij ∈ F . Na realidade, a maioria dos dij’s são 0. Por exemplo, se ci não é uma entrada da última coluna da tabela, rci é apenas alguma entrada a sua direta. Agora, se ci é uma entrada da última coluna, então rci tem a forma rnsk, na qual rn é substituído pelo seu equivalente em termos de potências menores de r (ao qual todos os coeficientes estão em F ). Em qualquer caso acima a representação é possível. Denotando por C vetor coluna cuja as R entradas são os ci’s e por D a matriz R×R dos dij’s, podemos escrever a equação acima em forma de matriz, rC = DC. Raízes de Polinômios 49 Analogamente, existe uma matriz E tal que sC = EC. Assim temos, (r + s)C = (D + E)C, pois vale a distributiva para matrizes. Como C ̸= 0 (matriz nula), isto implica que r+ s é um autovalor da matriz D+E. Mas então r+ s é raiz do polinômio característico, det(D+E−λI), onde I é a matriz identidade. Como esse é um polinômio sobre o corpo F , concluímos que r+s é algébrico sobre F . Para o produto observe que, (rs)C = r(sC) = r(EC) = E(rC) = E(DC) = (ED)C. Assim, rs é um autovalor para ED. E pela mesma razão acima rs é algébrico. 3 Extensão de Corpos 3.1 Extensões Simples, Múltiplas e Finitas O conceito de extensões de corpos surgiu logo na Seção 1.1 deste trabalho, em que vimos como extensões quadráticas são fundamentais para teoria de construtibilidade. Nesta seção será generalizada a noção de extensões de corpos e apresentada uma teoria segundo a qual poderemos lançar novo olhar sobre alguns resultados anteriores. Se F é um corpo e a1, a2, · · · , am são m números complexos, definimos a extensão de F por a1, a2, · · · , am, denotando por F (a1, a2, · · · , am), como sendo o menor corpo contendo a1, a2, · · · , am, como também todos os elementos de F. (Por “menor”, quer- emos dizer ser o corpo que é a intersecção de todos os corpos contendo todos estes elementos). Em geral, ela é chamada de extensão múltipla de F. No caso de m = 1, é chamada de extensão simples. Além disso, se cada um dos ai’s é algébrico sobre F , ela é chamada de extensão algébrica; caso contrário, ela é chamada de extensão transcendente. É natural perguntar “Como é F (a)?” Isto é, quando F é estendido por a, que outros elementos também são incluídos? Nas seções anteriores encontramos Q( √ 2) = {a + b √ 2|a, b ∈ Q} que é um corpo. Neste caso, e entre outros, fomos capazes de expressar cada elemento da extensão como uma combinação linear de alguma coleção finita de elementos da extensão, onde os coeficientes na combinação linear pertencem ao corpo original. Isto é uma forte indicação de alguma estrutura de espaço vetorial, que é exatamente a chave para o estudo destas extensões. Primeiro, para generalizar ainda mais o conceito de extensão de corpos, se E e F são corpos tais que E ⊃ F, então E é chamado extensão de F. Neste caso, E pode ser considerado como um espaço vetorial sobre F, onde a adição vetorial é simplesmente a adição usual do corpo e multiplicação por escalar é a multiplicação usual do corpo. A dimensão do espaço vetorial E sobre F é chamada de grau da extensão e é denotada por [E : F ]. Se E é uma extensão de F e [E : F ] é finita, denominamos E como uma extensão finita de F. Por exemplo, [Q( √ 2) : Q] = 2, pois uma base para Q( √ 2) sobre Q é dada pelo con- junto {1, √ 2}. Uma questão natural de se pensar é, existe algum modo alternativo para determinar o grau de uma extensão? A resposta é afirmativa a questão, em 51 52 Extensão de Corpos certos casos importantes, dos quais faremos uso frequentemente. Ela será desenvolvida nos próximos parágrafos. Vamos iniciar com o caso de uma extensão algébrica simples F (a) de F. Como a é algébrico sobre F, existe um polinômio sobre F tendo a como uma raiz e, além disso, existe tal polinômio sendo de menor grau. Todo polinômio desta forma é chamado de polinômio minimal de a sobre F, e seu grau é chamado de grau de a sobre F , denotado por degF a. Por exemplo, degR i = 2, pois λ2 + 1 é um polinômio minimal de i sobre R. Dado um número a, em geral é bastante difícil encontrar diretamente (ou mostrar que você encontrou) um polinômio minimal para a. A chave para esta questão está na equivalência entre o conceito de “polinômio minimal” e o conceito de “polinômio irredutível”. Teorema 3.1. Seja f ∈ F [λ] com f̃(a) = 0. Então, f é um polinômio minimal para a sobre F se, e somente se, f é irredutível sobre F. Demonstração. (⇒) Seja f um polinômio minimal de a sobre F. Suponha f não ser irredutível sobre F. Logo, f pode ser escrito como um produto gh, com g, h ∈ F [λ], de graus menores. Como a é raiz de f , um desses polinômios dever ter a como uma raiz, o que contraria a hipótese de f ser minimal (pois g e h são de graus menores que o de f sobre F ). Portanto, f tem que ser irredutível. (⇐) Seja f irredutível sobre F. Podemos aplicar o algoritmo da divisão para dividi- lo por um polinômio minimal de a sobre F, digamos g. Logo, existem q, r ∈ F [λ] tais que f = gq+ r, com r = 0 ou deg (r) < deg (g) e não nulos. Pela minimalidade de g, a é raiz de g, e portanto f̃(a) = g̃(a) = 0. Isto implica, r̃(a) = 0. Como deg (r) < deg (g) e g é um polinômio de grau mínimo, segue que r tem que ser o polinômio nulo. Agora, por f ser irredutível e deg (g) > 1, devemos ter que deg (g) = deg (f) e portanto podemos concluir que q é um polinômio constante. Assim, como f tem o mesmo grau de g, ele também é minimal. Visto que temos um critério de irredutibilidade para polinômios em Q[λ] com co- eficientes inteiros (Teorema 2.2), algumas vezes seremos capazes de usar este teorema para encontrar o grau de algum número algébrico sobre Q. Por exemplo, degQ 5 √ 2 = 5, pois 5 √ 2 é uma raiz do polinômio irredutível λ5 − 2. Já degQ cos 20◦ = 3, pois cos 20◦ é uma raiz do polinômio irredutível 8λ3 − 6λ− 1 (Ver Seção 1.3). Com essas idéias em mente, retornaremos ao problema de encontrar o grau de uma extensão algébrica simples. Teorema 3.2. Se a é algébrico sobre F, [F (a) : F ] = degF a. Demonstração. Para qualquer a, observemos que F (a) = {g̃(a)/h̃(a)|g, h ∈ F [λ], h̃(a) ̸= 0}. Extensões Simples, Múltiplas e Finitas 53 Observamos que quando a é algébrico sobre F somos capazes de simplificar a repre- sentação dos elementos desse conjunto. Supondo degF a = n, mostremos primeiro que os elementos 1, a, a2, · · · , an−1 são um conjunto gerador para F (a) sobre F ; ou o que é equivalente, todo elemento g̃(a)/h̃(a) é igual a algum r̃(a), onde r ∈ F [λ] de deg (r) 6 n− 1 ou r = 0. Seja f um polinômio minimal de a sobre F. Se deg (h) > 1, então (f, h) = 1, pois f é irredutível (pelo Teorema 3.1) e não pode dividir h (senão, existiria um k ∈ F [λ] tal que h = fq e como f é minimal h̃(a) = f̃(a)k̃(a) = 0). Pelo algoritmo Euclidiano, existem s, t ∈ F [λ] tais que 1 = sf + th. Como f̃(a) = 0, obtemos t̃(a) = 1/h̃(a). Logo, g̃(a)/h̃(a) = g̃(a)t̃(a). Aplicando o algoritmo da divisão para dividir o polinômio gt por f temos gt = fq + r, em que r = 0 ou deg (r) 6 n− 1. Observando novamente que a é algébrico sobre F temos que g̃(a)t̃(a) = r̃(a), como queríamos. Resta garantir que os elementos 1, a, a2, · · · , an−1 são linearmente independentes sobre F. Se não fossem, a deveria satisfazer um polinômio sobre F de grau 6 n − 1, contrariando a minimalidade de n. Portanto, estes elementos formam uma base para a extensão, completando assim a demonstração de que quando a é algébrico, [F (a) : F ] = degF a. Veremos que o caso de encontrar o grau de uma extensão finita ou algébrica múltipla de F é coberto pelo teorema anterior, pois mostraremos que estes casos de extensões são eles próprios extensões simples. Esse resultado é interessante em si próprio e importante para o trabalho mais a frente, mas não nos fornece uma maneira muito útil de investigar sobre o grau destas extensões. Em geral, isto é feito via Teorema 3.4. Vejamos uma proposição que será utilizada na demonstração do resultado comen- tado anteriormente. Proposição 3.1. Se f é um polinômio irredutível sobre F, então f não tem raízes múltiplas. Demonstração. Suponha que α é uma raíz múltipla de f ∈ F [λ] tal que α ∈ E, onde E é um extensão de F. Pela irredutibilidade de f sobre F, segue que f é o polinômio minimal para α sobre F . Como α é raiz múltipla, podemos escrever em E[λ] f(λ) = (λ− α)2g(λ) f ′(λ) = 2(λ− α)g(λ) + (λ− α)2g′(λ), ou seja, f ′(α) = 0. Isso contraria a minimalidade de f pois deg (f ′) < deg (f) e f ′ ∈ F [λ]. Portanto, f não pode ter raízes múltiplas. 54 Extensão de Corpos Teorema 3.3. As seguintes afirmações são equivalentes: (i) E é extensão finita de F. (ii) E é uma extensão algébrica múltipla de F. (iii) E é uma extensão algébrica simples de F. Demonstração. (i ⇒ ii) Observemos primeiro que todo elemento de E é algébrico sobre F. Seja a ∈ E e n = [E : F ]. Assim, como os n+ 1 vetores 1, a, a2, . . . , an devem ser linearmente dependentes, existe uma combinação linear não-trivial deles igual a 0, com coeficientes em F, ou seja, a é uma raiz de algum polinômio sobre F. Como a é qualquer, concluímos que todo elemento de E é algébrico sobre F, ou seja, E é uma extensão algébrica de F. Mostremos que E é uma extensão múltipla. Seja {a1, a2, . . . , an} uma base para E sobre F. Por um lado, como E é uma extensão finita de F, ele contém todos os elementos de F, bem como a1, a2, . . . , an. Logo, E deve conter o menor corpo contendo esses elementos, o qual por definição é F (a1, a2, . . . , an). Portanto, F (a1, a2, . . . , an) ⊂ E. Por outro lado, F (a1, a2, . . . , an) deve conter o conjunto de todas as combinações lineares dos ai’s, com coeficientes em F, a qual tal conjunto é precisamente E, ou seja, E ⊂ F (a1, a2, . . . , an). Por esta, e pela conclusão anterior temos que E = F (a1, a2, . . . , an), ou seja, E é uma extensão algébrica múltipla de F. (ii ⇒ iii) Primeiramente notemos que a extensão múltipla F (a1, a2, . . . , an) pode ser construída pela sequência de extensões simples: F1 = F (a1), F2 = F (a1)(a2) = F1(a2), F3 = F (a1)(a2)(a3) = F1(a2)(a3) = F2(a3), ... Fn = F (a1)(a2) · · · (an−2)(an−1)(an) = Fn−1(an). Se pudermos mostrar que estas extensões podem ser combinadas duas a duas para formar extensões simples, podemos aplicar repetidamente este resultado para deduzir que F (a1, a2, . . . , an) é uma extensão simples F. É suficiente considerar então o caso para n = 2, e alterando a notação, mostrar que para quaisquer dois elementos b e c que são algébricos sobre F, existe um elemento a tal que F (b, c) = F (a). Encontraremos um a na forma de uma combinação linear de b e c, a = b+ kc, onde o coeficiente k é um elemento convenientemente escolhido de F. Como b é algébrico sobre F , ele é raiz de algum polinômio minimal f , e portanto irredutível sobre F cujo conjunto completo de suas raízes são b = b1, b2, . . . , bq. Estas raízes são todas distintas, um vez que um polinômio irredutível não pode ter múltiplas raízes (Proposição 3.1). Analogamente, c é raiz de algum polinômio irredutível g, cujas raízes são c = c1, c2, . . . , cm, onde estas são todas distintas também. Olhe para as q(m − 1) equações em λ: bi + xcj = b1 + xc1, para 1 6 i 6 q, 2 6 j 6 m. Como para Extensões Simples, Múltiplas e Finitas 55 esses valores de j, cj ̸= c1, cada uma dessas equações tem exatamente uma solução em C para λ, e portanto, no máximo uma solução em F para λ. Como F tem um número infinito de elementos, podemos escolher k ∈ F que não é nenhuma destas soluções. Assim, bi + kcj ̸= b1 + kc1 sempre que 1 6 i 6 q e 2 6 j 6 m. Definindo a = b + kc, mostraremos que F (b, c) = F (a). Primeiro, como tal a ∈ F (b, c), temos que F (a) ⊂ F (b, c). Para mostrar que F (b, c) ⊂ F (a), é suficiente mostrar que ambos b, c ∈ F (a). Observe que basta mostrarmos simplesmente que c ∈ F (a), pois como F (a) é corpo temos que b = a− kc ∈ F (a). Provaremos que c ∈ F (a) mostrando que c é raiz de um polinômio de grau 1 sobre F (a). Olhe para os polinômios g(λ) e f(a−kλ), ambos certamente estão em F (a). (De fato, g ∈ F [λ] ⊂ F (a)[λ]). O número c é uma raiz de cada um, ou seja, g̃(c) = 0 e f̃(a− kc) = f̃(b) = 0. Como existe um m.d.c. desses polinômios e como ele é divisível por (λ − c) ∈ C[λ], ele tem c como uma raiz; a multiplicidade de c como uma raiz do m.d.c. é exatamente 1, pois c é uma raiz de multiplicidade 1 para g. Porém, pela escolha de k, os polinômios g(λ) e f(a− kλ) não têm em comum outras raízes, pois as outras raízes de g são da forma cj, 2 6 j 6 m, e a− kcj ̸= bi para qualquer i. Assim, o tal m.d.c. de g(λ) e f(a−kλ) tem grau 1, pois todas as suas raízes são comuns a destes polinômios. Mas este m.d.c. é um polinômio sobre F (a), o corpo dos coeficientes de g(λ) e f(a− kλ). Assim c, uma raiz do tal m.d.c., é uma raiz do polinômio de grau 1 sobre F (a). Portanto, c ∈ F (a). (iii ⇒ i) Isto é imediatamente do Teorema 3.2. Teorema 3.4 (Multiplicatividade dos Graus). Sejam K ⊂ M ⊂ L corpos. Então [L : K] é finita, se, e somente se, [L : M ] e [M : K] são finitas. Neste caso, [L : K] = [L : M ][M : K]. Demonstração. Sejam [L : K] < ∞ e B uma base de L sobre K. Claramente [M : K] é finita, uma vez que M é subespaço de um espaço vetorial de dimensão finita. Para mostrar a finitude de [L : M ], basta observar que existe B′ ⊂ B que é linearmente independente sobre M. Suponha que [L : M ] = m, [M : K] = n e sejam {v1, . . . , vm} uma base de L sobre M e {w1, . . . , wn} uma base de M sobre K. Mostraremos que B̃ := {viwj|1 6 i 6 m, 1 6 j 6 n} é uma base de L sobre K. De fato, se α ∈ L, existem α1, . . . , αm ∈ M tais que α = ∑m i=1 αivi. Cada αi, por sua vez, é uma combinação da forma αi = ∑n j=1 βijwj, onde βij ∈ K, 1 6 j 6 n. Logo, α = m∑ i=1 ( n∑ j=1 βijwj)vi ⇒ α = m∑ i=1 n∑ j=1 βij(viwj). 56 Extensão de Corpos Portanto B̃ gera L como K-espaço vetorial. Para mostrar a K-independência linear dos elementos de B̃, seja m∑ i=1 n∑ j=1 βij(viwj) = 0 ⇒ m∑ i=1 ( n∑ j=1 βijvi)wj = 0. Como w1, . . . , wn são linearmente independentes, para cada j, 1 6 j 6 n, n∑ j=1 βijvi = 0. Pela independência linear de v1, . . . , vm concluímos βij = 0, 1 6 i 6 m, 1 6 j 6 n. Portanto B̃ é uma base de L sobre K. Para finalizar, observamos que |B̃| = [L : K] = mn = [L : M ][M : K]. Este teorema relativamente simples será aplicado frequentemente no desenvolvi- mento dos resultados subsequentes. Observamos que a aplicação repetida do teorema anterior para uma sequência finita de corpos FN ⊃ FN−1 ⊃ · · · ⊃ F1 ⊃ F0, em que para cada j = 0, 1, . . . , n− 1, [Fj+1 : Fj] é uma extensão finita, podemos garantir que, [FN : F0] = [FN : FN−1][FN−1 : FN−2] · · · [F1 : F0]. 3.2 Revendo as Construções Geométricas Relembremos que a duplicação do cubo envolve a construção de uma raiz para o polinômio λ3 − 2, que é irredutível sobre Q. Similarmente, a trissecção de um ângulo de 60◦ envolve a construção de uma raiz do polinômio λ3 − 3λ − 1, que também é irredutível sobre Q (Seção 2.1). Em cada caso foi requerido construir um número cujo grau sobre Q era 3. Usando a teoria de extensão de corpos, é muito simples de mostrar que os únicos números que podem ser construídos devem ter alguma potência de 2 como seu grau sobre Q. Isto é, temos: Teorema 3.5. Se a é construtível, então a é algébrico e degQ a é uma potência de 2. Demonstração. Se a é construtível, pelo Teorema 1.1, existe uma sequência finita de corpos Q = F0 ⊂ F1 · · · ⊂ Fn tais que a ∈ Fn e para cada j, Fj+1 é uma extensão quadrática de Fj. Assim, para cada j, [Fj+1 : Fj] = 2. Pela aplicação repetida do Teorema 3.4, temos que [Fn : Q] = 2n. Logo [Fn : Q] = 2n é uma extensão finita e portanto algébrica pelo Teorema 3.3. Como a ∈ Fn, a é algébrico sobre Q. Agora, observe que Q(a) ⊂ Fn, pelo Teorema 3.4 [Fn : Q] = [Fn : Q(a)][Q(a) : Q]. Revendo as Construções Geométricas 57 Como o lado esquerdo é 2n, nenhum fator do lado direito pode ter um fator primo ímpar. Portanto, [Q(a) : Q] deve ser uma potência de 2, que pelo Teorema 3.2 equivale a degQ a. Temos ainda, como um corolário, a seguinte reformulação: Corolário 3.1. É impossível construir qualquer número que seja raiz de um polinômio irredutível sobre Q que tenha grau diferente de uma potência de 2. Demonstração. Seja a uma raiz de p(λ), um polinômio irredutível sobre Q que tem grau diferente de uma potência de 2. Como p é irredutível sobre Q, pelo Teorema 3.1 p é um polinômio minimal de a sobre Q. Assim, se a fosse um número construtível, a seria algébrico sobre Q e degQ a seria um número diferente de uma potência de 2, contrariando o Teorema 3.5. Segue imediatamente deste resultado que é impossível duplicar o cubo, pois isto requer a construtibilidade da raiz de um polinômio irredutível sobre Q de grau 3. Analogamente, é impossível trissectar o ângulo 60◦, o que mostra que não existe uma maneira de trissectar uma ângulo arbitrário. Embora as soluções originais para estes problemas sejam bem simples, percebe-se que o método atual é mais geral e poderoso. Com estes métodos agora disponíveis, finalmente somos capazes de lidar com outro problema famoso: Para quais valores de n é possível construir um polígono regular de n lados? Tal polígono é chamado de n-ágono regular. Primeiramente, observe que a construtibilidade de um n-ágono regular está equi- valente a construtibilidade de um ângulo de 360◦/n. Pois, se 360◦/n é construtível, podemos inscrever um n-ágono regular no círculo unitário marcando sucessivamente a abertura do ângulo central como na figura 3.1. Figura 3.1: O n-ágono regular no círculo unitário. Reciprocamente, se um n-ágono regular é construtível, cada um dos seus ângulos exteriores são construtíveis, e como a soma deles é 360◦, cada um é 360◦/n (Figura 3.2). 58 Extensão de Corpos Figura 3.2: Ângulos externos do n-ágono regular. Por outro lado, pode-se construir o centro do círculo em que o n-ágono está inscrito, tomando o ponto de intersecção das mediatrizes de quaisquer dois lados não paralelos. Assim, desenha-se o círculo. Os arcos entre quaisquer dois vértices sucessivos medem o valor do ângulo central de 360◦/n. Por tudo isso, fica claro que a construtibilidade de um ângulo de 360◦/n é, portanto, equivalente a construtibilidade de pontos da forma (cos(k360◦/n), sen(k360◦/n)) em R2. Na próxima sessão, devemos ver que esse pontos podem ser representados por números complexos. Além disso, veremos que toda a teoria da construtibilidade pode ser estendida simplesmente para os números complexos. Dentro deste quadro, seremos então capazes de resolver este problema. 3.3 Raízes de Números Complexos Dizemos que o número x é uma raiz n-ésima de um dado número complexo a, se xn = a. Todo número complexo a ̸= 0 tem n raízes n-ésimas distintas. O polinômio xn − a tem exatamente n raízes (Teorema 2.7). As raízes n-ésimas do número 1 são chamadas de raízes n-ésimas da unidade, e são particularmente importantes para nosso trabalho. Por exemplo, as raízes cúbicas da unidade são as raízes do polinômio x3 − 1. Como 1 é uma raiz, podemos dividi-lo por x − 1 e obter x2 + x + 1 cujas raízes −1± i √ 3 2 são as outras raízes cúbicas da unidade. As raízes quarta da unidade são as raízes do polinômio x4−1, que pode ser fatorado em (x2+1)(x2−1), de onde obtemos os quatro valores, +i,−i,+1,−1. Uma representação da raiz n-ésima da unidade é fornecida pela função exponencial complexa. Para isto, faremos alguns comentários sobre esta função. Se z é um número complexo, ele pode ser escrito na forma z = x+ iy, onde x e y são números reais. Os números x e y são chamados de parte real e parte imaginária, respectivamente. A expressão ez é definida por ser o número complexo ex(cos y + i sen y), que envolve somente funções exponenciais e trigonométricas de variável real. Desta definição segue Raízes de Números Complexos 59 que e2πi = e0(cos 2π + i sen 2π) = 1 e também que ez satisfaz as propriedades usuais da exponencial, por exemplo ez1ez2 = ez1+z2 . Para todo n > 2, algumas das raízes n-ésimas da unidade podem ter a propriedade de que elas também são raízes m-ésimas da unidade para algum 0 < m < n. Por exemplo, embora −1 seja uma raiz quarta da unidade (n = 4, ou seja, (−1)4 = 1), −1 também é uma raiz quadrada da unidade (n = 2, (−1)2 = 1). Aquelas raízes n-ésimas da unidade que não são raízes m-ésimas da unidade para qualquer que seja m com 0 < m < n, são chamadas de raízes n-ésimas primitivas da unidade. Proposição 3.2. Se ω é uma raiz n-ésima primitiva da unidade, então os números ω, ω2, · · · , ωn = 1 formam a lista completa das raízes n-ésimas da unidade. Demonstração. Observe, primeiro, que todos esses números são raízes n-ésimas da unidade, ou seja, para qualquer que seja ωj temos, (ωj)n = ωjn = (ωn)j = (1)j = 1, com 1 6 j 6 n. Além disso, eles são todos distintos, pois caso contrário se ωj = ωk com 1 6 k < j 6 n, teríamos, dividindo a igualdade por ωk, que ωj−k = 1. Isto contradiz a natureza primitiva de w, pois 1 6 j − k 6 n− 1. A Função Euler definida por ϕ(n) = ♯{k ∈ Z+|∀k 6 n, m.d.c{k, n} = 1} (ou seja, o número de inteiros entre 1 e n inclusive, que são relativamente primos a n) fornece o número de raízes n-ésimas primitivas da unidade: Teorema 3.6. Se ω é uma raiz n-ésima primitiva da unidade, então ωk é também uma raiz n-ésima primitiva da unidade se, e somente se, k e n são relativamente primos. O número de raízes n-ésimas primitivas da unidade é ϕ(n). Demonstração. A segunda sentença claramente seguirá imediatamente da primeira, pois todas as raízes da unidade são representadas pelos valores de k variando de 1 a n. (⇐) Suponha que k e n são relativamente primos. Queremos provar que não existe m, com 1 6 m < n tal que (ωk)m = 1. Se existisse algum m, 1 6 m < n, tal que (ωk)m = 1, km deveria ser um inteiro múltiplo de n, ou seja, existiria um q ∈ Z tal que km = nq; de fato, caso contrário, pelo algoritmo da divisão em Z, existiriam q, r ∈ Z tais que km = nq + r com 1 6 r < n. Assim teríamos, (ωk)m = ωkn = ωnqωr = (ωn)qωr = (1)qωr = 1ωr = ωr, ou seja, (ωk)m = ωr Como, (ωk)m = 1, teríamos ωr = 1 o que contraria a primitividade de ω, pois 1 6 r < n. Portanto, caso tal m exista, km = nq, q ∈ Z. Disto segue que n|km e portanto n|k ou n|m já que n e k são relativamente primos, por hipótese. Logo, n|m o que é um absurdo pois n > m. 60 Extensão de Corpos (⇒) Seja ωk uma raiz n-ésima primitiva da unidade. Mostremos que k e n são relativamente primos. Se k e n não fossem relativamente primos, eles teriam um fator inteiro primo p em comum. Assim, tomando m = n p < n, temos (ωk)m = (ωk) n p = ω kn p = (ωn) k p = 1 k p = 1, pois k p é um inteiro. Logo, ωk seria uma raiz m-ésima da unidade contrariando a hipótese. Portanto k e n são relativamente primos. Observamos também que se r é uma raiz n-ésima qualquer do número complexo a ̸= 0 e se ω é uma raiz n-ésima primitiva da unidade, então as n distintas raízes n-ésimas da unidade são dadas por rω, rω2, · · · , rωn = r. Existe uma interpretação geométrica dos números complexos bastante útil para nosso trabalho. Sendo z = x + iy, onde x e y são reais, representamos z no plano cartesiano pelo ponto (x, y). Em coordenadas polares podemos escrever, z = x+ iy, z = √ x2 + y2.( x√ x2 + y2 + i y√ x2 + y2 ), z = |z|[cos θ + i sen θ], z = |z|eiθ. O ângulo θ é chamado de argumento de z; o número |z| = √ x2 + y2 é chamado de módulo de z. É a situação descrita na figura 3.3. Figura 3.3: Representação geométrica de um número complexo. A representação de um número complexo z na forma z = |z|eiθ é chamada de repre- sentação polar. Ela dá um caminho muito conveniente para interpretar a multiplicação de números complexos. Escrevendo z1 = |z1|eiθ1 e z2 = |z2|eiθ2 , as leis dos expoentes implicam que z1z2 = |z1||z2|ei(θ1+θ2), Raízes de Números Complexos 61 de modo que o módulo de um produto é o produto dos módulos e o argumento do produto é a soma dos argumentos. Assim, uma raiz n-ésima de um número complexo z pode ser obtida tomando a raiz n-ésima real positiva de seu módulo e dividindo seu argumento por n. Isto é, uma raiz n-ésima de z = |z|eiθ é dada por, r = n √ |z|eiθ = n √ |z| n √ eiθ = n √ |z|(eiθ)1/n, r = n √ |z|e iθ n . Logo, rn = ( n √ |z|eiθ/n)n = |z|eiθ = z. Na representação gráfica de números complexos, observamos que as raízes n-ésimas da unidade são representadas pelos pontos, (cos( 2πk n ), sen( 2πk n )), 1 6 k 6 n, que são n pontos espaçados igualmente no círculo unitário, incluindo o ponto (1, 0). Se tomarmos w = e 2πi n , estes pontos são marcados e rotulados como potências de w; observe a figura 3.4. Figura 3.4: Raízes n-ésimas da unidade no círculo unitário. Note que estes são precisamente os pontos que devem ser determinados para cons- truir o n-ágono regular. Com respeito as n raízes n-ésimas de um número complexo z qualquer, elas são simplesmente n pontos espaçados igualmente sobre um círculo de raio n √ |z|. 62 Extensão de Corpos 3.4 Construtibilidade de Polígonos Regulares Nessa seção será possível fazer um progresso substancial sobre a questão formulada na Seção 3.2. “Para quais valores de n é possível construir um n-ágono regular?” Foi visto na Seção 3.3 que a construtibilidade de um n-ágono regular é equiva- lente a construir pontos no Plano Cartesiano correspondendo as raízes n-ésimas da unidade. Como estes números são complexos, será necessário estender a definição de construtibilidade diretamente para números complexos. Para a ∈ C, dizemos que a é construtível se sua parte real e imaginária são cons- trutíveis. Isto é equivalente a construtibilidade do ponto “a” no plano cartesiano. A teoria de construtibilidade estende-se imediatamente para os números complexos, através dos Lemas 3.1 e 3.2 e dos Teoremas 3.7 e 3.8. Lema 3.1. Se a1 e a2 são construtíveis, então a1 + a2 e a1a2 também são. Demonstração. Sejam bi e ci, respectivamente a parte real e a parte imaginária de cada ai. Do cálculo abaixo, vemos que as partes real e imaginária que resultam do combinado de a1 e a2 são construtíveis, pelo Lema 1.1. Temos: (i) a1 + a2 = (b1 + b2) + i(c1 + c2) (ii) a1a2 = (b1 + ic1)(b2 + ic2) = (b1b2 − c1c2) + i(b1c2 + b2c1) Lema 3.2. Se a é construtível e se k2 = a, então k é construtível. Demonstração. Observe que um número complexo z = |z|eiθ é construtível se, e so- mente se, o número real |z| e o ângulo θ são construtíveis. Assim, sendo a construtível, o número |a| e um ângulo θ, um argumento de a, são construtíveis. Pelo Lema 1.2,√ |a| é construtível e como um ângulo pode ser bissectado, o ângulo θ/2 é construtível. Agora, como k = ± √ |a|e iθ 2 , segue que k é construtível. Na afirmação do Lema 3.2, foi feito referência a um número k tal que k2 = a; mas não escrevemos √ a. A razão é esta: considerando “a” um número real positivo, √ a está bem definida como a única raíz quadrada positiva de a; quando “a” é complexo, não temos um caminho natural para considerar uma raiz quadrada particular de “a”. Com este cuidado em mente, devemos concordar em usar o símbolo √ a ou n √ a como uma abreviação para uma raiz quadrada ou n-ésima de a nos casos em que a afirmação feita for verdadeira para todas tais raízes. Por uma extensão quadrática de um corpo arbitrário F queremos dizer uma exten- são simples F ( √ a), onde a ∈ F e √ a /∈ F ; como as duas raízes quadráticas de a são o negativo uma da outra, a extensão por qualquer uma é o mesmo corpo. O Teorema 1.1 forneceu uma condição necessária e suficiente para construtibilidade de números reais, e ela estende-se facilmente para o caso complexo. Construtibilidade de Polígonos Regulares 63 Teorema 3.7. As afirmações seguintes são equivalentes: (i) O número complexo a é construtível. (ii) Existe uma sequência finita de corpos Q = F0 ⊂ F1 ⊂ · · · ⊂ Fn, com a ∈ Fn tal que para cada j, 0 6 j 6 n− 1, Fj+1 é uma extensão quadrática de Fj. Demonstração. (i) ⇒ (ii) Suponha a = b + ic, com b, c ∈ R. Pelo Teorema 1 e a construtibilidade de b e c, existem duas sequências de extensões quadráticas: Q = G0 ⊂ G1 ⊂ · · · ⊂ Gl, com b ∈ Gl, Q = H0 ⊂ H1 ⊂ · · · ⊂ Hm, com c ∈ Hm. Para cada j, Hj+1 = Hj( √ kj). Se estendermos Gl, um passo de cada vez, por √ k0, √ k1, · · · , √ km−1, e i, omitindo na sequência qualquer repetição, teremos a sequência de extensões quadráti- cas, com o último corpo contendo b, c e i e portanto a. (ii) ⇒ (i) Por indução sobre n. Se n = 0, a é racional e portanto construtível. Agora assumimos que o Teorema é verdadeiro para n = r e provemos para n = r + 1. Se a ∈ Fr+1, então a = ar + br √ kr, onde ar, br e kr pertencem a Fr e portanto são construtíveis. Assim pelo Lema 3.1, seque que a é construtível. Por exatamente as mesmas razões de antes, usamos o Teorema 3.7 para obter o análogo para números complexos do Teorema 3.5 e seu Corolário. Teorema 3.8. Se a ∈ C é construtível, então a é algébrico e degQ a é uma potência de 2. Corolário 3.2. É impossível construir qualquer número complexo que seja a raiz de um polinômio irredutível sobre Q que tem grau diferente de uma potência de 2. Agora estamos prontos para lidar com a questão iniciada no começo desta seção. A construtibilidade do n-ágono regular é equivalente a construtibilidade das raízes n- ésimas da unidade, e portanto, em vista do Lema 3.1, a construtibilidade de qualquer raiz primitiva da unidade (pois qualquer raiz da unidade é um produto de uma raiz primitiva da unidade com ela mesma um número apropriado de vezes). A maneira natural de procedermos é calcular o grau de uma raiz n-ésima primitiva da unidade sobre Q. Depois excluir todos os valores de n para o qual este grau não é potência de 2. Acontece que as ϕ(n) raízes primitivas da unidade são precisamente o conjunto das raízes de um polinômio irredutível sobre Q, com coeficientes inteiros, chamado de n-ésimo polinômio ciclotômico, e que tem grau ϕ(n). Mostrar esta afir- mação não é simples, e ainda que a mostrássemos, teríamos a dificuldade de avaliar para quais valores de n, ϕ(n) é uma potência de 2. Simplificamos o problema trabalhando com divisores de n. Assim, teremos condições de garantir o Teorema 3.8 que diminui os 64 Extensão de Corpos candidatos a valores de “n” para o qual o n-ágono regular pode ser construído. Vejamos alguns resultados: Lema 3.3. Se o n-ágono regular é construtível, então o m-ágono regular também é para todo m > 3 tal que m|n. Demonstração. Seja m > 3 tal que m|n. Logo, existe k ∈ N tal que n = mk. Como o n-ágono é construtível, seus n vértices são construtíveis. Assim, traçando segmentos a cada k a k vértices do n-ágono, construiremos o m-ágono regular. Sua construtibilidade é garantida pois usamos os vértices construtíveis do n-ágono. Proposição 3.3. Seja f ∈ Q[λ] e a ∈ Q. Então f(λ) é irredutível se, e somente se, f(λ+ a) também é. Demonstração. (⇒) Suponha que f(λ + a) é redutível. Logo existem g, h ∈ Q[λ] tais que f(λ+ a) = g(λ+ a)h(λ+ a). Fazendo λ = λ− a, f(λ) = g(λ)h(λ). Assim, temos que f é redutível, o que contraria a hipótese. (⇐) Por outro lado, suponha que f(λ) é redutível. Logo, existem r, s ∈ Q[λ] tais que f(λ) = r(λ)s(λ). Fazendo λ = λ+ a, temos f(λ+ a) = r(λ+ a)s(λ+ a). Um contradição, pois por hipótese f(λ+ a) é irredutível. Corolário 3.3. Seja f(λ) = λn − 1 λ− 1 = λn−1+λn−2+ · · ·+1 sobre Q. Se n = p é primo, então f é irredutível. Demonstração. Pela proposição anterior, basta mostrar que f(λ+1) é irredutível sobre Q. Temos, f(λ+ 1) = (λ+ 1)p−1 + (λ+ 1)p−2 + · · ·+ (λ+ 1) + 1, e é fácil vermos que, para 1 6 k 6 p− 2, o coeficiente ak de λk é ak = ( p− 1 k ) + ( p− 2 k ) + ( p− 3 k ) + · · ·+ ( k k ) = ( p k + 1 ) , que, portanto é múltiplo de p. Como, f(λ+ 1) = λp−1 + ap−2λ p−2 + · · ·+ a1λ+ 1, segue do critério de Eisenstein aplicado ao primo p que f(λ+ 1) é irredutível sobre Q, e portanto f(λ) também é. Construtibilidade de Polígonos Regulares 65 Proposição 3.4. Se um n-ágono regular é construtível e se p é um primo ímpar que divide n, então p é da forma 22k + 1. Demonstração. Pela hipótese e pelo Lema 3.3, o p-ágono regular é construtível. Assim, as raízes p-ésimas da unidade são construtíveis. Mas as (p− 1) raízes p-ésimas primitivas da unidade são raízes do polinômio λp − 1 λ− 1 = λp−1 + λp−2 + · · ·+ 1, que pelo Corolário 3.3 é um polinômio irredutível. Assim, pelo Teorema 3.8, p− 1 dever ser uma potência de 2, ou seja, p− 1 = 2m ⇒ p = 2m + 1, para algum inteiro m positivo. Contudo, a única vez que um número dessa forma pode ser primo é quando m = 2k para algum k. Para ver isto, note que para m = 1 temos k = 0 e portanto p = 3. Já para m > 1, m é da forma 2k ou tem um fator ímpar q, tal que m = qr. Se m tivesse um tal fator ímpar q, então p = 2m + 1 = 2qr + 1 = (2r)q + 1q = [2r + 1][(2r)q−1 − (2r)q−2 + (2r)q−3 − · · · − 2r + 1], ou seja, teríamos p como um produto de fatores onde nenhum deles é ±p e ±1, con- trariando a hipótese de p ser primo. Portanto, m = 2k. Primos da forma 22 k +1 são chamados de Primos de Fermat. Os únicos conhecidos até o momento são 3, 5, 17, 257 e 65537. Assim, se um n-ágono regular é construtível, todos os fatores primos ímpares de n devem ser primos de Fermat. Além disso, nenhum primo ímpar pode dividir n mais de uma vez. Para garantirmos tal afirmação, precisamos dos seguintes resultados: Lema 3.4. Se p é primo e n um inteiro positivo, então ϕ(pn) = pn−1(p− 1). Demonstração. Seja ϕ(pn) = #U, onde U = {l ∈ {1, 2, . . . , pn}|mdc(l, pn) = 1}, l ∈ U ⇔ mdc(l, pn) = 1. Logo, p - l (pois, se p|l, necessariamente p|1 pelo Teorema de Bezout, o que é um absurdo). Assim, l /∈ {p.k|k = 1, 2, . . . , pn−1}, conjunto que tem pn−1 elementos. Portanto, ϕ(pn) = pn − pn−1 = pn−1(p− 1). 66 Extensão de Corpos Lema 3.5. O grau sobre Q das raízes n-ésimas primitivas da unidade para n = p e n = p2, quando p é primo são p− 1 e p(p− 1) respectivamente. Demonstração. Para n = p, as raízes p-ésimas primitivas da unidade são raízes do polinômio λp − 1 λ− 1 = λp−1 + λp−2 + · · ·+1, que pelo Corolário 3.3 é irredutível sobre Q. Portanto, o grau dessas raízes sobre Q é (p− 1). Para n = p2, as raízes p2-ésimas primitivas da unidade são raízes do polinômio λp2 − 1 λp − 1 = λp(p−1) + λp(p−2) + · · ·+ 1. Este polinômio é irredutível sobre Q, e isto pode ser visto fazendo a mudança de variável, λ = u+ 1. Assim,∑p k=1(u+ 1)p(p−k) = ∑p k=1[(u+ 1)p](p−k) = ∑p k=1[u p + 1 + pg(u)](p−k) = ∑p k=1[(u p + 1)p−k + phk(u)], onde cada hk(u) é um polinômio de grau (p−1)(p−k) com coeficientes inteiros. Usando a fórmula da soma de uma progressão geométrica finita∑p k=1(u+ 1)p(p−k) = ∑p k=1(u p + 1)p−k + pH(u) = (up + 1)p − 1 up + pH(u) = up(p−1) + pG(u), para algum polinômio G de grau (p−1)2. Para aplicar o critério Eisenstein, precisamos ainda mostrar que o termo constante de toda a expressão não é divisível por p2. Embora pudéssemos traçar esse valor através do cálculo, é mais fácil apenas ligar u = 0 a soma original, que dá termo constante igual a p. Agora, pelo critério de Eisenstein o polinômio em u, e portanto em x, é irredutível. Além disso, o grau sobre Q das raízes p2-ésimas primitivas da unidade é p(p− 1). Proposição 3.5. Se um n-ágono regular é construtível e se p é um primo ímpar que divide n, então p2 não divide n. Demonstração. Do Lema 3.4, temos que ϕ(p2) = p(p − 1). Se p2|n, pelo Lema 3.3 as p(p− 1) raízes p2−ésimas primitivas da unidade deveriam ser construtíveis. Mas cada uma dessas tem grau p(p − 1) sobre Q, pelo Lema 3.5. Como seus graus tem o fator ímpar p, as raízes p2−ésimas primitivas da unidade não podem ser construtíveis (Teorema 3.8). Portanto, p2 não pode dividir n. Com os resultados sobre n-ágono até aqui, obtemos a seguinte condição necessária sobre n para a construtibilidade de um n-ágono regular. Teorema 3.9. Para o n-ágono regular ser construtível, n dever ser da forma 2kp1p2 · · · pm onde os pi’s são primos de Fermat distintos (m pode ser igual a 0, caso em que n não tem fatores ímpares) Construtibilidade de Polígonos Regulares 67 Demonstração. Seja n-ágono regular um polígono construtível. Pelo Teorema Funda- mental da Aritmética, n = qr11 qr22 · · · qrmm , q′is são primos distintos e com r′is > 1. Se existe qi como acima ímpar, pelo Lema 3.4, qi = 22 k + 1 e pelo Lema 3.5 ri = 1. Ainda pode acontecer que algum qi = 2 e ri > 2, então n = 2ri s∏ i=1 (22ki + 1). A recíproca deste Teorema também vale, isto é, para todo n da forma dada, é realmente possível construir o n-ágono regular. A prova disto pode ser vista em [1]. Podemos observar que o Teorema 3.9 implica que não é possível construir polígonos com 7, 11 ou 90 lados. O problema de trissectar o ângulo de 60◦ exigiria a construtibi- lidade de um 18-ágono regular e como 18 = 2× 32, isto é impossível. Referências [1] HADLOCK, C. Field Theory and Its Classical Problems. Reino Unido: The Math- ematical Association of America (Cambridge University Press), 2000. [2] SAMUEL, P. Uma demostração Algébrica para o Teorema Fundamental da Álge- bra. Disponível em: . [3] COURANT, R.; ROBBINS, H. O que é Matemática? Rio de Janeiro: Editora Ciência Moderna Ltda, 2000. [4] GONÇALVEZ, A. Introdução a Álgebra. 5. ed. Rio de Janeiro: Projeto Euclides, 2009. [5] KAKUTA, N.; SALERYAN, P. Introdução à Teoria de Galois. São José do Rio Preto: Editora Unesp Ibilce, 2013. [6] ÁVILA, G. Variáveis complexas e aplicações. 3. ed. Rio de Janeiro: LTC, 2011. [7] HERSTEIN, I. N. Tópicos de Álgebra. São Paulo: Editora Polígno S. A., 1970. [8] DOMINGUES, H. H.; IEZZI, G. Álgebra Moderna. 4. ed. São Paulo: Atual Editora, 2003. 69