Aplicação de machine learning para classificação de imagens astronômicas

Carregando...
Imagem de Miniatura

Data

2023-02-01

Orientador

Oliveira, Rafael Sfair de
Gomes, Altair

Coorientador

Pós-graduação

Curso de graduação

Física - FEG

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Atualmente na Astronomia é crescente a quantidade de imagens coletadas. O objetivo principal desse projeto foi implementar e analisar métodos de Machine Learning para classificação de imagens geradas em problemas de dinâmica orbital. O ML é uma área que busca a automatização de processos a partir de métodos computacionais, utilizando a experiência para melhorar o desempenho ou para fazer previsões precisas. Dentre os métodos de ML foi escolhido a CNN (Convolutional Neural Network), que tem como objetivo a análise e classificação de imagens. Para verificar a exequibilidade da proposta foi realizada uma análise preliminar utilizando dados orbitais da evolução dinâmica de NEAs (Near Earth Asteroids), cujo modelo de ML foi construído utilizando a biblioteca keras de redes neurais em Python. Nesse caso, o intuito foi classificar gráficos que representavam a excentricidade em relação ao semi-eixo maior da órbita dos objetos. Partimos de um conjunto com 429 gráficos e realizamos testes agrupando as imagens em duas ou três categorias. Para os casos com duas categorias foi possível obter uma acurácia superior a 0,9 usando 30% das imagens como etapa de treino, podendo chegar a 0,98 caso o conjunto de treino corresponda a 50% da amostra; no caso com três classes a acurácia foi inferior (menor que 0,86). Este último resultado está relacionado a similaridade entre duas das classes, dificultando a separação entre elas. Também realizamos a classificação de gráficos da evolução do ângulo ressonante no tempo das partículas do arco do anel G de Saturno. Nesse caso o conjunto foi amplo, contendo 18 mil imagens. Foram desenvolvidos dois tipos de cenário, com duas classes (libração e circulação) e três classes (libração, alternado e circulação). Alcançamos uma acurácia de até 0,99. O desempenho variou conforme a quantia de épocas (número de vezes em que as camadas são aplicadas), quanto maior a época maior o desempenho, havendo um limite de parada para o aprendizado.

Resumo (inglês)

Nowadays in astronomy, it is increasing the number of produced images. The main objective of this project was to implement and analyze Machine Learning methods to classify images generated in orbit dynamic problems. ML is an area that seeks to automate processes through computational methods, using the experience to improve performance or to make accurate predictions. Among the methods of ML, we chose the CNN (Convolutional Neural Network) which has the objective of analyzing and classifying images. In order to verify the proposed feasibility, we made a preliminary analysis using dynamic evolution orbital data of NEAS (Near Earth Asteroids), whose model of ML was built using the Keras library of neural networks in Python. In this case, our intention was to classify graphics that represented the eccentricity versus the semi-major axis of the object’s orbit. We started from a set with 429 graphics and performed tests grouping images into two or three categories. For the cases with two categories, it was possible to obtain an accuracy higher than 0.9 using 30% of the images as a training set, where the model could reach 0.98 accuracy if the training set corresponded to 50% of the sample: in the case with three classes the accuracy was inferior (less than 0.86). This last result is related to similarities between the two classes, making them difficult to separate. We also perform the classification of graphics of the time evolution of the resonant angle of Saturn’s G ring particles. In this case, the set was large, containing 18 thousand images. Two scenarios were developed, with two classes (libration and circulation) and with three classes (libration, alternating, and circulation). We reach an accuracy of up to 0.99. The performance varied according to the number of epochs (number of times that the layers are applied), the higher the epoch, the higher the performance, having a stop limit for learning.

Descrição

Idioma

Português

Como citar

Itens relacionados