Extração de relações semânticas e grafos contextuais a partir de imagens de cardápios digitalizados de restaurantes usando redes neurais profundas: criação de ferramentas de processamento de cardápios envolvendo detecção, OCR, e aprendizagem supervisionada.
| dc.contributor.advisor | Papa, João Paulo [UNESP] | |
| dc.contributor.author | Santana, Marcos Cleison Silva | |
| dc.contributor.institution | Faculdade de Ciências, Departamento de Computação | |
| dc.contributor.institution | Universidade Estadual Paulista (Unesp) | pt |
| dc.date.accessioned | 2025-08-11T13:24:40Z | |
| dc.date.issued | 2025-01-31 | |
| dc.description.abstract | Este relatório apresenta o desenvolvimento de um sistema para extração de informações hierárquicas de cardápios digitalizados, abrangendo desde a detecção de texto via OCR, até a classificação de grupos e itens de menu, utilizando técnicas de aprendizado supervisionado e não supervisionado, redes convolucionais e recorrentes, além de redes convolucionais em grafos (GCNs) para análise semântica. O estudo explorou também a detecção de regiões de texto através de imagens mascaradas, a clusterização por tamanho de fonte e diversas técnicas de redução de dimensionalidade (PCA, t-SNE e Isomap) para visualização dos dados. Um sistema de rotulação foi desenvolvido como produto mínimo viável, demonstrando o potencial da combinação das abordagens para uma extração de informações precisa e o auxílio na geração de dados rotulados para futuros aprimoramentos. | pt |
| dc.description.abstract | This report presents the development of a system for hierarchical information extraction from digitized menus, covering everything from text detection via OCR to the classification of menu groups and items, utilizing supervised and unsupervised learning techniques, convolutional and recurrent networks, as well as graph convolutional networks (GCNs) for semantic analysis. The study also explored text region detection through masked images, font size-based clustering, and various dimensionality reduction techniques (PCA, t-SNE, and Isomap) for data visualization. A labeling system was developed as a minimum viable product, demonstrating the potential of combining the approaches for accurate information extraction and assisting in the generation of labeled data for future improvements. | en |
| dc.identifier.lattes | 1817981007132675 | |
| dc.identifier.uri | https://hdl.handle.net/11449/312794 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Estadual Paulista (Unesp) | |
| dc.rights.accessRights | Acesso aberto | pt |
| dc.subject | Deep learning | en |
| dc.subject | Text detection | en |
| dc.subject | Graph projections | en |
| dc.subject | Menu | en |
| dc.subject | Aprendizagem profunda | pt |
| dc.subject | Detecção de texto | pt |
| dc.subject | Projeção de grafos | pt |
| dc.title | Extração de relações semânticas e grafos contextuais a partir de imagens de cardápios digitalizados de restaurantes usando redes neurais profundas: criação de ferramentas de processamento de cardápios envolvendo detecção, OCR, e aprendizagem supervisionada. | |
| dc.title.alternative | Semantic relationship extraction and contextual graphs from digitized restaurant menu images using deep neural networks: creating menu processing tools involving detection, ocr, and supervised learning.rocessing Tools Involving Detection, OCR, and Supervised Learning. | en |
| dc.type | Relatório de pós-doc | pt |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | 4a374f8e-b316-4cda-b285-92f23fedda4b | |
| relation.isAuthorOfPublication.latestForDiscovery | 4a374f8e-b316-4cda-b285-92f23fedda4b | |
| relation.isOrgUnitOfPublication | aef1f5df-a00f-45f4-b366-6926b097829b | |
| relation.isOrgUnitOfPublication.latestForDiscovery | aef1f5df-a00f-45f4-b366-6926b097829b | |
| unesp.campus | Universidade Estadual Paulista (UNESP), Faculdade de Ciências, Bauru | pt |
| unesp.embargo | Online | pt |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- santana_mcs_relatorioposdoc_bauru.pdf
- Tamanho:
- 1.43 MB
- Formato:
- Adobe Portable Document Format
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:

