Logo do repositório

Aplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquer

dc.contributor.advisorPassos Junior, Leandro Aparecido
dc.contributor.authorYamashiro, Gabriel Jooji [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2025-11-25T14:48:05Z
dc.date.issued2025-11-11
dc.description.abstractO pôquer Heads-Up No-Limit Texas Hold’em, por ser um jogo de informação imperfeita, apresenta um desafio complexo para a inteligência artificial devido à sua vasta combinatória, além de elementos como blefe e adaptação ao oponente. Este trabalho propõe um agente de Inteligência Artificial (IA) que integra o algoritmo Counterfactual Regret Minimization (CFR) para aproximar o Equilíbrio de Nash aliado a técnicas de aprendizado de máquina para abstrações de cartas e ações. As abstrações foram realizadas por agrupamento de dados usando o K-Means, baseado em distribuições de equidade, gerando 169 grupos no pré-flop, 50 no flop, 100 no turn e 200 no river. Um dataset do tamanho de 1 milhão de mãos foi treinado de forma offline, com treinamentos separados para pré-flop e pós-flop. O agente foi avaliado contra o Slumbot em cerca de 10.000 mãos, registrando perdas de -41.47 Big Blind a cada 100 mãos (BB/100) (Dataset de 250.000 mãos), -32.125 BB/100 (Dataset de 500.000 mãos), -47.025 BB/100 (Dataset de 750.000 mãos) e -47.19 BB/100 (Dataset de 1.000.000 mãos). Apesar da não linearidade dos resultados, possivelmente devido à alta variância no pôquer, a estratégia CFR superou consistentemente heurísticas predefinidas, exibindo perdas menores em todos os testes. A implementação demonstrou viabilidade em hardware modesto, contribuindo para avanços em jogos de informação imperfeita e teoria dos jogos.pt
dc.description.abstractThe Heads-Up No-Limit Texas Hold’em poker, as an imperfect information game, poses a significant challenge for artificial intelligence due to its vast combinatorial complexity, coupled with elements such as bluffing and opponent adaptation. This study proposes an AI agent that integrates the Counterfactual Regret Minimization (CFR) algorithm to approximate the Nash Equilibrium, combined with machine learning techniques for card and action abstractions. Abstractions were implemented using K-Means clustering based on equity distributions. A dataset of 1 million hands was generated offline, with separate training for pre-flop and postf lop phases. Despite the non-linear results, likely due to poker’s inherent high variance, the CFR-based strategy consistently outperformed predefined heuristics, showing lower losses across all scenarios. The implementation demonstrated feasibility on modest hardware, contributing to advancements in imperfect information games and game theory. This work was conducted as part of the undergraduate thesis in Computer Science at Universidade Estadual Paulista "Júlio de Mesquita Filho", Faculty of Sciences, Bauru, under the supervision of Prof. Dr. Leandro Aparecido Passos Junior, and completed on October 30, 2025.en
dc.identifier.citationYAMASHIRO, Gabriel. Aplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquer. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista (UNESP), Bauru, 2025.
dc.identifier.urihttps://hdl.handle.net/11449/315536
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso abertopt
dc.subjectPôquerpt
dc.subjectInteligência-artificialpt
dc.subjectCFRpt
dc.subjectEquilíbrio de Nashpt
dc.subjectAbstraçãopt
dc.subjectAgrupamento de dadospt
dc.subjectPokeren
dc.subjectArtificial intelligenceen
dc.subjectNash equilibriumen
dc.subjectAbstractionen
dc.subjectClusteringen
dc.titleAplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquerpt
dc.title.alternativeApplying machine learning and Nash equilibrium in pokeren
dc.typeTrabalho de conclusão de cursopt
dspace.entity.typePublication
relation.isAuthorOfPublicationc3bbe477-075d-4cb6-aa67-b93b204406f2
relation.isAuthorOfPublication.latestForDiscoveryc3bbe477-075d-4cb6-aa67-b93b204406f2
relation.isOrgUnitOfPublicationaef1f5df-a00f-45f4-b366-6926b097829b
relation.isOrgUnitOfPublication.latestForDiscoveryaef1f5df-a00f-45f4-b366-6926b097829b
relation.isUndergradCourseOfPublication0ad27f2d-0ce4-45ac-9ab9-d719bb888d0c
relation.isUndergradCourseOfPublication.latestForDiscovery0ad27f2d-0ce4-45ac-9ab9-d719bb888d0c
unesp.campusUniversidade Estadual Paulista (UNESP), Faculdade de Ciências, Baurupt
unesp.examinationboard.typeBanca públicapt
unesp.undergraduateBauru - FC - Ciência da Computaçãopt

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
yamashiro_gj_tcc_bauru.pdf
Tamanho:
1013.17 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.14 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Carregando...
Imagem de Miniatura
Nome:
yamashiro_gj_autorizacao_bauru.pdf
Tamanho:
139.34 KB
Formato:
Adobe Portable Document Format
Descrição: