Aplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquer

Yamashiro, Gabriel Jooji [UNESP]

Aplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquer

dc.contributor.advisor	Passos Junior, Leandro Aparecido
dc.contributor.author	Yamashiro, Gabriel Jooji [UNESP]
dc.contributor.institution	Universidade Estadual Paulista (Unesp)
dc.date.accessioned	2025-11-25T14:48:05Z
dc.date.issued	2025-11-11
dc.description.abstract	O pôquer Heads-Up No-Limit Texas Hold’em, por ser um jogo de informação imperfeita, apresenta um desafio complexo para a inteligência artificial devido à sua vasta combinatória, além de elementos como blefe e adaptação ao oponente. Este trabalho propõe um agente de Inteligência Artificial (IA) que integra o algoritmo Counterfactual Regret Minimization (CFR) para aproximar o Equilíbrio de Nash aliado a técnicas de aprendizado de máquina para abstrações de cartas e ações. As abstrações foram realizadas por agrupamento de dados usando o K-Means, baseado em distribuições de equidade, gerando 169 grupos no pré-flop, 50 no flop, 100 no turn e 200 no river. Um dataset do tamanho de 1 milhão de mãos foi treinado de forma offline, com treinamentos separados para pré-flop e pós-flop. O agente foi avaliado contra o Slumbot em cerca de 10.000 mãos, registrando perdas de -41.47 Big Blind a cada 100 mãos (BB/100) (Dataset de 250.000 mãos), -32.125 BB/100 (Dataset de 500.000 mãos), -47.025 BB/100 (Dataset de 750.000 mãos) e -47.19 BB/100 (Dataset de 1.000.000 mãos). Apesar da não linearidade dos resultados, possivelmente devido à alta variância no pôquer, a estratégia CFR superou consistentemente heurísticas predefinidas, exibindo perdas menores em todos os testes. A implementação demonstrou viabilidade em hardware modesto, contribuindo para avanços em jogos de informação imperfeita e teoria dos jogos.	pt
dc.description.abstract	The Heads-Up No-Limit Texas Hold’em poker, as an imperfect information game, poses a significant challenge for artificial intelligence due to its vast combinatorial complexity, coupled with elements such as bluffing and opponent adaptation. This study proposes an AI agent that integrates the Counterfactual Regret Minimization (CFR) algorithm to approximate the Nash Equilibrium, combined with machine learning techniques for card and action abstractions. Abstractions were implemented using K-Means clustering based on equity distributions. A dataset of 1 million hands was generated offline, with separate training for pre-flop and postf lop phases. Despite the non-linear results, likely due to poker’s inherent high variance, the CFR-based strategy consistently outperformed predefined heuristics, showing lower losses across all scenarios. The implementation demonstrated feasibility on modest hardware, contributing to advancements in imperfect information games and game theory. This work was conducted as part of the undergraduate thesis in Computer Science at Universidade Estadual Paulista "Júlio de Mesquita Filho", Faculty of Sciences, Bauru, under the supervision of Prof. Dr. Leandro Aparecido Passos Junior, and completed on October 30, 2025.	en
dc.identifier.citation	YAMASHIRO, Gabriel. Aplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquer. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista (UNESP), Bauru, 2025.
dc.identifier.uri	https://hdl.handle.net/11449/315536
dc.language.iso	por
dc.publisher	Universidade Estadual Paulista (Unesp)
dc.rights.accessRights	Acesso aberto	pt
dc.subject	Pôquer	pt
dc.subject	Inteligência-artificial	pt
dc.subject	CFR	pt
dc.subject	Equilíbrio de Nash	pt
dc.subject	Abstração	pt
dc.subject	Agrupamento de dados	pt
dc.subject	Poker	en
dc.subject	Artificial intelligence	en
dc.subject	Nash equilibrium	en
dc.subject	Abstraction	en
dc.subject	Clustering	en
dc.title	Aplicação de aprendizado de máquina e equilíbrio de Nash no jogo de pôquer	pt
dc.title.alternative	Applying machine learning and Nash equilibrium in poker	en
dc.type	Trabalho de conclusão de curso	pt
dspace.entity.type	Publication
relation.isAuthorOfPublication	c3bbe477-075d-4cb6-aa67-b93b204406f2
relation.isAuthorOfPublication.latestForDiscovery	c3bbe477-075d-4cb6-aa67-b93b204406f2
relation.isOrgUnitOfPublication	aef1f5df-a00f-45f4-b366-6926b097829b
relation.isOrgUnitOfPublication.latestForDiscovery	aef1f5df-a00f-45f4-b366-6926b097829b
relation.isUndergradCourseOfPublication	0ad27f2d-0ce4-45ac-9ab9-d719bb888d0c
relation.isUndergradCourseOfPublication.latestForDiscovery	0ad27f2d-0ce4-45ac-9ab9-d719bb888d0c
unesp.campus	Universidade Estadual Paulista (UNESP), Faculdade de Ciências, Bauru	pt
unesp.examinationboard.type	Banca pública	pt
unesp.undergraduate	Bauru - FC - Ciência da Computação	pt

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: yamashiro_gj_tcc_bauru.pdf
Tamanho:: 1013.17 KB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 2 de 2

Nome:: license.txt
Tamanho:: 2.14 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Nome:: yamashiro_gj_autorizacao_bauru.pdf
Tamanho:: 139.34 KB
Formato:: Adobe Portable Document Format
Descrição:

Coleções

Bauru - FC - Faculdade de Ciências