le no limit heads up hold’em et l’apprentissage de la machine

18
Le No Limit Heads Up Hold’em et l’apprentissage de la machine Comment jouer au poker à 2 joueurs?

Upload: mollie-duran

Post on 30-Dec-2015

26 views

Category:

Documents


0 download

DESCRIPTION

Le No Limit Heads Up Hold’em et l’apprentissage de la machine. Comment jouer au poker à 2 joueurs ?. Introduction. Pourquoi le poker est-il étudié? - connaissances et données partielles - environnement dynamique et stochastique (évaluation des risques) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Le No Limit Heads Up Hold’em et

l’apprentissage de la machineComment jouer au poker à 2 joueurs?

Page 2: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Introduction• Pourquoi le poker est-il étudié?

- connaissances et données partielles- environnement dynamique et stochastique

(évaluation des risques)- Un univers à valeurs continues (hautes

dimensions) - Modélisation des joueurs - Calcul des côtes et probabilités- Bluff

• Un univers d’IA totalement différent des Echecs ou des Dames.

Page 3: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

L’existant

• L’université d’Alberta

• Bots online

• PsOpti (limit poker)

• Aucune étude sur le No Limit.

Page 4: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Buts de l’étude

• Passer outre les difficultés

• Ecrire un programme “intelligent”

• Meilleur que les probabilités

• Auto correcteur

• Adaptable

Page 5: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Règles et vocabulaire

Joueur 1 Joueur 2

Community cards

Flop Turn River

Small blindBig blind

Pot

Cartes privées

Page 6: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Boîtes à outils

• Utilisation d’un data set

• Tables de probabilité pré calculées

• Un univers discret d’actions et de type de cartes

• Algorithmes de calculs de probabilité en temps réel

Page 7: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Procédé global

1. Descriptions des joueurs2. Poids calculés de la main adverse

3. Description de la force de la main 4. Calculs des probabilités des actions

5. Online learning

Page 8: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Suppositions des cartes

DATASET

Actions observées

Modélisation de l’adversaire

Poids des cartes

AsAh AsKd KsQh TsTh

Page 9: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Choix de l’action

DATASET

Cartes adverses supposées

Modélisations des joueurs

Forces de la main

Réponse appropriée

Page 10: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Cycle d’apprentissage

Apprentissage temps réel (correction)

Apprentissage offline

DATASET

Page 11: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Outils utilisés

• PokDTC Network (Serveur et clients)

• Poker Academy Pro

• Scripts de jeu

Page 12: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Expériences

Page 13: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Random Bot

Page 14: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Apprentissages

Page 15: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Abitbot vs Angus

Page 16: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine
Page 17: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Joueur humain

Page 18: Le No Limit Heads Up Hold’em et  l’apprentissage de la machine

Conclusion

• Bonnes performances contre d’autres bots

• Echecs contre joueurs humains de bons niveaux

• Besoin de modifier le dataset

• Apprentissage réussi mais insuffisant

• Possibilités d’utilisation sur d’autres variantes