Enfoques

Cefeo, un jugador perfecto de Texas Hold’em

Es el algoritmo desarrollado por la Universidad de Alberta que, sin poder asegurar un 100% de victorias, es prácticamente infalible, para poder derrotarlo se necesitarían más de 70 años jugando contra él.
Bloomberg
11 enero 2015 18:46 Última actualización 12 enero 2015 5:0
Michael Bowling (izquierda), de la Universidad de Alberta, dirigió el equipo que desarrolló el algoritmo. (Universidad de Alberta)

Michael Bowling (izquierda), de la Universidad de Alberta, dirigió el equipo que desarrolló el algoritmo. (Universidad de Alberta)

Si pierde en el Texas Hold'em, no culpe a sus cartas. Un gran avance en la inteligencia artificial ha permitido dominar la versión más simple de Texas Hold'em al calcular todas las posibles variaciones para hacer el movimiento perfecto en cada ocasión. Cuando se realiza sin errores, no hay manera de perder. En este caso, el jugador es Cefeo, un algoritmo diseñado por investigadores canadienses.

"Tenemos una estrategia que garantiza que no va a perder", dijo Michael Bowling, científico en computación de la Universidad de Alberta, quien dirigió un equipo que trabaja en el programa. "Es sólo cuando alguien comete un error que se termina perdiendo".

Los investigadores, quienes publicaron su trabajo en la revista Science, han llamado a los jugadores humanos a desafiar a Cefeo. Los resultados pueden hacer que los contendientes se replanteen algunos movimientos comunes, dijo Bowling en una entrevista telefónica.

"No sólo probamos algunas cosas que la mayoría de la gente ya creía, como que quien reparte tiene una ventaja sustancial; tenemos algunas respuestas a planteamientos que todavía no estaban resueltos" dijo. "Por ejemplo, subir la apuesta con pares muy bajos, algo que la mayoría de los buenos jugadores de póquer nunca haría".

Es la primera vez que investigadores han resuelto un juego en el que seres humanos compiten y que involucra información imperfecta, lo que significa que no se sabe todo, como las cartas de los oponentes, dijo Tuomas Sandholm, del departamento de ciencias de la computación de la Universidad Carnegie Mellon en Pittsburgh, en un editorial que acompaña la investigación publicada en Sciense.

10 MIL MILLONES DE DECISIONES

Los resultados aplican sólo a la forma más básica del juego, conocida como Heads-up Limit Hold'em, donde hay dos jugadores y las apuestas y aumentos de las mismas están limitadas. Incluso con estas restricciones, hay más de 10 mil millones de puntos de decisión en el juego.

El sistema tiene más de 10 terabytes de datos, en comparación, la versión de Wikipedia en inglés es mil veces más pequeña, dijo Bowling.

Resolver el juego requiere un control aún más profundo que cuando el programa Chinook se llevó el título de campeón mundial de damas contra los humanos en la década de los 90 o cuando Deep Blue de IBM venció a Garry Kasparov en ajedrez en 1997.

Mientras que un programa podría vencer un día a los mejores del mundo de No-Limit Texas Hold'em, la forma más popular del juego, es poco probable que alguna vez alguien pueda resolver todos los posibles movimientos y combinaciones porque simplemente hay demasiados, dijo Bowling.

LECCIÓN ACADÉMICA

La investigación, aunque es ‘cool’, también es académica para los jugadores de póquer más ávidos, quienes prefieren opciones más avanzadas como No-Limit Texas Hold'em, dijo Ed Miller, jugador profesional y autor de "Small Stakes Hold’em: Winning Big with Expert Play".

Miller dice que planea jugar contra la Cefeo, a pesar de que no hay manera de ganarle.

"Siempre hablamos de lo que teóricamente sería una solución perfecta para un juego de póquer", dijo. "Habrá algunas cosas que el algoritmo haga que podré definir simplemente como ‘¿Qué? ¿Por qué hizo eso?’ y yo podría aplicarlas en mis juegos".

LA SUERTE

Por supuesto, Heads-up Limit Texas Hold'em tiene un elemento de azar. Si a alguien se le reparte una mano terrible es poco probable que gane, pero con bastantes partidos jugados, sin embargo, la suerte se equilibra, dijo Miller.

Una cosa en el Texas Hold'em que no es casualidad es la ventaja de quien reparte. El dealer actúa primero en la primera ronda del juego y segundo en todas las demás. Esa ventaja de ser segundo es crítica, ya que da a ese jugador la capacidad de observar los movimientos del oponente, dijo el investigador Michael Johanson de la Universidad de Alberta.

"Hemos programado una estrategia perfecta para cada una de las posiciones", dijo Johanson en un correo electrónico.

HASTA SABE BLOFEAR

Los investigadores generaron un programa informático que no tenía conocimiento de póker, pero la inteligencia artificial y la teoría de juegos le permitió hacer el cálculo de los mejores movimientos posibles. El algoritmo jugó 28.8 billones de partidas por segundo durante dos meses.

"En el momento en que terminó, había jugado más de póker que toda la humanidad combinada", dijo Bowling. "Es tan cercano a la perfección en este momento que consideremos que simplemente ha resuelto el juego".

La forma de ganar de Cefeo no son sólo es una cuestión de conocer todas las probabilidades, la teoría de juegos y el razonamiento entran en acción al momento de tomar decisiones como blofear al hacer las apuestas para deshacerse de sus competidores. Por ejemplo, cuando Cefeo sabe que tiene una mano ganadora, no necesariamente apostará reflejando esto, en lugar fingirá que tiene cartas más débiles.

Los investigadores esperan que los jugadores de póquer acepten el reto de jugar con Cefeo y descubran el razonamiento atrás de algunas de sus decisiones. Cefeo no es capaz de explicar por qué hace los movimientos que hace, más allá de ganar más dinero.

"Aquí es donde el ingenio humano entra", dijo Bowling. "Esperando que algunos entusiastas del póker lo escrudiñen y saquen algunas ideas. Ya tenemos la prueba matemática de que a la larga no van a ganar, pero puede ser esclarecedor saber que están compitiendo contra el mejor jugador del mundo".