La I.A. sabe cómo engañar en el póker

23 de julio del 2019

Cuando el oponente es una máquina.

La I.A. sabe cómo engañar en el póker

En sus 14 años en el circuito profesional de póker, Darren Elias nunca se había enfrentado a nadie que jugara con tan poco miedo.

Un típico jugador de póker, al repartírsele dos jotas, una boca arriba, la otra oculta, -una mano ni buena ni mala- procedería con precaución. Pero no el oponente de Elias, que parecía saber qué hacer. Incluso cuando Elías decidió blofear, apostando como si tuviera una mano fuerte, su oponente eficazmente pidió verla: yendo por todo, igualando cada apuesta con lo que parecía ser plena confianza, y ganando.

Aún más notable: este oponente era una máquina.

El jugador de póker automatizado, llamado Pluribus, fue diseñado por investigadores de la Universidad Carnegie Mellon de Pensilvania y del laboratorio de inteligencia artificial de Facebook en Nueva York. En un artículo publicado el 11 de julio en la revista Science, los investigadores describieron cómo Pluribus venció a Elias y a otros profesionales de élite en un juego multijugador de Texas Hold ‘Em, la forma más popular de póker.

Durante los últimos 30 años, los investigadores han construido sistemas que vencen a los mejores jugadores en damas, ajedrez, Go e incluso Jeopardy. Pero a diferencia de estos juegos, el póker se basa en información oculta. Cada jugador tiene cartas que los oponentes no pueden ver. Los mejores jugadores deben dominar formas de descubrir lo que sus oponentes ocultan, y al mismo tiempo mantener sus propios secretos a salvo.

Pluribus sabía cuándo fingir, cuándo retar el fingimiento de otra persona y cuándo variar su comportamiento para que los demás no pudieran identificar su estrategia. “Hace todo lo que hacen los mejores jugadores del mundo”, dijo Elias, de 32 años, quien ha ganado un récord de cuatro títulos en el World Poker Tour. “Y hace algunas cosas que a los humanos nos cuesta trabajo hacer”.

Los expertos creen que las técnicas que impulsan éste y otros sistemas similares podrían utilizarse en operaciones de Wall Street, en subastas, en negociaciones políticas y en ciberseguridad, actividades que, al igual que el póker, involucran información oculta. “No siempre se conoce el estado del mundo real”, dijo Noam Brown, el investigador de Facebook que supervisó el proyecto Pluribus.

Pluribus aprendió los matices del Texas Hold ‘Em jugando billones de manos contra sí mismo. Después de cada mano, evaluaba cada decisión, determinando si una elección diferente habría producido un mejor resultado.

A diferencia de los sistemas que pueden dominar videojuegos tridimensionales como StarCraft —sistemas que necesitan semanas o incluso meses de entrenamiento para jugar contra humanos— Pluribus entrenó sólo durante ocho días en una computadora bastante ordinaria a un costo de unos 150 dólares.

Al final, Pluribus aprendió a aplicar estrategias complejas, incluyendo blofeo y comportamientos aleatorios, en tiempo real. Luego, al jugar contra oponentes humanos, refinaba estas estrategias adelantándose a los posibles resultados.

Todos los juegos se jugaron en línea, por lo que el sistema no estaba descifrando las emociones o “pistas” físicas de sus oponentes humanos. El éxito de Pluribus demostró que el póker puede reducirse a nada más que las matemáticas, dijo Elias: “Puros números y porcentajes. Está resolviendo el juego mismo”.

Ver comentarios
KONTINÚA LEYENDO