Aquí la explicación de GTO, Solvers y el equilibrio de Nash, con Brian Fite
Brian Fite es un jugador y entrenador profesional de póquer de 35 años. Ha estado jugando al póquer a tiempo completo durante más de 14 años y, a lo largo del camino, ha desarrollado un profundo conocimiento del juego y todas sus variantes, incluidas las partidas con dinero real, sit-n-gos y torneos.
Con más de $2 millones en ganancias con una entrada promedio de menos de $40, el hombre de familia es ampliamente considerado como uno de los jugadores de torneos de apuestas bajas más rentables del mundo. Actualmente juega en línea en varios sitios bajo los nombres ‘Rockysroad’ y ‘TheTexican’.
Recientemente unió fuerzas con BBZ Poker, donde organiza tres seminarios de entrenamiento semanales además de administrar un equipo de CFP y realizar más de 20 horas de entrenamiento privado por semana.
¿Es el equilibrio de Nash lo mismo que la teoría de juegos óptima (GTO)?
Brian Fite: Nash Equilibrium y GTO no son lo mismo, pero son conceptos relacionados. La comunidad de póquer hace un mal trabajo al diferenciar entre estos dos conceptos y, a menudo, usa GTO y Nash Equilibrium como sinónimos cuando habla de estrategia de póquer. Esto puede volverse algo granular, así que intentaré mantenerlo simple.
El equilibrio de Nash es un concepto de la teoría de juegos en el que cada jugador de un juego toma sus decisiones en función de las estrategias de los otros jugadores, y ningún jugador tiene un incentivo para cambiar su estrategia, dadas las estrategias de los otros jugadores. Esto también se conoce como inexplotable. Para expresarlo de manera menos formal, a menudo me refiero al Equilibrio de Nash como la estrategia que los robots perfectos que juegan al póquer usarían entre sí. Nash es la parte “solucionada” del póquer que es “equilibrada e inexplotable”.
De ahí vienen todas esas palabras. Pero nuevamente, es crucial comprender que esto debe ser cierto en un entorno de robots. Debido a que los otros humanos en la mesa se desviarán de sus estrategias, ya sea deliberadamente o no, el juego ya no se jugará en Nash Equilibrium y alguien obtendrá una ventaja.
GTO, por otro lado, se refiere a una estrategia que es óptima contra todas las contraestrategias posibles de los oponentes. Es un concepto más avanzado en la teoría de juegos y tiene en cuenta no solo el equilibrio de Nash, sino también el rango de manos que pueden tener los jugadores (humanos). Ningún robot perfecto para jugar al póquer lo incentivará a ser más agresivo desde el botón, pero si los jugadores humanos en las ciegas están jugando demasiado apretado, la estrategia GTO sería ajustar y subir más desde el botón de lo que haría Nash Equilibrium. para atacar, o explotar, a los jugadores débiles/apretados en las ciegas. Como jugador que juega muchas apuestas bajas y medias, trato constantemente de jugar GTO, pero rara vez pretendo jugar Nash.
En resumen, todas las estrategias GTO son Equilibrio de Nash, pero no todas las Equilibrio de Nash son GTO.