WOO logo

Solução de Poker com Números Aleatórios

Regras

  1. Dois jogadores recebem cada um um número aleatório extraído de uma distribuição uniforme entre 0 e 1.
  2. O jogador 1 pode manter seu número ou trocá-lo por um novo número aleatório.
  3. O jogador 2, sabendo da decisão do jogador 1, também pode trocar de número ou manter o número original.
  4. Quem tiver o maior número final vence.

Questões

  1. Qual é a estratégia ideal para cada jogador?
  2. Supondo que ambos os jogadores sigam a estratégia ideal, qual a probabilidade de vitória para cada jogador?

Respostas

  • O jogador 1 deve trocar de posição com um valor inferior a 0,567364; caso contrário, permanece inativo.
  • Se o Jogador 1 trocar de posição, o Jogador 2 deve trocar com um valor menor que 0,5; caso contrário, permanece inalterado.
  • Se o Jogador 1 permanecer na posição, o Jogador 2 deverá trocar de posição com um valor menor que 0,660951; caso contrário, permanecerá na posição.
  • Probabilidade de o jogador 1 vencer = 0,494333.
  • Probabilidade de vitória do jogador 2 = 0,505667.
  • Supondo que cada jogador aposte em um número, então o valor esperado do jogador 1 = -0,011333.

Solução

É óbvio que se o jogador 1 trocar de posição, o jogador 2 deve trocar com menos de 0,5 e permanecer inativo caso contrário.

Caso contrário, o jogador 1 deve permanecer na partida se o seu número inicial for superior a um determinado número. Vamos chamar esse número de x.

Se o jogador 1 parar, o jogador 2 pode presumir que o jogador 1 tem um número razoável. O jogador 2 precisa ser agressivo para tentar vencê-lo. Sua estratégia deve ser trocar de mão acima de um certo número, vamos chamá-lo de y, se o jogador 1 parar.

Para resolver problemas como este, você precisa encontrar os pontos de indiferença, x e y. Isso é feito igualando o valor esperado para ficar parado e para alternar.

Para o restante desta solução, calcularei o valor esperado da perspectiva do jogador 1, assumindo que ambos os jogadores apostam uma unidade cada.

Vamos resolver primeiro para o valor de x.

Valor esperado em pé = y*(2x-1) - (1-y)

Valor esperado ao atingir = 0,5 * 0 + 0,25 * 0 + 0,25 * -1 = -0,25.

Em seguida, iguale esses valores esperados entre si:

y*(2x-1) - (1-y) = -0,25
2xy - y - 1 + y = -0,25
2xy - 1 = -0,25
2xy = 0,75
xy = 3/8

Em seguida, vamos encontrar o valor esperado se o jogador 2 tiver y e se levantar depois que o jogador 1 se levantar:

(yx)/(1-x) + (1-y)/(1-x) * -1 = (x-2y+1) / (x-1)
Em seguida, vamos calcular o valor esperado se o jogador 2 tiver y e atacar depois que o jogador 1 se levantar:

(1 / (1-x)) * [(1-x)^2 * 0 + x * (1-x) * -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x

Em seguida, iguale esses valores esperados entre si:

(x-2y+a) / (x-1) = -x
x² - 2y + 1 = 0
x^3 - 2xy + x = 0

Em seguida, substitua 3/8 por xy.

x^3 + x - 0,75 = 0
4x^3 + 4x - 3 = 0.

Neste ponto, você pode usar um solucionador de equações cúbicas para obter x = 0,567364.

Sabendo que xy = 3/8, você pode substituir o valor acima por x para obter y = 0,660951.

O processo consiste em analisar todas as combinações possíveis de dois a quatro números para obter a probabilidade de cada jogador ganhar. Isso pode ser feito com geometria ou cálculo. Peço desculpas se deixar essa parte para o leitor. Aqui estão as respostas:

Probabilidade de o jogador 1 vencer = 0,494333.
Probabilidade de vitória do jogador 2 = 0,505667.
Supondo que cada jogador aposte em um número, então o valor esperado do jogador 1 = -0,011333.

Para aqueles que precisam de uma resposta exata:

Seja z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0,926962
Então x = z - 1/(3z) ~ 0,567364
Então y = 3/(8x) ~ 0,660951
Então, o valor esperado do jogador 1 = 3x/8 + y(y-1) ~ -0,011333

Agradecemos a Joe Shipman pela solução do problema.