Solução de Poker com Números Aleatórios
Regras
- Dois jogadores recebem cada um um número aleatório extraído de uma distribuição uniforme entre 0 e 1.
- O jogador 1 pode manter seu número ou trocá-lo por um novo número aleatório.
- O jogador 2, sabendo da decisão do jogador 1, também pode trocar de número ou manter o número original.
- Quem tiver o maior número final vence.
Questões
- Qual é a estratégia ideal para cada jogador?
- Supondo que ambos os jogadores sigam a estratégia ideal, qual a probabilidade de vitória para cada jogador?
Respostas
- O jogador 1 deve trocar de posição com um valor inferior a 0,567364; caso contrário, permanece inativo.
- Se o Jogador 1 trocar de posição, o Jogador 2 deve trocar com um valor menor que 0,5; caso contrário, permanece inalterado.
- Se o Jogador 1 permanecer na posição, o Jogador 2 deverá trocar de posição com um valor menor que 0,660951; caso contrário, permanecerá na posição.
- Probabilidade de o jogador 1 vencer = 0,494333.
- Probabilidade de vitória do jogador 2 = 0,505667.
- Supondo que cada jogador aposte em um número, então o valor esperado do jogador 1 = -0,011333.
Solução
É óbvio que se o jogador 1 trocar de posição, o jogador 2 deve trocar com menos de 0,5 e permanecer inativo caso contrário.Caso contrário, o jogador 1 deve permanecer na partida se o seu número inicial for superior a um determinado número. Vamos chamar esse número de x.
Se o jogador 1 parar, o jogador 2 pode presumir que o jogador 1 tem um número razoável. O jogador 2 precisa ser agressivo para tentar vencê-lo. Sua estratégia deve ser trocar de mão acima de um certo número, vamos chamá-lo de y, se o jogador 1 parar.
Para resolver problemas como este, você precisa encontrar os pontos de indiferença, x e y. Isso é feito igualando o valor esperado para ficar parado e para alternar.
Para o restante desta solução, calcularei o valor esperado da perspectiva do jogador 1, assumindo que ambos os jogadores apostam uma unidade cada.
Vamos resolver primeiro para o valor de x.
Valor esperado em pé = y*(2x-1) - (1-y)
Valor esperado ao atingir = 0,5 * 0 + 0,25 * 0 + 0,25 * -1 = -0,25.
Em seguida, iguale esses valores esperados entre si:
y*(2x-1) - (1-y) = -0,25
2xy - y - 1 + y = -0,25
2xy - 1 = -0,25
2xy = 0,75
xy = 3/8
Em seguida, vamos encontrar o valor esperado se o jogador 2 tiver y e se levantar depois que o jogador 1 se levantar:
(yx)/(1-x) + (1-y)/(1-x) * -1 = (x-2y+1) / (x-1)
Em seguida, vamos calcular o valor esperado se o jogador 2 tiver y e atacar depois que o jogador 1 se levantar:
(1 / (1-x)) * [(1-x)^2 * 0 + x * (1-x) * -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x
Em seguida, iguale esses valores esperados entre si:
(x-2y+a) / (x-1) = -x
x² - 2y + 1 = 0
x^3 - 2xy + x = 0
Em seguida, substitua 3/8 por xy.
x^3 + x - 0,75 = 0
4x^3 + 4x - 3 = 0.
Neste ponto, você pode usar um solucionador de equações cúbicas para obter x = 0,567364.
Sabendo que xy = 3/8, você pode substituir o valor acima por x para obter y = 0,660951.
O processo consiste em analisar todas as combinações possíveis de dois a quatro números para obter a probabilidade de cada jogador ganhar. Isso pode ser feito com geometria ou cálculo. Peço desculpas se deixar essa parte para o leitor. Aqui estão as respostas:
Probabilidade de o jogador 1 vencer = 0,494333.
Probabilidade de vitória do jogador 2 = 0,505667.
Supondo que cada jogador aposte em um número, então o valor esperado do jogador 1 = -0,011333.
Para aqueles que precisam de uma resposta exata:
Seja z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0,926962
Então x = z - 1/(3z) ~ 0,567364
Então y = 3/(8x) ~ 0,660951
Então, o valor esperado do jogador 1 = 3x/8 + y(y-1) ~ -0,011333
Agradecemos a Joe Shipman pela solução do problema.