Índice:
- Dilema do Prisioneiro - Em poucas palavras
- O Dilema do Prisioneiro estabelece as bases para estratégias avançadas de teoria dos jogos, das quais as populares incluem:
- Battle of the Sexes Payoff Matrix
A teoria dos jogos, o estudo da tomada de decisão estratégica, reúne disciplinas distintas, como matemática, psicologia e filosofia. A teoria do jogo foi inventada por John von Neumann e Oskar Morgenstern em 1944 e percorreu um longo caminho desde então. A importância da teoria dos jogos para a análise e a tomada de decisões modernas pode ser avaliada pelo fato de que, desde 1970, até 12 economistas e cientistas líderes receberam o Prêmio Nobel de Ciências Econômicas por suas contribuições para a teoria dos jogos.
A teoria dos jogos é aplicada em vários campos, incluindo negócios, finanças, economia, ciências políticas e psicologia. Compreender as estratégias da teoria do jogo - tanto as populares quanto algumas das estratagemas relativamente menos conhecidas - é importante para aprimorar as habilidades de raciocínio e tomada de decisão em um mundo complexo.
Dilema do Prisioneiro - Em poucas palavras
Uma das estratégias de teoria dos jogos mais populares e básicas é o Dilema do Prisioneiro. Este conceito explora a estratégia de tomada de decisão tomada por dois indivíduos que, ao agir em seu próprio interesse individual, acabam com piores resultados do que se cooperassem um com o outro em primeiro lugar.
No Dilema do Prisioneiro, dois suspeitos que foram apreendidos por um crime são ocupados em salas separadas e não podem se comunicar entre si. O promotor informa cada um deles individualmente que, se ele (o chamar de Suspeito 1) confessa e testemunha contra o outro, ele pode sair livre, mas se ele não cooperar e o Suspeito 2, o Suspeito 1 será condenado a três anos de prisão. Se ambos confessarem, receberão uma sentença de dois anos e, se não confessarem, serão condenados a um ano de prisão.
Enquanto a cooperação é a melhor estratégia para os dois suspeitos, quando confrontados com tal dilema, a pesquisa mostra que a maioria das pessoas racionais prefere confessar e testemunhar contra a outra pessoa em vez de ficar em silêncio e aproveitar a chance que a outra parte confessa.Estratégias de teoria do jogo
O Dilema do Prisioneiro estabelece as bases para estratégias avançadas de teoria dos jogos, das quais as populares incluem:
Matching Pennies
: Este é um jogo de soma zero que envolve dois jogadores (chame-os Jogador A e Jogador B) colocando simultaneamente um centavo na mesa, com a recompensa, dependendo se os centavos coincidem. Se ambos os centavos são cabeças ou caudas, o Jogador A ganha e mantém o centavo do Jogador B. Se eles não combinarem, o jogador B ganha e mantém o centavo do jogador A. Deadlock
: Este é um cenário de dilema social como o Dilema do Prisioneiro em que dois jogadores podem cooperar ou defeito (i.e. não cooperar). No Deadlock, se o Jogador A e o Jogador B cooperarem, cada um recebe uma recompensa de 1, e se ambos os defeitos, cada um recebe uma recompensa de 2. Mas se o Jogador A cooperar e os defeitos do Jogador B, então A recebe uma recompensa de 0 e B obtém uma recompensa de 3. No diagrama de pagamento abaixo, o primeiro numeral nas células (a) a (d) representa a recompensa do Jogador A e o segundo numero é o do Jogador B: Deadlock Payoff Matrix < Jogador B
Cooperar |
Defeito | ||
Jogador A |
Cooperar | ||
(a) 1, 1 |
(b) 0, 3 |
Defeito |
(c) 3 , 0 |
(d) 2, 2 |
O Deadlock difere do Dilema do Prisioneiro, na medida em que a ação de maior benefício mútuo (ou seja, ambos os defeitos) também é a estratégia dominante. Uma estratégia dominante para um jogador é definida como uma que produz o melhor retorno de qualquer estratégia disponível, independentemente das estratégias empregadas pelos outros jogadores. |
Um exemplo comummente citado de Deadlock é o de duas potências nucleares tentando chegar a um acordo para eliminar seus arsenais de bombas nucleares. Neste caso, a cooperação implica aderir ao acordo, enquanto a deserção significa secretamente a renúncia ao acordo e a manutenção do arsenal nuclear. O melhor resultado para qualquer nação, infelizmente, é renegar o acordo e reter a opção nuclear, enquanto a outra nação elimina seu arsenal, uma vez que isso dará ao primeiro uma enorme vantagem oculta sobre o último se a guerra já tiver ocorrido entre os dois. A segunda melhor opção é tanto para defeito quanto para não cooperar, pois isso mantém seu status como poderes nucleares. |
Competição Cournot
: Este modelo também é conceitualmente semelhante ao Dilema do Prisioneiro e é nomeado em homenagem ao matemático francês Augustin Cournot, que o apresentou em 1838. A aplicação mais comum do modelo Cournot é descrever um duopólio ou dois principais produtores em um mercado.
Por exemplo, assumir que duas empresas A e B produzem um produto idêntico e podem produzir quantidades altas ou baixas. Se ambos cooperarem e concordam em produzir em níveis baixos, a oferta limitada se traduzirá em um alto preço para o produto no mercado e lucros substanciais para ambas as empresas. Por outro lado, se eles defeituam e produzam em níveis elevados, o mercado será inundado e resultará em um preço baixo para o produto e, consequentemente, menor lucro. Mas se alguém coopera (i. E. Produz em níveis baixos) e os outros defeitos (isto é, subrepticiamente produzem em níveis elevados), então o primeiro apenas se rompe, enquanto o último ganha um lucro maior que se ambos cooperassem. A matriz de pagamento para as empresas A e B é mostrada (os números representam lucro em milhões de dólares). Assim, se A cooperar e produzir em níveis baixos enquanto B defeitos e produz em níveis elevados, a remuneração é conforme mostrado na célula (b) - break-even para a empresa A e $ 7 milhões em lucros para a empresa B.
Cournot Payoff Matriz
Empresa B
Cooperar |
Defeito | ||
Empresa A |
Cooperar | ||
(a) 4, 4 |
(b) 0, 7 |
Defeito |
(c ) 7, 0 |
(d) 2, 2 |
Coordenação |
: em coordenação, os jogadores ganham maiores retornos quando selecionam o mesmo curso de ação. |
Como exemplo, considere dois gigantes da tecnologia que estão decidindo entre a introdução de uma nova tecnologia radical em chips de memória que poderia ganhar-lhes centenas de milhões de lucros, ou uma versão revisada de uma tecnologia mais antiga que os ganharia muito menos. Se apenas uma empresa decidir seguir adiante com a nova tecnologia, a adoção do mercado pelos consumidores seria significativamente menor e, como resultado, ganharia menos do que se ambas as empresas decidissem o mesmo curso de ação. A matriz de pagamento é mostrada abaixo (os números representam lucro em milhões de dólares). Assim, se ambas as empresas decidirem introduzir a nova tecnologia, ganhariam US $ 600 milhões cada, enquanto a introdução de uma versão revisada da tecnologia anterior ganharia US $ 300 milhões cada, como mostrado na célula (d). Mas, se a Empresa A decidir sozinha introduzir a nova tecnologia, ela só ganharia US $ 150 milhões, mesmo que a Companhia B ganhasse $ 0 (presumivelmente porque os consumidores talvez não estejam dispostos a pagar pela sua tecnologia agora obsoleta). Neste caso, faz sentido que ambas as empresas trabalhem juntas e não por conta própria.
Matriz de remuneração de coordenação
Empresa B
Nova tecnologia |
Tecnologia antiga | ||
Empresa A |
Nova tecnologia | ||
(a) 600, 600 |
(b) 0, 150 < Tecnologia antiga |
(c) 150, 0 |
(d) 300, 300 |
Jogo Centipede |
: Este é um jogo extenso em que dois jogadores alternadamente têm a chance de levar o maior parte de um esconderijo de dinheiro que aumenta lentamente. O jogo Centipede é sequencial, uma vez que os jogadores fazem seus movimentos um após o outro, em vez de simultaneamente; Cada jogador também conhece as estratégias escolhidas pelos jogadores que jogaram antes delas. O jogo conclui assim que um jogador leva o esconderijo, com esse jogador recebendo a porção maior e o outro jogador recebendo a porção menor. |
Por exemplo, se o Jogador A e o Jogador B estiverem jogando o jogo Centipede, assumir que o Jogador A vai primeiro e tem que decidir se ele deveria "Pegar" ou "Passar" o esconderijo, que atualmente equivale a US $ 2. Se ele tomar, então, A e B recebem $ 1 cada, mas se A passa, a decisão de "Pegar ou Passar" agora deve ser feita pelo Jogador B. Se B demorar, ela recebe $ 3 (ou seja, o estoque anterior de US $ 2 + $ 1 ) e A obtém $ 0. Mas se B passa, A agora consegue decidir se deve pegar ou passar, e assim por diante. Se ambos os jogadores sempre optarem por passar, cada um recebe uma recompensa de US $ 100 no final do jogo. |
O ponto do jogo é que, se A e B cooperam e "passam" até o final do jogo, obtêm o máximo de $ 100 cada. Mas se eles desconfiam do outro jogador e esperam que eles "levem" na primeira oportunidade, então o equilíbrio de Nash prevê que os jogadores terão a menor reivindicação possível (US $ 1 nesse caso). Estudos experimentais mostraram, no entanto, que esse comportamento "racional" (como previsto pela teoria do jogo) raramente é exibido na vida real. Isso não é intuitivamente surpreendente, dado o pequeno tamanho da recompensa inicial em relação ao final. O comportamento semelhante por sujeitos experimentais também foi exibido no Dilema do viajante. Dilema do viajante
: Este é um jogo de soma não-zero em que ambos os jogadores tentam maximizar sua própria recompensa, independentemente da outra. Concebido pelo economista Kaushik Basu em 1994, no Traveller's Dilemma, uma companhia aérea concorda em pagar dois viajantes de indemnização por danos a itens idênticos. No entanto, os dois viajantes são necessários separadamente para estimar o valor do item, com um mínimo de US $ 2 e um máximo de US $ 100. Se ambos escreverem o mesmo valor, a companhia aérea reembolsará cada um desses valores. Mas se os valores diferirem, a companhia aérea pagará o valor mais baixo, com um bônus de US $ 2 para o viajante que escreveu esse valor mais baixo e uma penalidade de US $ 2 para o viajante que escreveu o valor mais alto.
O nível de equilíbrio de Nash, com base na indução atrasada, é de US $ 2 neste cenário. Mas, como no jogo Centipede, experiências laboratoriais demonstram consistentemente que a maioria dos participantes - nativamente ou de outra forma - escolhe um número muito superior a US $ 2.
O dilema do viajante pode ser aplicado para analisar uma variedade de situações da vida real. O processo de indução retroactiva, por exemplo, pode ajudar a explicar como duas empresas envolvidas em competição de hackers podem reduzir os preços dos produtos de forma constante em uma tentativa de ganhar participação de mercado, o que pode resultar em incorrer em perdas cada vez maiores no processo. Estratégias de Teoria do Jogo Adicional
Batalha dos Sexos
: Esta é outra forma do jogo de coordenação descrito anteriormente, mas com algumas assimetrias de recompensa. Isso envolve basicamente um casal tentando coordenar sua noite. Enquanto eles concordaram em se encontrar no jogo de bola (a preferência do homem) ou em uma peça de teatro (a preferência da mulher), eles esqueceram o que decidiram, e para agravar o problema, não podem se comunicar entre si. Onde eles deveriam ir? A matriz de recompensa é como mostrado - os números nas células representam o grau relativo de prazer do evento para a mulher e o homem, respectivamente. Por exemplo, a célula (a) representa a recompensa (em termos de níveis de prazer) para a mulher e o homem, respectivamente, na peça (ela gosta muito mais do que ele). Celda (d) é a recompensa se ambos chegarem ao jogo de bola (ele gosta mais do que ela). A célula (c) representa a insatisfação se ambos não são apenas para o local errado, mas também para o evento que eles gostam menos - a mulher para o jogo de bola eo homem para a peça.
Battle of the Sexes Payoff Matrix
Homem Jogue
Jogo de bola |
Mulher | ||
Jogue |
(a) 6, 3 | ||
(b) 2, 2 > Jogo de bola |
(c) 0, 0 |
(d) 3, 6 |
Jogo Dictador |
: Este é um jogo simples no qual o Jogador A deve decidir como dividir um prêmio em dinheiro com o Jogador B , que não tem entrada na decisão do Jogador A. Embora esta não seja uma estratégia de teoria do jogo |
per se |
, fornece algumas informações interessantes sobre o comportamento das pessoas. As experiências revelam que cerca de 50% mantêm todo o dinheiro para si mesmos; 5% dividiu-o igualmente, e os outros 45% dão ao outro participante uma parcela menor. O jogo do ditador está intimamente relacionado ao jogo do ultimato, no qual o Jogador A recebe uma quantidade fixa de dinheiro, parte do qual deve ser dada ao Jogador B, que pode aceitar ou rejeitar o valor fornecido.A captura é que se o segundo jogador rejeitar o valor oferecido, tanto A como B não obtêm nada. Os jogos do ditador e do ultimato oferecem leituras importantes para questões como doações de caridade e filantropia. |
Peace-War : uma variação do dilema do Prisioneiro em que as decisões "Cooperar ou Defeito" são substituídas por "Paz ou Guerra". "Uma analogia poderia ser duas empresas envolvidas em uma guerra de preços. Se ambos se abstiverem de reduzir os preços, eles desfrutam de uma relativa prosperidade (célula a), mas a guerra de preços reduziria dramaticamente os desembolsos (célula d). No entanto, se A se engajar no corte de preços (guerra), mas B não, A teria um retorno maior de 4, uma vez que ele poderia capturar uma participação de mercado substancial, e esse maior volume compensaria os menores preços dos produtos. Peace-War Payoff Matrix Empresa B
Paz Guerra
Empresa A |
Paz | ||
(a) 3, 3 |
(b) 0, 4 > Guerra | ||
(c) 4, 0 |
(d) 1, 1 |
Dilema do voluntário |
: no dilema de um voluntário, alguém deve empreender uma tarefa ou trabalho para o bem comum. O pior resultado possível é realizado se ninguém for voluntário. Por exemplo, considere uma empresa onde a fraude contábil é desenfreada, mas a alta administração não tem conhecimento disso. Alguns funcionários júnior no departamento de contabilidade estão conscientes da fraude, mas hesitam em contar com a alta administração, porque resultaria em funcionários envolvidos na fraude sendo demitidos e provavelmente processados. Ser rotulado como um "denunciante" também pode ter algumas repercussões na linha. Mas, se ninguém for voluntário, a fraude em grande escala pode resultar em falência eventual da empresa e na perda de empregos de todos. |
A linha inferior |
A teoria dos jogos pode ser usada de forma muito eficaz como uma ferramenta para a tomada de decisões, seja em uma configuração econômica, comercial ou pessoal. |
Os Fundamentos da Teoria do JogoDividem e examinam as possíveis consequências de cenários econômicos / financeiros. O que o índice de caixa de uma empresa mede e como isso afeta a tomada de decisão?Aprenda o que o índice de caixa de uma empresa mede e compreenda por que é um importante índice de liquidez para uma empresa usar em sua tomada de decisão. Por que os custos irrecuperáveis devem ser ignorados na tomada de decisão futura?Aprenda sobre custos irrecuperáveis, porque os custos irrecuperáveis devem ser ignorados no processo de tomada de decisão e por que os custos futuros devem ser considerados ao tomar decisões. |