Jak strategia teorii gier poprawia podejmowanie decyzji - KamilTaylan.blog
4 maja 2021 13:49

Jak strategia teorii gier poprawia podejmowanie decyzji

Teoria gier, nauka o podejmowaniu decyzji strategicznych, łączy różne dyscypliny, takie jak matematyka, psychologia i filozofia. Teoria gier została wymyślona przez Johna von Neumanna i Oskara Morgensterna w 1944 roku i od tego czasu przeszła długą drogę. O znaczeniu teorii gier dla współczesnej analizy i podejmowania decyzji świadczy fakt, że od 1970 roku aż 12 czołowych ekonomistów i naukowców otrzymało Nagrodę Nobla w dziedzinie nauk ekonomicznych za wkład w teorię gier.

Teoria gier jest stosowana w wielu dziedzinach, w tym w biznesie, finansach, ekonomii, politologii i psychologii. Zrozumienie strategii teorii gier – zarówno tych popularnych, jak i niektórych stosunkowo mniej znanych fortel – jest ważne dla poprawy umiejętności rozumowania i podejmowania decyzji w złożonym świecie.

Kluczowe wnioski

  • Teoria gier to ramy dla zrozumienia możliwości wyboru w sytuacjach wśród konkurujących ze sobą graczy.
  • Teoria gier może pomóc graczom w podejmowaniu optymalnych decyzji w konfrontacji z niezależnymi i konkurującymi ze sobą aktorami w strategicznym otoczeniu.
  • Powszechną formą „gry”, która pojawia się w sytuacjach ekonomicznych i biznesowych, jest dylemat więźnia, w którym indywidualni decydenci zawsze mają motywację do wyboru w sposób, który tworzy mniej niż optymalny wynik dla jednostek jako grupy.
  • Istnieje kilka innych form gier. Praktyczne zastosowanie tych gier może być cennym narzędziem wspomagającym analizę branż, sektorów, rynków i wszelkich strategicznych interakcji między dwoma lub więcej podmiotami.

Dylemat więźnia

Jedną z najpopularniejszych i podstawowych strategii teorii gier jest dylemat więźnia. Koncepcja ta bada strategię decyzyjną przyjętą przez dwie osoby, które działając we własnym interesie, osiągają gorsze wyniki, niż gdyby w pierwszej kolejności współpracowały ze sobą.

W dylemacie więźnia dwóch podejrzanych zatrzymanych za przestępstwo jest przetrzymywanych w oddzielnych pomieszczeniach i nie mogą się ze sobą porozumiewać. Prokurator informuje indywidualnie zarówno podejrzanego 1, jak i podejrzanego 2, że jeśli przyzna się i zezna przeciw drugiemu, może wyjść na wolność, ale jeśli nie będzie współpracował, a drugi podejrzany, zostanie skazany na trzy lata więzienia. Jeśli oboje przyznają się, dostaną dwa lata więzienia, a jeśli żadna z nich się nie przyzna, zostanie skazana na rok więzienia.

Chociaż współpraca jest najlepszą strategią dla dwóch podejrzanych, w obliczu takiego dylematu badania pokazują, że większość racjonalnych ludzi woli spowiadać się i zeznawać przeciwko drugiej osobie, niż milczeć i zaryzykować wyznanie drugiej strony.



Zakłada się, że gracze w grze są racjonalni i będą dążyć do maksymalizacji swoich wypłat w grze.

Dylemat więźnia kładzie podwaliny pod zaawansowane strategie teorii gier, wśród których do popularnych należą:

Pasujące monety

Jest to gra o sumie zerowej, w której bierze udział dwóch graczy (nazywają ich Gracz A i Gracz B) jednocześnie umieszczając grosz na stole, a wypłata zależy od tego, czy te grosze się zgadzają. Jeśli oba pensy to orły lub reszki, gracz A wygrywa i zatrzymuje grosz gracza B. Jeśli nie pasują, gracz B wygrywa i zatrzymuje grosz gracza A.

Impas

Jest to scenariusz dylematu społecznego, taki jak dylemat więźnia, polegający na tym, że dwóch graczy może współpracować lub zdradzać (tj. Nie współpracować). W przypadku impasu, jeśli zarówno gracz A, jak i gracz B współpracują, obaj otrzymują wypłatę w wysokości 1, a jeśli obaj zdradzą, każdy z nich otrzymuje wypłatę w wysokości 2. Ale jeśli gracz A współpracuje, a gracz B przegrywa, wówczas A otrzymuje wypłatę 0, a B otrzymuje wypłatę w wysokości 3. Na poniższym diagramie wypłat pierwsza cyfra w komórkach od (a) do (d) reprezentuje wypłatę gracza A, a druga cyfra oznacza wypłatę gracza B:

Impas różni się od dylematu więźnia tym, że dominującą strategią jest również działanie przynoszące największe obopólne korzyści (tj. Obie wady). Strategia dominująca dla gracza jest definiowana jako taka, która zapewnia najwyższą wypłatę ze wszystkich dostępnych strategii, niezależnie od strategii stosowanych przez innych graczy.

Często przytaczanym przykładem impasu są dwie potęgi atomowe, które próbują dojść do porozumienia w celu wyeliminowania ich arsenałów bomb atomowych. W tym przypadku współpraca oznacza dotrzymanie umowy, a dezercja oznacza potajemne odstąpienie od umowy i zachowanie arsenału nuklearnego. Niestety najlepszym rezultatem dla obu krajów jest odstąpienie od umowy i utrzymanie opcji nuklearnej, podczas gdy drugi naród wyeliminuje swój arsenał, ponieważ da to temu pierwszemu ogromną ukrytą przewagę nad drugim, jeśli kiedykolwiek wybuchnie między nimi wojna. Drugą najlepszą opcją jest brak współpracy lub brak współpracy, ponieważ zachowuje to status potęg jądrowych.

Zawody Cournota

Model ten jest również koncepcyjnie podobny do dylematu więźnia i został nazwany na cześć francuskiego matematyka Augustina Cournota, który wprowadził go w 1838 r. Najczęstszym zastosowaniem modelu Cournota jest opisanie duopolu lub dwóch głównych producentów na rynku.

Na przykład załóżmy, że firmy A i B produkują identyczny produkt i mogą wytwarzać duże lub małe ilości. Jeśli obaj będą współpracować i zgodzić się na produkcję na niskich poziomach, to ograniczona podaż przełoży się na wysoką cenę produktu na rynku i znaczne zyski dla obu firm. Z drugiej strony, jeśli wadliwe są i produkują na wysokim poziomie, rynek zostanie zalany, co spowoduje niską cenę produktu, a co za tym idzie, niższe zyski dla obu. Ale jeśli jeden współpracuje (tj. Produkuje na niskim poziomie), a inne wady (tj. Potajemnie produkuje na wysokim poziomie), to ten pierwszy po prostu wychodzi na zero, podczas gdy drugi osiąga większy zysk, niż gdyby obaj współpracowali.

Przedstawiono macierz wypłat dla firm A i B (liczby przedstawiają zysk w milionach dolarów). Tak więc, jeśli A współpracuje i produkuje na niskich poziomach, podczas gdy B jest wadliwy i produkuje na wysokich poziomach, wypłata jest taka, jak pokazano w komórce (b) – prowizja-rentowność dla firmy A i 7 milionów dolarów zysku dla firmy B.

Gra koordynacyjna

W koordynacji gracze zarabiają więcej, gdy wybierają ten sam sposób działania.

Jako przykład weźmy dwóch gigantów technologicznych, którzy decydują się na wprowadzenie radykalnej nowej technologii w układach pamięci, która mogłaby przynieść im setki milionów zysków, lub poprawioną wersję starszej technologii, która przyniosłaby im znacznie mniejsze zyski. Gdyby tylko jedna firma zdecydowała się na nową technologię, tempo jej przyjęcia przez konsumentów byłoby znacznie niższe, a co za tym idzie, zarabiałaby mniej, niż gdyby obie firmy zdecydowały się na ten sam kierunek działania. Macierz wypłat pokazano poniżej (liczby przedstawiają zysk w milionach dolarów).

Tak więc, gdyby obie firmy zdecydowały się na wprowadzenie nowej technologii, zarabiałyby 600 milionów dolarów na sztukę, podczas gdy wprowadzenie poprawionej wersji starszej technologii przyniosłoby im 300 milionów dolarów każda, jak pokazano w komórce (d). Ale gdyby firma A zdecydowała się samodzielnie wprowadzić nową technologię, zarobiłaby tylko 150 milionów dolarów, mimo że firma B zarobiłaby 0 dolarów (prawdopodobnie dlatego, że konsumenci mogą nie chcieć płacić za jej przestarzałą technologię). W takim przypadku sensowna jest współpraca obu firm, a nie samodzielna praca.

Centipede Game

Jest to rozbudowana gra, w której dwóch graczy na przemian ma szansę wziąć większą część powoli rosnącej puli pieniędzy. Gry stonoga jest sekwencyjne ponieważ gracze wykonują swoje ruchy jeden po drugim, a nie jednocześnie; każdy gracz zna również strategie wybrane przez graczy, którzy grali przed nim. Gra kończy się, gdy tylko gracz zabierze skrytkę, przy czym ten gracz otrzymuje większą część, a drugi gracz mniejszą.

Na przykład załóżmy, że gracz A idzie pierwszy i musi zdecydować, czy powinien „wziąć”, czy „przekazać” skrytkę, która obecnie wynosi 2 $. Jeśli wybierze, to A i B dostają po 1 $, ale jeśli A pasuje, decyzja o podjęciu lub spasowaniu musi teraz zostać podjęta przez gracza B. Jeśli B bierze, otrzymuje 3 $ (tj. Poprzednia skrytka 2 $ + 1 $) i A dostaje 0 $. Ale jeśli B spasuje, A teraz decyduje, czy wziąć, czy spasować, i tak dalej. Jeśli obaj gracze zawsze zdecydują się spasować, na koniec gry każdy z nich otrzyma wypłatę w wysokości 100 $.

Celem gry jest to, że jeśli A i B zarówno współpracują, jak i kontynuują spasowanie do końca gry, otrzymają maksymalną wypłatę w wysokości 100 $ za sztukę. Ale jeśli nie ufają drugiemu graczowi i oczekują, że „skorzystają” przy pierwszej okazji,  równowaga Nasha przewiduje, że gracze otrzymają najniższe możliwe roszczenie (w tym przypadku 1 $). Badania eksperymentalne wykazały jednak, że to „racjonalne” zachowanie (zgodnie z przewidywaniami teorii gier) rzadko pojawia się w prawdziwym życiu. Nie jest to intuicyjnie zaskakujące, biorąc pod uwagę niewielki rozmiar początkowej wypłaty w stosunku do ostatniej. Podobne zachowanie badanych eksperymentalnych zostało również wykazane w dylemacie podróżnika.

Dylemat podróżnika

Ta gra o sumie niezerowej, w której obaj gracze próbują zmaksymalizować swoją wypłatę bez względu na innych, została wymyślona przez ekonomistę Kaushika Basu w 1994 roku. Na przykład w dylemacie podróżnika linia lotnicza zgadza się wypłacić dwóm podróżnym odszkodowanie za uszkodzenia identycznych przedmiotów. Jednak dwaj podróżni są oddzielnie zobowiązani do oszacowania wartości przedmiotu, przy minimum 2 USD i maksymalnie 100 USD. Jeśli obaj zapiszą tę samą wartość, linia lotnicza zwróci każdemu z nich tę kwotę. Ale jeśli wartości się różnią, linia lotnicza zapłaci im niższą wartość, z premią w wysokości 2 USD dla podróżnego, który zapisał tę niższą wartość i karą w wysokości 2 USD dla podróżnego, który zapisał wyższą wartość.

Poziom równowagi Nasha, oparty na indukcji wstecznej, wynosi w tym scenariuszu 2 dolary. Ale podobnie jak w grze w stonogi, eksperymenty laboratoryjne konsekwentnie pokazują, że większość uczestników, naiwnie lub w inny sposób, wybiera liczbę znacznie wyższą niż 2 dolary.

Dylemat podróżnika można zastosować do analizy różnych sytuacji z życia wziętych. Na przykład proces indukcji wstecznej może pomóc wyjaśnić, w jaki sposób dwie firmy zaangażowane w bezwzględną konkurencję mogą systematycznie obniżać ceny produktów, starając się zdobyć udział w rynku, co może skutkować coraz większymi stratami w tym procesie.

Wojna płci

To kolejna forma gry koordynacyjnej opisana wcześniej, ale z pewnymi asymetriami wypłat. Zasadniczo polega na tym, że para próbuje skoordynować swój wieczór. Chociaż zgodzili się spotkać podczas gry w piłkę (preferencje mężczyzny) lub gry (preferencje kobiety), zapomnieli, o czym zdecydowali, a co za tym idzie, problem nie może się ze sobą porozumiewać. Gdzie powinni się udać? Macierz wypłat jest pokazana poniżej z liczbami w komórkach reprezentującymi względny stopień zadowolenia z wydarzenia odpowiednio dla kobiety i mężczyzny. Na przykład komórka (a) reprezentuje wypłatę (w kategoriach poziomów przyjemności) dla kobiety i mężczyzny podczas zabawy (ona lubi ją o wiele bardziej niż on). Cell (d) jest wypłatą, jeśli oboje dojdą do gry w piłkę (on lubi to bardziej niż ona). Komórka (c) reprezentuje niezadowolenie, jeśli oboje udają się nie tylko w niewłaściwe miejsce, ale także na wydarzenie, które lubią najmniej – kobieta na mecz piłki, a mężczyzna na grę.

Gra dyktatora

Jest to prosta gra, w której gracz A musi zdecydować, jak podzielić nagrodę pieniężną z graczem B, który nie ma wpływu na decyzję gracza A. Chociaż nie jest to strategia oparta na teorii gier, dostarcza pewnych interesujących informacji na temat zachowań ludzi. Eksperymenty pokazują, że około 50% zatrzymuje wszystkie pieniądze dla siebie, 5% dzieli je po równo, a pozostałe 45% daje drugiemu uczestnikowi mniejszy udział. Gra dyktatora jest ściśle związana z grą ultimatum, w której Gracz A otrzymuje określoną kwotę pieniędzy, której część musi zostać przekazana Graczowi B, który może przyjąć lub odrzucić daną kwotę. Problem polega na tym, że jeśli drugi gracz odrzuci oferowaną kwotę, zarówno A, jak i B nic nie otrzymują. Gry dyktatora i ultimatum zawierają ważne lekcje dotyczące takich kwestii, jak darowizny na cele charytatywne i filantropia.

Wojna pokojowa

Jest to wariacja na temat dylematu więźnia, w którym decyzje „współpracować lub brakować” są zastępowane przez „pokój lub wojna”. Analogią mogą być dwie firmy wojna cenowa dramatycznie zmniejszyłaby zyski (komórka d). Jeśli jednak A angażuje się w obniżanie cen (tj. „Wojnę”), a B tego nie robi, A miałby wyższą wypłatę w wysokości 4, ponieważ może być w stanie zdobyć znaczny udział w rynku, a ten większy wolumen zrównoważyłby niższe ceny produktów.

Dylemat wolontariusza

W dylemacie wolontariusza ktoś musi podjąć się jakiegoś zadania lub pracy dla wspólnego dobra. Najgorszy możliwy wynik osiąga się, jeśli nikt nie zgłosi się na ochotnika. Na przykład weźmy pod uwagę firmę, w której szerzą się oszustwa księgowe, ale najwyższe kierownictwo nie jest tego świadome. Niektórzy młodsi pracownicy działu księgowości są świadomi oszustwa, ale wahają się powiedzieć o tym najwyższemu kierownictwu, ponieważ spowodowałoby to zwolnienie pracowników zaangażowanych w oszustwo i prawdopodobnie postawienie ich w stan oskarżenia.

Etykietowanie jako informator  może mieć również pewne konsekwencje. Ale jeśli nikt nie zgłosi się na ochotnika, oszustwo na dużą skalę może doprowadzić do ostatecznego bankructwa firmy i utraty wszystkich miejsc pracy.

Często Zadawane Pytania

Jakie „gry” są rozgrywane w teorii gier?

Nazywa się to teorią gier, ponieważ stara się ona zrozumieć strategiczne działania dwóch lub więcej „graczy” w danej sytuacji, zawierającą ustalone zasady i wyniki. Teoria gier, stosowana w wielu dyscyplinach, jest przede wszystkim wykorzystywana jako narzędzie w badaniach nad biznesem i ekonomią. „Gry” mogą więc dotyczyć tego, jak dwie konkurencyjne firmy zareagują na obniżki cen przez drugą, jeśli firma przejmie inną, lub jak handlowcy na giełdzie mogą zareagować na zmiany cen. Teoretycznie gry te  można sklasyfikować  jako podobne do dylematów więźnia, gry z dyktatorem, jastrzębia i gołębia oraz walki płci, a także kilku innych odmian.

Czego uczy nas dylemat więźnia?

Dylemat więźnia pokazuje, że prosta współpraca nie zawsze leży w jego najlepszym interesie. W rzeczywistości przy zakupie przedmiotu o dużej wartości, takiego jak samochód, negocjacje są preferowanym sposobem działania z punktu widzenia konsumentów. W przeciwnym razie dealer samochodowy może przyjąć politykę braku elastyczności w negocjacjach cenowych, maksymalizując swoje zyski, ale skutkującą przepłacaniem przez konsumentów za swoje pojazdy. Zrozumienie relatywnych korzyści wynikających ze współpracy i defektów może zachęcić Cię do podjęcia ważnych  negocjacji cenowych  przed dokonaniem dużego zakupu.

Co to jest równowaga Nasha w teorii gier?

Równowaga Nasha w teorii gier to sytuacja, w której gracz będzie kontynuował obraną strategię, nie mając motywacji do odejścia od niej, po uwzględnieniu strategii przeciwnika.

W jaki sposób firmy mogą wykorzystywać teorię gier, gdy ze sobą konkurują?

Na przykład konkurencja Cournota to model ekonomiczny opisujący strukturę branży, w której konkurencyjne firmy oferujące identyczny produkt konkurują niezależnie i w tym samym czasie pod względem wielkości produkcji. W rzeczywistości jest to gra z dylematem więźnia.

Podsumowanie

Teoria gier może być bardzo skutecznie wykorzystywana jako narzędzie do podejmowania decyzji, czy to w kontekście kontradyktoryjnym, biznesowym, czy osobistym.