Teoria gry: więcej niż podstawy - KamilTaylan.blog
4 maja 2021 19:45

Teoria gry: więcej niż podstawy

Korzystając z teorii gier, można przedstawić rzeczywiste scenariusze takich sytuacji, jak konkurencja cenowa i premiery produktów (i wiele innych), a także przewidzieć ich wyniki. Firmy, które używają (i trzymają się) tego urządzenia do określania równowagi Nasha, widzą ogromną korzyść w swoich strategiach budżetowych. (Zobacz też:  Podstawy teorii gier ).

Czyja to kolej?

Podczas gdy gry sekwencyjne są rozgrywane po kolei, gry jednoczesne są rozgrywane, a każdy gracz podejmuje decyzję w tym samym czasie. W przypadku gier symultanicznych nie używamy już powszechnej, wprowadzającej metody indukcji wstecznej. Zwolennicy teorii gier często zestawiają różne wyniki w tak zwanej macierzy (poniżej).

Ta macierz jest nazywana formą normalną. Wybory gracza są pokazane na lewej osi pionowej, a wybory gracza drugiego są pokazane na górnej osi poziomej. Wypłaty dla każdego gracza znajdują się na odpowiednich skrzyżowaniach i są wyświetlane w następujący sposób (gracz pierwszy, gracz drugi).

Równowaga Nasha

Równowaga Nasha to wynik osiągnięty, który raz osiągnięty oznacza, że ​​żaden gracz nie może zwiększyć wypłaty poprzez jednostronną zmianę decyzji. Można to również traktować jako „bez żalu” w tym sensie, że po podjęciu decyzji gracz nie będzie żałował decyzji uwzględniających konsekwencje.

W większości przypadków równowaga Nasha jest osiągana z upływem czasu. Jednak gdy zostanie osiągnięta równowaga Nasha, nie będzie od niej odchylana. Kiedy nauczymy się, jak znaleźć równowagę Nasha, przyjrzyj się, jak jednostronny ruch wpłynąłby na sytuację. Czy to ma jakiś sens? Nie powinno i dlatego równowagę Nasha określa się jako „nie żałuję”.

Znajdowanie równowag Nasha

Krok pierwszy: Określ najlepszą reakcję gracza na działania drugiego gracza. Analizując wybory, które mogą zmaksymalizować wypłatę gracza, musimy przyjrzeć się, w jaki sposób gracz powinien zareagować na każdą z opcji, które ma drugi gracz. Łatwym sposobem na wizualne zrobienie tego jest ukrycie wyborów drugiego gracza. Rozważmy macierz przedstawioną na początku tego artykułu, gdy stosujemy tę metodę.

Gracz pierwszy ma dwie możliwości gry: „w górę” lub „w dół”. Gracz drugi ma również dwie możliwości gry: „w lewo” lub „w prawo”. Na tym etapie określania równowagi Nasha przyglądamy się reakcjom na działania drugiego gracza. Jeśli gracz dwa zdecyduje się grać „lewy”, możemy grać „w górę” z wypłatą 1 lub grać „w dół” z wypłatą 3. Ponieważ 3 jest większe niż 1, pogrubimy 3 wskazując opcję gry „Tu na dole.

Jeśli drugi gracz zdecyduje się grać „dobrze”, możemy wybrać grę „w górę”, aby uzyskać wypłatę 4, lub grać „w dół”, aby uzyskać wypłatę 3. Ponieważ 4 jest większe niż 3, pogrubiliśmy 4, aby wskazać opcję aby zagrać „w górę” tutaj. Pogrubione wyniki przedstawiono poniżej na pełnej macierzy.

Krok drugi: Określ najlepszą reakcję gracza drugiego na jego działania. Tak jak to zrobiliśmy wcześniej z wypłatami gracza dwa dla gracza pierwszego, podczas określania najlepszych odpowiedzi dla gracza drugiego ukryjemy wypłaty dla gracza pierwszego. (Zobacz także:  Wiodące wskaźniki finansów behawioralnych ).

Podobnie jak w przypadku pierwszego gracza, każdy gracz ma do wyboru dwie opcje. Jeśli gracz zdecyduje się grać „w górę”, możemy grać „w lewo” z wypłatą 3 lub „w prawo” z wypłatą 2. Ponieważ 3 jest większe niż 2, pogrubiliśmy 3, aby pokazać opcję odtwórz „w lewo” tutaj. Jeśli gracz zdecyduje się grać „w dół”, możemy grać „w lewo” z wypłatą 2 lub „w prawo” za wypłatę 1. Ponieważ 2 jest większe niż 1, pogrubiliśmy 2 wskazując opcję gry „w lewo” tutaj. Pogrubione wyniki przedstawiono poniżej na pełnej macierzy.

Krok trzeci: Określ, które wyniki mają oba wypłaty pogrubione. Tym konkretnym wynikiem jest równowaga Nasha. Teraz łączymy odważne opcje dla obu graczy na pełnej matrycy.

Poszukaj skrzyżowań, na których obie wypłaty są pogrubione. W tym przypadku stwierdzimy, że przecięcie (w dół, w lewo) z wypłatą (3, 2) spełnia nasze kryteria. Wskazuje to na naszą równowagę Nasha.

Ta metoda znajdowania równowagi Nasha dobrze nadaje się do znajdowania równowagi w grach, które są symultaniczne, ponieważ patrzymy na to, jak zareagowałby gracz niezależnie od tego, jak zachowuje się drugi. Ten scenariusz jednoczesnej gry często rozgrywa się w firmach takich jak linie lotnicze. Poniżej znajduje się przykład podobny do powyższej gry, jak mogą wyglądać ceny linii lotniczych. Wypłaty są w tysiącach dolarów. Pamiętaj, że to są wypłaty, a nie ceny. Metoda, którą zastosowaliśmy wcześniej, została już zastosowana, aby pokazać, gdzie pojawia się równowaga Nasha.

Patrząc tylko na A1, widzimy, że jeśli A2 zdecyduje się grać niską ceną, wybieramy między niską ceną za 3000 a wysoką ceną za 2000. Wybieramy niski, bo 3000> 2000. Robimy to samo dla A2 grającego wysoką cenę i widzimy, że gramy nisko, ponieważ 4,000> 3500. I odwrotnie, patrząc tylko na wybory A2, widzimy, że jeśli A1 zdecyduje się grać niską ceną, wybieramy pomiędzy „niską ceną” za 3000 a „wysoką ceną” za 2000. Ponieważ 3000> 2000, wybieramy tutaj opcję niskiej ceny. Jeśli A1 gra wysoką cenę, możemy naliczyć niską cenę za 4000 lub wysoką za 3500. Ponieważ 4000> 3500, wybieramy tutaj niską cenę.

Równowaga Nasha polega na tym, że obie linie lotnicze będą pobierać niską cenę (wyświetlaną po zaznaczeniu opcji dla każdej ze stron). Gdyby obie linie lotnicze naliczyły wysoką cenę, każda z nich byłaby w lepszej sytuacji niż w równowadze Nasha.

Dlaczego więc nie zgodzą się na to? Po pierwsze, zmowa jest nielegalna. Po drugie, gdyby tak się stało, korzystne byłoby jednostronne działanie w imieniu jednej linii lotniczej w celu naliczenia niskiej ceny, w wyniku czego ta linia lotnicza zarabiałaby z kolei więcej pieniędzy. Ta logika pokazuje również, w jaki sposób osiąga się równowagę Nasha i dlaczego nie jest korzystne odchodzenie od niej, gdy zostanie osiągnięta. (Zobacz także:  Finanse behawioralne ).

Równowagi wielokrotne Nasha

Ogólnie w grze może istnieć więcej niż jedna równowaga. Zwykle ma to jednak miejsce w grach z bardziej złożonymi elementami niż dwie wybory przez dwóch graczy. W grach symultanicznych, które są powtarzane w czasie, jedna z tych wielokrotnych równowag jest osiągnięta po kilku próbach i błędach. Ten scenariusz różnych wyborów w czasie przed osiągnięciem równowagi jest najczęściej rozgrywany w świecie biznesu, kiedy dwie firmy ustalają ceny wysoce wymiennych produktów, takich jak przeloty lub napoje bezalkoholowe.

Podsumowanie

Dzięki tym zaawansowanym metodom można modelować i rozwiązywać bardziej rzeczywiste sytuacje. Różne rodzaje równowag Nasha, które omówiliśmy, są najczęściej znajdowanymi rozwiązaniami dla gier modelowanych w świecie rzeczywistym. Praktyczna znajomość teorii gier może pomóc w opracowaniu strategii, niezależnie od tego, czy grasz w kółko i krzyżyk, czy walczysz o największe zyski.