Gry z naturą
Własności problemów decyzyjnych, które można rozwiązać wykorzystując metody teorii gier
a. Istnieje skończona liczba uczestników gry (zarówno zainteresowanych jak i nie zainteresowanych jej wynikiem).
b. Każdy uczestnik dysponuje skończoną liczbą sposobów działania.
c. Uczestnicy, którzy chcą zastosować teorię gier, muszą znać wszystkie sposoby działania innych uczestników, nie wiedząc jednak, które z nich zostaną wybrane.
d. Każdej kombinacji sposobów działania wszystkich uczestników odpowiada określona korzyść płynąca z gry.
e. Korzyść uczestnika gry zależy zarówno od jego działania, jak i od działania pozostałych uczestników.
f. Wszystkie możliwe wyniki gry dadzą się wyliczyć.
Sytuacja odpowiadająca powyższym warunkom zwana jest grą.
"Gra z naturą" - decyzję podejmuje tylko jeden uczestnik gry, posiadając informację o możliwych stanach, w jakich znajdzie się otoczenie, wpływających na korzyści wynikające z podjęcia decyzji.
Przykład 1
Firma specjalizująca się w zakresie przetwarzania informacji, analizy danych, itp. zamierza wydzierżawić system komputerowy wspomagający jej usługi. Wchodzą w grę trzy możliwości:
d1 - dzierżawa dużego systemu komputerowego,
d2 - dzierżawa średniego systemu komputerowego,
d3 - dzierżawa małego systemu komputerowego.
Wybór jednej z trzech decyzji powinien prowadzić do uzyskania maksymalnego zysku przez firmę. Zysk ten zależy jednak od tego jak zachowa się rynek klientów w zakresie tego typu usług.
W grę wchodzą dwie możliwości:
s1 - wysoka akceptacja oferowanych usług lub
s2 - niska akceptacja oferowanych usług.
Każdej parze (di ,sj ) i=1,2,3, j=1,2 odpowiada pewna kwota zysku jaki osiągnie firma.
I tak, np.: przy decyzji o wydzierżawieniu małego systemu i dużej akceptacji dla oferowanych przez firmę usług (para: (d3 ,s1 )) zysk wynosi 100.000 zł. Dla decyzji (d1 ,s2 ) - duży system i mała akceptacja - zysk wyniesie -20.000 zł, czyli poniesiemy stratę. Zakładamy, że klienci nie działają świadomie na niekorzyść firmy. Również firma nie jest zainteresowana oferowaniem kiepskich usług za wygórowaną opłatą. Jaką decyzję powinna podjąć firma ?
Każdej parze (di ,sj) odpowiada pewna wielkość nazywana wypłatą (korzyścią). Wypłaty zestawia się w, tzw. tablicę wypłat, w której wiersze są przyporządkowane graczowi I a kolumny odpowiadają stanom natury (tu: sytuacji rynkowej).
Tablica wypłat dla Przykładu 1
decyzja firmy
zachowanie rynku
s1
s2
d1
200 000
-20 000
d2
150 000
20 000
d3
100 000
60 000
W omawianym przykładzie macierz wypłat jest następująca:
s1 s2
A = [aij] =
Kryteria nieprobabilistyczne w grach z naturąMaxiMin - postępowanie pesymisty (asekuranta)
Pesymista (asekurant) określa dla każdej swojej decyzji najgorszy możliwy wynik (minimalną wypłatę) a następnie wybiera taką decyzję dk, dla której tak określona minimalna (gwarantowana) wypłata jest największa.
Firma podejmuje decyzję d3 o wydzierżawieniu małego systemu komputerowego.
MaxiMax - postępowanie optymisty (ryzykanta)
Optymista (ryzykant) określa dla każdej swojej decyzji najwyższy możliwy wynik (maksymalną wypłatę ) wio a następnie wybiera taką decyzję dk, dla której tak określona maksymalna (ale nie gwarantowana) wypłata jest największa.
dk : wko = { wio } , gdzie: wio = { aij }
Dla rozważanego przykładu postępowanie wg zasady MaxiMax'u jest następujące:
Firma podejmuje decyzję d1 o wydzierżawieniu dużego systemu komputerowego - nie bierze pod uwagę możliwej straty w przypadku małej akceptacji swoich usług przez klientów.
Kryterium Hurwicza - postępowanie pośrednie (mieszane)
Jest to postępowanie pośrednie pomiędzy postępowaniem pesymisty (asekuranta) a postępowaniem optymisty (ryzykanta). Reguła Hurwicza przyporządkowuje każdej decyzji di indeks h(di), który jest ważoną średnią minimalnej i maksymalnej wypłaty związanej z decyzją. Wybierana jest decyzja, której odpowiada maksymalna wartość h(×).
Oznaczmy:
ai - skłonność decydenta do ryzyka (optymizmu) przy wyborze decyzji di, aiÎ[0,1].
(Zatem 1-ai jest skłonnością do bycia pesymistą (asekurantem).
Dla każdej decyzji di wyznaczamy hipotetyczną wygraną h(di)
h(di ) =ai wio + (1-ai)wip .
Należy wybrać taką decyzję, dla której hipotetyczna wygrana h(di) jest największa.
dk: h(dk ) = max { h(di) }.
Rozważymy dwa przypadki rozwiązania problemu prezentowanego w przykładzie zgodnie z kryterium Hurwicza przy przyjęciu różnych założeń odnośnie wag ai :
Przypadek (a)
Przyjmijmy a1 = a2 = a3 = 0,5, tzn. że przy każdej z trzech decyzji jesteśmy w jednakowym stopniu pesymistą i optymistą. Jest to postępowanie właściwe w przypadkach, gdy nie jesteśmy w stanie określić prawdopodobieństw zajścia "stanów natury" sj .
Właściwą decyzją jest w tym przypadku decyzja d1 (duży system).
Przypadek (b).
Przyjmijmy a1=0.6, a2 =0.5 oraz a3 = 0.4. Oznacza to, że przy decyzji d1 mamy większą skłonność do bycia asekurantem, przy decyzji d2 jesteśmy pół na pół asekurantem i ryzykantem oraz przy decyzji d3 mamy skłonność być większym ryzykantem.
W tym przypadku właściwą decyzją jest decyzja d1 (system komputerowy o dużych rozmiarach).
Wybór decyzji optymalnej zgodnie z kryterium Hurwicza może być bardzo wrażliwy na dobrane subiektywne wagi ai . Załóżmy, że "i ai =a.
Wówczas
h(d1 ) = -20a + 200 - 200a = -220a + 200
h(d2 ) = 20a + 150 - 150a = -130a + 150
h(d3) = 60a + 100 - 100a = -40a + 1...