Decisioni strategiche in condizioni di incertezza. Strategia in condizioni di incertezza Strategie per diversi livelli di incertezza

Processo decisionale in condizioniincertezza

1. Il criterio del maximin di Wald.

2. Il criterio di Savage (rischio minimo).

3. Criterio di Hurwitz (pessimismo-ottimismo).

1. Il criterio maximin di Wald (criterio di estremo pessimismo)

("Aspettati il ​​peggio")

Nel gruppo di criteri per la scelta della strategia ottimale, le statistiche utilizzate in probabilità a priori sconosciute stati di natura , include criteri Wald, Savage e Hurwitz. Usano l'analisi della matrice dei guadagni o l'analisi della matrice del rischio.

Se la distribuzione le probabilità di futuri stati di natura sono sconosciute, quindi tutte le informazioni sulla natura vengono ridotte a elenco dei possibili stati.

Il criterio del maximin di Wald- esso criterio di estremo pessimismo, o criterio dell'osservatore prudente. Può essere formulato sia per strategie pure che miste.

Il criterio di Wald è criterio di estremo pessimismo, poiché lo statistico presume che la natura realizzi tali stati in cui il valore della sua vincita assume il valore più piccolo.

Il criterio è identico criterio maximin (pessimista), utilizzato nella risoluzione di giochi a matrice in strategie pure.

Da ciascuno Linee sono scelti minimo elementi, cioè che corrispondono al peggior risultato del decisore in stati di "natura" noti. Quindi scegli strategia decisore corrispondente massimo elemento dal minimo selezionato:

. (1)

Le opzioni scelte in questo modo eliminano completamente il rischio, poiché il decisore non può affrontare un risultato peggiore di quello da cui è guidato.

Applicazione di questo criterio giustificato se la situazione in cui viene presa la decisione è caratterizzata dalle seguenti caratteristiche:

    le probabilità degli stati di "natura" sono sconosciute;

    la soluzione viene implementata solo una o un numero limitato di volte;

    completa tolleranza al rischio.

Quindi, secondo il criterio di Wald, la strategia pura è considerata ottimale se garantisce il massimo payoff nelle peggiori condizioni. Si intende, ottimale è la strategia maximin pure, e la vincita massima è il costo netto inferiore di giocare in un gioco a coppie a somma zero.

Esempio 1

Gioco del fornitore.

La produzione dell'azienda dipende in modo significativo da materiale deperibile, come latte o bacche, fornito in lotti del valore di 100 unità.

Se la consegna non arriva in tempo, l'azienda perde 400 unità. dalla sottoproduzione.

L'azienda può inviare il proprio trasporto al fornitore (spese 50 unità), ma l'esperienza dimostra che nella metà dei casi il trasporto viene restituito senza nulla.

Puoi aumentare la possibilità di ricevere materiale fino all'80% se invii un rappresentante in anticipo, ma il costo aumenterà di altre 50 unità.

È possibile acquistare un materiale sostitutivo più costoso (50%) da un altro fornitore abbastanza affidabile, tuttavia, oltre ai costi di trasporto (50 unità), sono possibili costi aggiuntivi per lo stoccaggio del materiale per un importo di 30 unità se la sua quantità in magazzino supera la tariffa consentita pari a un lotto.

Quale strategia dovrebbe seguire l'impianto in questa situazione?

Soluzione

La natura ha due stati: un fornitore affidabile e un fornitore inaffidabile. L'azienda ha quattro strategie: 1) non intraprendere alcuna azione aggiuntiva, 2) inviare il proprio trasporto al fornitore, 3) inviare un rappresentante e il trasporto al fornitore, 4) acquistare e portare un materiale sostitutivo da un altro fornitore.

Facciamo una tabella di calcolo:

Costi e perdite del produttore

Situazione

Costo materiale

Sottoproduzione

Trasporto

Spese di viaggio

I costi di stoccaggio

Importo totale

Soluzione

Sulla base dei risultati dei calcoli ottenuti, è possibile comporre una matrice di payoff:

Risposta. È necessario aderire alla terza strategia e i costi non supereranno le 260 unità se un rappresentante e il trasporto vengono inviati al fornitore.

1 . Il metodo considerato per trovare la soluzione ottimale è criterio valda ( criterio massimo il processo decisionale). Si sceglie una soluzione che garantisce un payoff non inferiore a maxmin:

unità

Applicando questo criterio, rappresentiamo in luogo la natura di un avversario attivo e malevolo. Questo pessimista un approccio .

2. Max max criterio. Il caso più favorevole:

unità

Se l'azienda non fa nulla, non spenderà più di 100 unità. Questo è il criterio assoluto ottimismo.

criterio Wald per strategie miste

La strategia mista ottimale è la statistica , al quale il payoff medio minimo sarà massimo: . (2)

Il criterio di Wald orienta la statistica verso gli stati di natura più sfavorevoli, cioè esprimono una valutazione pessimistica della situazione.

2. Il criterio di Savage (rischio minimo )

In pratica, scegliendo una delle possibili soluzioni, spesso ci si ferma la cui attuazione comporterà le conseguenze meno gravi se la scelta è sbagliata. Questo approccio alla scelta di una soluzione è stato formulato matematicamente dallo statistico americano Savage nel 1954 ed è stato chiamato principio selvaggio. È particolarmente conveniente per problemi economici ed è spesso usato per scegliere soluzioni nei giochi dell'uomo con la natura.

Secondo il principio di Savage ogni soluzione è caratterizzata dall'ammontare delle perdite aggiuntive che derivano dall'implementazione di tale soluzione, rispetto all'attuazione di una soluzione che sia corretta per un dato stato di natura. Naturalmente, la soluzione corretta non comporta perdite aggiuntive e il loro valore è zero.

Nella scelta della soluzione che meglio si adatta ai vari stati della natura, vanno tenute in considerazione solo queste perdite aggiuntive, che saranno essenzialmente il risultato di errori di selezione.

Per risolvere il problema, il cosiddetto " matrice di rischio”, i cui elementi mostrano quale perdita subirà il giocatore (DM) a seguito della scelta di una soluzione non ottimale.

Richiama questo Rischio giocatore quando sceglie una strategia nelle condizioni (stati) della natura si chiama differenza tra il payoff massimo, che Puoi prenderlo in queste condizioni, e il guadagno che riceverà il giocatore nelle stesse condizioni, applicando la strategia .

Il criterio di Savage è un criterio di minimax risk, minimizzazione dei "rimpianti". Questo criterio, come quello di Wald, è il più cauto e pessimista.

Nel criterio di Savage, il pessimismo si manifesta in modo diverso: il peggio non è il guadagno minimo, ma la massima perdita di guadagno rispetto a quanto si potrebbe ottenere in determinate condizioni (rischio massimo).

Il criterio del selvaggio si concentra sul rischio piuttosto che sul risultato(perdite o penalità).

Come viene scelta la strategia ottimale, in cui il valore delle perdite nelle peggiori condizioni è minimo. Il criterio di Savage consiglia di scegliere come ottimale quello strategia che riduce al minimo il rischio massimo:

. (3)

Requisiti applicato alla situazione in cui una decisione viene presa secondo il criterio Savage coincidono con l'esigenza di utilizzare il criterio Wald. Il criterio Savage, come il criterio Wald, orienta la statistica verso gli stati più sfavorevoli della natura.

Esempio 2 Per l'attività "Fornitore", il minimo di rischio viene raggiunto immediatamente con due strategie A 2 e A 3:

Trova la soluzione di gioco ottimale , applicando il criterio di Savage.

Soluzione.

Ci concentriamo sugli stati più sfavorevoli della "natura". Calcoliamo le statistiche sui rischi.

Per la prima colonna:

Per la seconda colonna:

Per la terza colonna:

Scriviamo matrice di rischio.

Statistiche strategie

Definiamo in ogni riga il numero più grande è il rischio più grande per lo statistico se applica la strategia e la natura ne cambia gli stati , , . Integriamo la matrice dei rischi con l'ultima colonna "i maggiori rischi".

Matrice di rischio e rischi maggiori

Statistiche strategie

I rischi maggiori

Troviamo il rischio minimo: .

Quindi, secondo il criterio di Savage, la strategia ottimale è strategia .

4.3. Criterio di Hurwitz (pessimismo-ottimismo)

Il criterio di Hurwitz è il criterio del massimo generalizzato, o pessimismo-ottimismo.

Sembra logico che quando si sceglie una soluzione, invece di due estremi nella valutazione della situazione, si aderisca a una posizione intermedia che tenga conto della possibilità sia del peggiore che del migliore comportamento favorevole della natura.

Una tale opzione di compromesso è stata proposta da Hurwitz. Secondo questo approccio, per ogni soluzione, è necessario determinare una combinazione lineare di payoff minimo e massimo e prendere la strategia per la quale questo valore sarà il maggiore.

Questo criterio prevede soluzione intermedia tra estremo ottimismo ed estremo pessimismo, che è determinato secondo il principio:

. (4)

Numero () - grado di ottimismo , soddisfa la condizione ed è selezionato in base a considerazioni soggettive, caratteristiche ambientali, buon senso, in base all'esperienza del decisore, alla sua attitudine al rischio, ecc. La scelta del valore del grado di ottimismo è influenzata dalla misura di responsabilità: più gravi sono le conseguenze di decisioni errate, maggiore è la volontà del decisore di assicurarsi, ovvero il grado di ottimismo  è più vicino allo zero .

Per ciascuno Linee calcolato media ponderata(tenendo conto del valore selezionato) dei risultati più piccoli e più grandi, dopodiché viene selezionato riga con valore massimo.

Quando abbiamo criterio di estremo ottimismo, cioè. riflette la posizione di un giocatore d'azzardo che si aspetta lo stato più favorevole dell'ambiente.

Quando il criterio di Hurwitz diventa Il criterio di Wald per il pessimismo estremo.

Se 0 è il rapporto intermedio tra decisori e possibili rischi. Se vuoi essere sicuro in questa situazione, portalo vicino a uno.

La scelta del valore è soggettiva e, di conseguenza, anche la scelta della soluzione è soggettiva, il che è del tutto inevitabile in condizioni di incertezza.

Più pericolosa è la situazione, il più il decisore cerca di assicurarsi contro possibili rischi, più vicino a 0. E meno appassionato è, più vicino a 1.

Una strategia ottimale per Hurwitz dovrebbe garantire allo statistico un guadagno maggiore rispetto a quello che lo statistico presume intuitivamente o per esperienza.

L'applicazione del criterio di Hurwitz è giustificata se la situazione in cui viene presa la decisione è caratterizzata da segni:

    le probabilità degli stati di natura sono sconosciute;

    la soluzione è implementata da un numero ridotto di soluzioni;

    è consentito un certo rischio.

Esempio 3 Trova la soluzione ottimale al gioco statistico dato dalla matrice dei payoff usando il criterio di Hurwitz.

Soluzione.

Per l'applicazione Criterio di Hurwitz devi conoscere il valore della probabilità. Lasciamo, per esempio, . Ciò significa che vogliamo rendere più plausibile (vicino a uno) l'evento "la più piccola vittoria possibile di uno statistico", ovvero ci assicuriamo contro le situazioni sfavorevoli del gioco. Poi

.

Annotiamo tutti i risultati intermedi nella tabella.

Si può notare dall'ultima colonna della tabella che il valore massimo è (–7,2) e corrisponde al netto strategie ; sarà ottimale secondo il criterio di Hurwitz.

L'analisi delle situazioni pratiche viene effettuata secondo diversi criteri contemporaneamente, che consente di esplorare l'essenza del fenomeno in modo più approfondito e scegliere la decisione di gestione più ragionevole. Come ottimale basato su ricerca cumulativa viene adottata la strategia che più spesso è definita ottimale da tutti i criteri.

La scelta di un criterio (così come la scelta di un principio di ottimalità) è il compito più difficile e responsabile nella teoria delle decisioni. Tuttavia, una situazione particolare non è mai così incerta da rendere impossibile ottenere informazioni almeno parziali sulla distribuzione probabilistica degli stati di natura. In questo caso, dopo aver stimato la distribuzione di probabilità degli stati di natura, si utilizza il metodo di Bayes-Laplace, oppure si effettua un esperimento per chiarire il comportamento della natura.

Domande di controllo

    Cosa si intende per giochi con la natura?

    Quali criteri utilizza uno statistico per determinare la sua strategia ottimale in condizioni di incertezza?

    Cosa si intende per rischio giocatore?

    Spiegare i principi dell'uso dei modelli della teoria dei giochi in problemi economici in condizioni di incertezza (giochi con la natura).

  1. condizioni incertezza usando l'apparato fuzzy...
  2. Adozione decisioni v condizioni incertezze (5)

    Abstract >> Stato e diritto

    Una situazione di rischio, e per un'altra - incertezza. Rischio accettazione il peggiore soluzioni v condizioni, quando si conoscono tutte le iniziali... perché nel processo accettazione decisioni devono fare una scelta condizioni incertezza.. Procedure e metodi di sistema...

  3. Adozione manageriale decisioni v condizioni rischio e incertezza

    Riassunto >> Gestione

    ... Adozione manageriale decisioni v condizioni rischio e incertezza. Piano: Introduzione. Fonti e tipi di incertezza. Adozione decisioni v condizioni incertezza... e tipi di incertezza. Adozione

Criterio massimo(ottimismo estremo, "rosa") si basa sul principio ottimista di L. Hurwitz, secondo il quale viene selezionata l'opzione che fornisce l'effetto maggiore nella situazione più favorevole.

Se la matrice delle conseguenze (3.1) è considerata come matrice degli effetti E,

Questo criterio corrisponde alla strategia 1 (vedi Fig. 3.6), si consiglia di applicarlo nei casi in cui è possibile influenzare la parte opposta per rendere più favorevole l'ambiente esterno non controllato, e per realizzare la possibilità di un uso ottimale di fattori interni controllati.

Esempio 3.3. Prendendo la matrice delle conseguenze nell'esempio 3.2 come matrice degli effetti, scegli l'opzione di soluzione secondo il criterio maximax.

1. I dati iniziali vengono inseriti in Excel (Fig. 3.9). Quindi, utilizzando la funzione MAX per le celle (B4:F4;…; B7:F7), si trovano in sequenza i valori massimi per ciascuna soluzione: a 1 \u003d 8, a 2 \u003d 12, a 3 \u003d 10, a 4 \u003d 8.

Riso. 3.9. I risultati della scelta della soluzione ottimale secondo il criterio maximax

2. Dalla sequenza dei valori massimi trovati un io(G4:G7) utilizzando la funzione MAX (cella G8), viene selezionato il valore più grande: un 2 =12, a tal fine, si consiglia di adottare la seconda soluzione.

Se gli elementi della matrice A (3.1) sono costi Z, allora possono essere considerati come perdite, e quindi la soluzione che fornisce il minor costo è selezionata dalle condizioni di minimizzazione dei costi:

. (3.10)

Criterio minimo(pessimismo) si basa sul principio pessimistico, secondo il quale, in un ambiente esterno sfavorevole, i fattori controllati possono essere utilizzati in modo sfavorevole. Quindi se la matrice delle conseguenze è la matrice degli effetti E, quindi la soluzione efficace viene scelta tra le condizioni per garantire il massimo:

. (3.11)

In condizioni reali, non è sempre possibile controllare fattori ambientali incontrollabili, soprattutto quando è necessario tenere conto del fattore tempo. Ad esempio, con previsioni e pianificazione a lungo termine; progettare oggetti complessi, ecc. Oppure, ad esempio, i costi di produzione sono fattori controllabili nel breve termine e incontrollabili nel lungo termine, poiché il costo dell'energia elettrica, il costo dei materiali e dei prodotti acquistati, ecc. non sono noti in anticipo. Un altro esempio è la determinazione del volume di produzione di un'impresa (fattore gestito), che dipende da vari fattori associati al processo produttivo. Questi fattori riguardano l'ambiente interno dell'impresa: il livello di progettazione e preparazione tecnologica della produzione, il tipo di attrezzatura utilizzata, le qualifiche dei lavoratori, ecc.

La strategia 2 soddisfa questo criterio (vedi Figura 3.6).

Esempio 3.4. Prendendo la matrice delle conseguenze nell'esempio 3.2 come matrice degli effetti, scegli l'opzione di soluzione secondo il criterio del minimo.

1. I dati iniziali vengono inseriti in Excel (Fig. 3.10). Quindi, utilizzando la funzione MIN per le celle (B4:F4;…; B7:F7), i valori minimi per ogni io-esima decisione: .


Riso. 3.10. I risultati della scelta della soluzione ottimale secondo il criterio del minimo

3. Dalla sequenza dei valori minimi trovati un io(G4:G7) utilizzando la funzione MIN (cella G8), viene selezionato il valore più piccolo: a4=1 con questo in mente, si raccomanda una quarta decisione.

Quando si analizza la matrice dei costi, il criterio del pessimismo assume la forma seguente

(3.12)

Massimino criterio (estremo pessimismo) si basa sul principio pessimista di A. Wald, secondo il quale si sceglie l'opzione il cui risultato è il più favorevole tra i meno favorevoli.

Se la situazione attesa si sviluppa in modo sfavorevole, ad es. porterà il reddito minimo: un io= min un io j, si sceglie quindi una soluzione per la quale il reddito minimo (garantito) sarà il maggiore

. (3.13)

Questo criterio è conservativo, in quanto suggerisce una scelta con una linea d'azione prudente, quindi è opportuno utilizzarlo nei casi in cui è necessario garantire il successo in qualsiasi condizione possibile. Nella matrice decisionale (Fig. 3.6), il criterio di Wald corrisponde alla strategia 3.

Esempio 3.5. Per la matrice delle conseguenze nell'esempio 3.2, scegliere l'opzione di soluzione secondo il criterio maximin.

1. Per ciascuno io-esima soluzione alternativa, utilizzando la funzione MIN si trovano i valori minimi: a 1 \u003d 2, a 2 \u003d 2, a 3 \u003d 3, a 4 \u003d 1(vedi figura 3.11, celle G4:G7)

Riso. 3.11. I risultati della scelta della soluzione ottimale secondo il criterio maximin

2. Utilizzo della funzione MAX dalla sequenza dei valori minimi trovati un io(G4:G7) viene selezionato il massimo un 3= 3 (cella G8).

3. Secondo la regola di Wald (3.11), dovrebbe essere data preferenza alla terza opzione di soluzione ( io=3), con il massimo risultato garantito (vincente) indipendentemente dalla variante della situazione (condizioni esterne).

Criterio Minimax (rischio minimo, aspettativa di perdita) basato sul principio di frustrazione di L. Savage. Secondo questo principio, viene scelta l'opzione, nell'attuazione della quale la massima delusione possibile (la differenza tra il massimo risultato possibile e i risultati ottenibili per ciascuna delle restanti opzioni) è la più piccola.

Qui sono guidati dalla situazione peggiore, che è associata al rischio maggiore. Quando si sceglie una soluzione, viene utilizzata una matrice di rischio R(3.5). La soluzione migliore è considerata quella in cui il valore massimo del rischio sarà il più piccolo:

. (3.14)

Quando si prendono decisioni di investimento in condizioni di incertezza con un focus sui risultati peggiori, vengono utilizzati un criterio pessimistico (maximin) e un criterio di delusione (minimax).

Questo criterio viene utilizzato nei casi in cui è necessario evitare un rischio elevato in qualsiasi condizione, corrisponde alla strategia 4 (Fig. 3.6).

Esempio 3.6. Secondo la matrice delle conseguenze dell'esempio 3.2, scegliere l'opzione di soluzione secondo il criterio minimax.

1. In precedenza, secondo la matrice delle conseguenze dell'esempio 2, utilizzando l'espressione (3.4), gli elementi della matrice di rischio fig. 3.12.

2. In ogni riga della matrice di rischio, mediante la funzione MAX, viene selezionato il suo elemento massimo (celle G4:G7): r io = : R 1 = 8, R 2 = 6, R 3 = 5, R 4 = 7.

Riso. 3.12. I risultati della scelta della soluzione ottimale secondo il criterio minimax

3. Secondo la regola di Savage, viene scelto il più piccolo di questi valori (la funzione MIN nella cella G8): R 3 = 5, cioè La terza decisione dovrebbe essere presa io=3). La scelta di questa opzione significa che le perdite massime in varie situazioni saranno minime e non supereranno le 5 unità.

Criterio di Hurwitz di maximin generalizzato(pessimismo-ottimismo) implica una scelta strategia mista, quando pessimismo (cautela) e ottimismo (inclinazione al rischio significativo) si combinano in una certa proporzione, cioè si sceglie una soluzione intermedia tra la linea di comportamento basata sul peggiore e la linea di comportamento basata sul migliore.

Secondo questo criterio viene scelta la variante di soluzione, in cui si raggiunge l'indicatore massimo G, determinato dall'espressione:

G io = max[a min a i j + (1 - a) max a i j]. (3.15)

dove e ij- vincere a io-esima soluzione a J-esima versione della situazione,

un– coefficiente che riflette il grado di ottimismo ( 0 ≤ a ≤ 1): in a = 0 una linea di comportamento viene scelta in base al migliore, ad es. si orienta al rischio marginale (si ottiene il criterio massimo-massimo); in a = 1 viene fatto un orientamento al peggio, quindi otteniamo il criterio Wald, una linea guida per un comportamento prudente. Valori intermedi un tra 0 e 1 e sono scelti in base alla situazione specifica e alla propensione al rischio del decisore.

Esempio 3.7. L'impresa si prepara a produrre nuovi tipi di prodotti, mentre sono possibili quattro soluzioni Q 1 , Q 2 , Q 3 , Q 4 , ognuno dei quali corrisponde ad un determinato tipo di prodotto o ad una loro combinazione. La struttura della domanda di prodotti è caratterizzata da tre scenari S 1 , S 2 , S 3 . Efficienza di rilascio di nuovi tipi di prodotti un io j per ogni coppia di combinazioni di soluzioni Q io (i=1,2,…,m) e ambientando S J (j=1,2,…,n) sono riportati nella tabella di Fig. 3.12. È necessario trovare la soluzione più redditizia secondo il criterio di Hurwitz Q io e valutare l'influenza del coefficiente di ottimismo sulla scelta della soluzione.

1. Considera una sequenza di coefficienti K con incrementi di 0,25:0; 0,25; 0,50; 0,75; 1.00 e inserire i dati iniziali sul foglio di lavoro di Excel, fig. 3.12.

2. I risultati del calcolo dell'indicatore G per espressione (3.13) per varie soluzioni a seconda del valore del coefficiente K sono mostrati nella tabella in basso della Fig. 3.13.

Riso. 3.13. Dati iniziali, formule di calcolo e risultati di calcolo del criterio di Hurwitz (le frecce indicano soluzioni efficaci)

Come si può vedere dalla figura (celle B18:F18), la variazione del coefficiente K influenza la scelta della soluzione, a cui dovrebbe essere data la preferenza.

La scelta dell'uno o dell'altro criterio dipende da una serie di fattori:

La natura del problema da risolvere;

obiettivi stabiliti,

Un insieme di restrizioni

La propensione al rischio dei decisori.

Va notato che i metodi e le tecniche considerati per la risoluzione di problemi a rischio e incertezza non si limitano ai metodi elencati. A seconda della situazione specifica, nel processo di analisi possono essere utilizzati altri metodi, ad esempio utilizzando la deviazione standard e il coefficiente di variazione come misura del rischio.

1. METODOLOGIA GENERALE PER LA FORMA DEI CRITERI

L'essenza della metodologia proposta per la formazione dei criteri è l'attuazione dei seguenti punti.

1) Dai payoff aij, i=1,…,m; j=1,…,n, giocatore A, componiamo la matrice A, assumendo che soddisfi le condizioni di cui sopra: m³2, n³2 e non contenga righe dominate (in particolare duplicate).

I payoff aij del giocatore A, presentati sotto forma di una matrice A, forniscono un'opportunità per una migliore panoramica dei risultati della scelta delle strategie Аi, i=1,…,m, da parte del giocatore A per ogni stato di natura Пj, j =1,…,n.

2) Fissiamo la distribuzione delle probabilità qj=p(Пj), j=1,…,n, degli stati di natura Пj, j=1,…n, soddisfacendo la condizione (1), ovviamente se sono conosciuti. Pertanto, il punto 2 è coinvolto nel metodo di formazione di un criterio in caso di decisione a rischio.

3) In base ai punti 1 e 2, scegliamo un numero naturale l, 1£l£n, e in un certo modo costruiamo una matrice


Chiamiamoli i coefficienti del criterio che si sta formando. Hanno lo scopo di svolgere il ruolo di valutazioni quantitative di alcune manifestazioni soggettive del giocatore A (decisore), vale a dire il grado di fiducia nella distribuzione di probabilità degli stati di natura e il grado del suo pessimismo (ottimismo) nel prendere decisioni.

5) Utilizzando la matrice B e i coefficienti l1,…, ll, ad ogni strategia Аi, i=1,…,m, del giocatore A, assegniamo il numero


7) Definiamo la strategia ottimale.

Una strategia ottimale è una strategia Ak con l'indicatore di massima efficienza, in altre parole, una strategia il cui indicatore di efficienza Gk coincide con il costo del gioco G:


È chiaro che una tale definizione della strategia ottimale non implica la sua unicità.

Si noti che, secondo la logica di questo paragrafo, il giocatore A, scegliendo la strategia ottimale, massimizza l'indice Gi (vedi (5)). Questa circostanza giustifica il fatto che abbiamo chiamato questo indicatore (al paragrafo 5) un indicatore di efficienza.

2. FORMAZIONE DI ALCUNI CRITERI CONOSCIUTI - CASI PARTICOLARI DEL METODO GENERALE

Criterio di Bayes (, , , ).

1) Sia A la matrice di payoff del giocatore A.

2) Probabilità note qj=p(Пj), j=1,…,n, stati di natura Пj, j=1,…,n, condizione soddisfacente (1). Si tratta quindi di prendere decisioni in condizioni di rischio.

3) Assumiamo l=n e scegliamo la matrice B uguale alla matrice A, cioè

bij=aij per tutti i=1,…,m e j=1,…,n.

4) I coefficienti l1,…,ln, sono scelti uguali alle corrispondenti probabilità q1,…,qn, cioè ll=qi, i=1,…,n. Con ciò, il giocatore A esprime piena fiducia nella verità della distribuzione di probabilità q1,…,qn, stati di natura.

Da (1) segue che i coefficienti lj, j=1,…,n soddisfano la condizione (3).

5) L'indicatore dell'efficacia della strategia Аi secondo il criterio di Bayes sarà indicato con Вi e lo troviamo secondo la formula (3):


Ovviamente, Вi è il payoff medio ponderato per la strategia Аi con pesi q1,…,qn.

Se la strategia Аi viene interpretata come una variabile casuale discreta che prende i valori dei guadagni per ogni stato di natura, le probabilità di questi guadagni saranno uguali alle probabilità degli stati di natura, e quindi Вi è l'aspettativa matematica di questo variabile casuale (vedi (6)).

6) Il prezzo del gioco secondo il criterio di Bayes, da noi indicato come B, è determinato dalla formula (4):

7) Ottima tra le strategie pure secondo il criterio di Bayes è la strategia Ak, per la quale l'indicatore di efficienza è massimo:

Criterio di Laplace (, , , ).

2) Sulla base di considerazioni teoriche o pratiche, si afferma che nessuno dei possibili stati di natura Пj, j=1,…,n, può essere privilegiato. Pertanto, tutti gli stati di natura sono considerati ugualmente probabili, cioè qj=n-1, j=1,…,n. Questo principio è chiamato il principio di "ragione insufficiente" di Laplace. Le probabilità qj=n-1, j=1,…,n soddisfano la condizione (1).

Poiché sono note le probabilità degli stati di natura: qj=n-1, j=1,…,n, allora siamo in una situazione decisionale a rischio.

3) Sia l=n, e come matrice B, possiamo prendere la matrice ottenuta dalla matrice A, se ogni riga di quest'ultima è sostituita da una permutazione arbitraria dei suoi elementi. In particolare, possiamo mettere B=A. Nel caso generale, gli elementi della matrice B hanno la forma bij=aikj(i), i=1,…, m; j=1,…,n, dove aik1(i), aik2(i),…,aikn(i) è una permutazione degli elementi ai1, ai2,…,ain dell'i-esima riga della matrice A.

4) Siano i coefficienti lj=n-1, j=1,…,n. Ovviamente soddisfano la condizione (2).

La scelta dei coefficienti lj, j=1,…,n, conferma quindi la piena fiducia del giocatore A nel principio di Laplace di ragione insufficiente.

5) Secondo la formula (3), l'indicatore dell'efficacia della strategia Аi secondo il criterio di Laplace, da noi indicato come Li, è pari a:


7) La strategia ottimale Ak secondo il criterio di Laplace è la strategia con l'indicatore di massima efficienza:

Si noti che, come segue da (7) e (8), l'indicatore di efficienza Li sarà massimo se e solo se la somma è massima, e quindi il numero può essere considerato come un indicatore dell'efficacia della strategia Ài, e il numero come prezzo del gioco.

Quindi la strategia ottimale è quella con il massimo profitto.

Criterio Wald ( - ).

1) Assumiamo che A sia la matrice di payoff del giocatore A.

2) Le probabilità degli stati di natura sono sconosciute e non c'è modo di ottenere alcuna informazione statistica su di essi. Pertanto, il giocatore A si trova in una situazione decisionale in condizioni di incertezza.

3) Sia l=1 e


4) Sia il coefficiente l1=1. Ovviamente la condizione (2) è soddisfatta.

5) Designiamo l'indicatore di efficienza della strategia Аi secondo il criterio di Wald come Wi. In virtù della (9) e del valore del coefficiente l1=1, secondo la formula (3) si ha:


Pertanto, l'indicatore dell'efficacia della strategia Аi secondo il criterio Wald è il payoff minimo del giocatore A quando applica questa strategia.

6) Il prezzo del gioco secondo il criterio di Wald, indicato con W, si ricava dalla formula (4):

7) La strategia ottimale tra le strategie pure secondo il criterio di Wald è la strategia Ak con l'indicatore di massima efficienza:

In altre parole, secondo il criterio di Wald, la strategia pura ottimale tra le strategie pure è la strategia pura per cui il payoff minimo è il massimo tra i payoff minimi di tutte le strategie pure. Pertanto, la strategia ottimale secondo il criterio di Wald garantisce un payoff non inferiore al maximin per qualsiasi stato di natura:


In virtù della (10), il criterio di Wald è un criterio di estremo pessimismo del giocatore A, e l'espressione quantitativa di questo estremo pessimismo è il valore del coefficiente l1, pari a 1. Il giocatore A, nel prendere una decisione, agisce secondo al principio della massima cautela.

Sebbene il proverbio arabo dica: "Chi ha paura della propria ombra, non c'è posto per lui sotto il sole", tuttavia questo criterio è appropriato nei casi in cui il giocatore A non vuole tanto vincere quanto non vuole perdere. L'uso del principio Wald nella vita di tutti i giorni è confermato da detti come "Misura sette volte - taglia una volta", "Dio protegge la cassaforte", "Meglio una cincia nelle mani che una gru nel cielo".

Criterio di Hodge-Lehmann.

1) Supponiamo che la matrice di payoff del giocatore A sia la matrice A.

2) Probabilità note qi=p(Пj), j=1,…,n, stati di natura Пj, j=1,…,n, condizione (1).

Pertanto, il giocatore A deve prendere una decisione a rischio.

3) Sia l=2,


· indicatore dell'efficacia della strategia Ài secondo il criterio di Bayes.

La matrice B assumerà la forma


Ovviamente, questi coefficienti soddisfano la condizione (2).

5) Secondo la formula (3), tenendo conto delle (11), (12) e (13), l'indicatore di efficienza della strategia Аi secondo il criterio di Hodge-Lehman è pari a:

Gi=libi1+l2bi2=(1-l)Wi+lBi=(1-l)aij+ i=1,…,m.

A destra della formula (14), il coefficiente lО è un indicatore quantitativo del grado di fiducia del giocatore A rispetto alla distribuzione di probabilità data qi=p(Пj), j=1,…,n, stati di natura Пj, j=1,…,n, e il coefficiente (1 -l) caratterizza quantitativamente il grado di pessimismo del giocatore A. Maggiore è la fiducia che il giocatore A ha nella distribuzione di probabilità data degli stati di natura, minore è il pessimismo e viceversa.

6) Il prezzo del gioco secondo il criterio Hodge-Lehman è determinato dalla formula (4):

7) La strategia ottimale secondo il criterio di Hodge-Lehman è la strategia Ak con il più alto indicatore di efficienza:

Si noti che il criterio di Hodge-Lehman è, per così dire, un criterio intermedio tra i criteri di Bayes e Wald. Quando l=1, dalla (14) si ha: Gi=Bi e quindi il criterio di Hodge-Lehman si trasforma nel criterio bayesiano. E quando l=0, da (14): Gi=Wi e, quindi, dal criterio di Hodge-Lehman, otteniamo il criterio di Wald.

Il criterio di Germeier.

1) Sia la matrice A la matrice di payoff del giocatore A.

2) Sono date le probabilità qi=p(Пj), j=1,…,n, di stati di natura Пj, j=1,…,n, che soddisfino la condizione (1).

Quella. Il giocatore A è in una situazione decisionale a rischio

misura m x 1.

4) Impostiamo l1=1. La condizione (2) è ovviamente soddisfatta.

5) L'indicatore dell'efficacia della strategia Аi secondo il criterio di Germeier è determinato dalla formula (3) tenendo conto della (15) e del fatto che l1=1:


Se il giocatore A aderisce alla strategia Ai, allora la probabilità di vincere aij in questa strategia e nello stato di natura Пj è ovviamente uguale alla probabilità qj di questo stato di natura. Pertanto, la formula (16) mostra che l'indicatore dell'efficacia della strategia Аi secondo il criterio di Germeier è il guadagno minimo per questa strategia, tenendo conto della sua probabilità.

6) Il prezzo del gioco secondo il criterio Germeier è determinato dalla formula (4):

7) La strategia ottimale secondo il criterio di Germeier è la strategia Ak con l'indicatore di efficienza più alto:

Si noti che il criterio di Germeier può essere interpretato come il criterio di Wald applicabile al gioco con la matrice


Il criterio di Germeier, come il criterio di Wald, è un criterio di estremo pessimismo del giocatore A, ma, a differenza del criterio di Wald, il giocatore A, decidendo con la massima discrezione, tiene conto delle probabilità degli stati di natura.

Nel caso di una distribuzione uniforme delle probabilità degli stati di natura: qj=n-1, j=1,…,n, l'indicatore di efficienza della strategia Аi, dovuto alla formula (16), sarà uguale a Gi=n -1aij e, quindi, il criterio di Germeier è equivalente al criterio di Wald, cioè una strategia ottimale secondo il criterio di Germeier è ottimale anche secondo il criterio di Wald e viceversa.

Criteri di lavoro.

1) Sia la matrice di payoff del giocatore A la matrice A, i cui elementi sono tutti positivi:

aij>0, i=1,…,m; j=1,…,n.

2) Le probabilità qj=p(Пj), j=1,…,n, degli stati di natura Пj, j=1,…,n, sono note e soddisfano la condizione (1).

3) Sia l=1 e


misura m x 1.

4) Sia l1=1. La condizione (2) è soddisfatta.

5) L'indicatore dell'efficacia della strategia Аi secondo il criterio dei prodotti secondo le formule (3) e (17) è pari a

.

6) Il prezzo del gioco secondo il criterio delle opere è calcolato con la formula (4):

7) La strategia ottimale secondo il criterio del prodotto è la strategia Аk con l'indicatore di efficienza più alto:

Si noti che per il criterio dei prodotti, è essenziale che tutti gli stati di probabilità degli stati di natura e tutti i payoff del giocatore A siano positivi.

Criterio Maxmax (.-).

2) La probabilità degli stati è sconosciuta. La decisione è presa in condizioni di incertezza.

3) Sia l=1 e


misura m x 1.

4) Si sceglie il coefficiente l1 uguale a 1: l1=1. In questo caso la condizione (2) è ovviamente soddisfatta.

5) L'indicatore dell'efficacia della strategia Аi secondo il criterio massimo-massimo sarà indicato con Мi e determinato dalla formula (3) tenendo conto (18) e del fatto che l1=1:


Pertanto, l'indicatore dell'efficacia della strategia Аi secondo il criterio maximax è il maggiore guadagno per questa strategia.

6) Il prezzo del gioco secondo il criterio massimo, da noi indicato come M, è determinato dalla formula (4):


Ovviamente, questo è l'elemento più grande della matrice A.

7) La strategia ottimale secondo il criterio maximax è la strategia Ak con il più alto indicatore di efficienza:

Dalla formula (19) concludiamo che il criterio maxmax è il criterio di estremo ottimismo del giocatore A. Quantitativamente, questo è espresso dal fatto che l1=1. Questo criterio è opposto al criterio di Wald. Il giocatore A, utilizzando il criterio massimo-massimo, presume che la natura di P sarà per lui più favorevole e, di conseguenza, si comporta in modo molto frivolo, con uno stato d'animo da "cappello in cattività", perché è sicuro del maggior guadagno. Tuttavia, in alcuni casi, questo criterio viene utilizzato consapevolmente, ad esempio, quando il giocatore A si trova di fronte a un dilemma: ottenere la vincita più grande o andare in bancarotta. Il riflesso quotidiano di tali situazioni è illustrato dai detti: "Pan o perso", "Chi non rischia, non vince", ecc.

La strategia ottimale secondo il criterio del massimo garantisce al giocatore A la possibilità di vincere pari al massimo massimo.

.

Criterio di pessimismo-ottimismo di Hurwitz con indicatore di ottimismo lО ( – ).

1) Sia A la matrice di payoff del giocatore A.

2) Le probabilità degli stati di natura sono sconosciute e non c'è modo di ottenere informazioni statistiche affidabili su di essi.

Pertanto, la decisione di scegliere la strategia ottimale sarà presa in condizioni di incertezza.

3) Sia l=2. Elementi della matrice B


4) I coefficienti l1 e l2 sono scelti come segue:


Nella formula (22) l è un indicatore di ottimismo e (1-l) è un indicatore del pessimismo del giocatore A nella scelta della strategia ottimale. Più l'indicatore di ottimismo è vicino a uno, più l'indicatore di pessimismo è vicino a zero e più ottimismo e meno pessimismo. E viceversa. Se l=0,5, allora 1-l=0,5, cioè gli indicatori di ottimismo e pessimismo sono gli stessi. Ciò significa che il giocatore A si comporta in modo neutrale quando sceglie una strategia.

Pertanto, il numero l viene scelto nell'intervallo da 0 a 1, a seconda della propensione del giocatore A ad essere ottimista o pessimista.

6) Il prezzo del gioco secondo il criterio di Hurwitz N è determinato dalla formula (5):


7) La strategia ottimale Ak secondo il criterio di Hurwitz corrisponde all'indicatore di efficienza

Il criterio di Hurwitz è intermedio tra il criterio di Wald e il criterio di massimo-massimo e si trasforma nel criterio di Wald a l=0 e nel criterio di massimo-massimo a l=1.

Test di Hurwitz generalizzato con coefficienti l1,…, ln (, ).

1) Sia A la matrice di payoff del giocatore A.

2) Le probabilità degli stati di natura sono sconosciute. Quindi la decisione viene presa in condizioni di incertezza.

3) La matrice B si ottiene dalla matrice A permutando gli elementi di ciascuna delle sue righe in ordine non decrescente:

bi1£bi2£…£bin, i=1,…,m.

Pertanto, la prima colonna della matrice B contiene il minimo e l'ennesima colonna contiene i payoff massimi delle strategie. In altre parole, nella 1a colonna della matrice B ci sono gli indicatori dell'efficacia delle strategie secondo il criterio Wald, e nell'ennesima colonna - indicatori dell'efficacia delle strategie secondo il criterio maxmax.

4) I coefficienti l1,…, ln sono scelti per soddisfare le condizioni (2) in funzione del diverso grado di inclinazione all'ottimismo del giocatore A. In questo caso, l'indicatore del pessimismo del giocatore A è il numero


dove è la parte intera del numero e l'indicatore dell'ottimismo del giocatore A è il numero


Ovviamente, lр+l0=1.

5) L'indicatore dell'efficacia della strategia Аi secondo il criterio generalizzato di Hurwitz è determinato dalla formula (3):


6) Il valore del gioco secondo il criterio generalizzato di Hurwitz è determinato dalla formula (4):

7) Le strategie ottimali si trovano nel modo standard: Аk è la strategia ottimale se Gk=G.

Si noti che il criterio di Hurwitz generalizzato tiene conto di tutti i guadagni per ciascuna strategia, il che è necessario per un quadro più completo dell'efficacia delle strategie. Notiamo anche che alcuni dei criteri di cui sopra sono casi speciali del criterio di Hurwitz generalizzato.

Si noti che se B=A, allora i coefficienti lj, j=1,…,n, possono essere formalmente interpretati come le probabilità degli stati di natura, e in questo caso il criterio di Hurwitz generalizzato coincide con il criterio di Bayes.

Se lj=n-1, j=1,…,n, allora il criterio di Hurwitz generalizzato si trasforma nel criterio di Laplace.

Se l1=1, l2=…=ln=0, allora il criterio di Hurwitz generalizzato è il criterio di Wald.

Quando l1=…=ln-1=0, ln=1, dal criterio di Hurwitz generalizzato otteniamo un criterio di maximax.

Se l1=1-l, l2=…=ln-1=0, ln=l, dove lн, allora il criterio di Hurwitz generalizzato è il criterio di Hurwitz.

Se В=А e qi=p(Пj), j=1,…,n – probabilità di stati di natura che soddisfano le condizioni (1), scegliendo i coefficienti lj, j=1,…,n, come segue: l1 =1- l+lq1, lj=lqj, j=2,…,n, dove lн, otteniamo il criterio di Hodge Lehman dal criterio generalizzato di Hurwitz.

3. PROBLEMA IN COMPLETA incertezza

Supponiamo che un investitore decida di costruire un certo tipo di abitazione in un determinato luogo. L'investitore opera in condizioni di incertezza (opacità informativa) nel mercato immobiliare. Per farsi un'idea della situazione del mercato immobiliare al momento del completamento della costruzione, deve prendere in considerazione i prezzi degli immobili, la concorrenza nel mercato immobiliare, il rapporto tra domanda e offerta, i tassi di cambio e molto altro. Le statistiche mostrano che una delle componenti principali del costo degli alloggi è la sua posizione.

Si consideri un modello matematico di questa situazione. Abbiamo un gioco con la natura, dove il giocatore A è un investitore, la natura P è un insieme di possibili situazioni nel mercato immobiliare al momento del completamento della costruzione, da cui, ad esempio, cinque stati P1, P2, P3, P4, P5 della natura può essere formato. Le probabilità approssimative di questi stati sono note q1=p(П1)»0.30; q2=p(P2)»0,20; q3=p(P3)»0,15; q4=p(P4)»0,10; q5=p(P5)»0,25. Supponiamo che il giocatore A abbia quattro strategie (pure) A1, A2, A3, A4, che rappresentano la scelta di un luogo specifico dove costruire alloggi. Molti di questi luoghi sono limitati dalle decisioni urbanistiche, dal costo del terreno, ecc. L'attrattività di investimento del progetto è definita come la percentuale di crescita del reddito in relazione all'ammontare degli investimenti di capitale, la cui valutazione è nota per ogni strategia e ogni stato di natura. Questi dati sono presentati nella seguente matrice di payoff per il giocatore A:


dimensione 4 x 5, nell'ultima riga aggiuntiva di cui sono indicate le probabilità degli stati di natura. La matrice (24) non contiene righe dominate (in particolare duplicate) e tutti i suoi elementi sono positivi.

L'investitore dovrà scegliere un appezzamento di terreno in modo tale da sfruttare nel modo più efficiente gli investimenti di capitale.

Calcola gli indicatori di performance delle strategie

Con i criteri bayesiani, Germeier e di prodotto, a condizione che l'investitore A si fidi della data distribuzione di probabilità degli stati di natura,

secondo il criterio di Laplace, se l'investitore A non si fida della distribuzione di probabilità data degli stati di natura e non può privilegiare nessuno degli stati di natura considerati,

· secondo il criterio di Hodge-Lehman con un fattore di confidenza nelle probabilità degli stati di natura, ad esempio, l=0,4,

· secondo il criterio di Wald, criterio maximax, il criterio di pessimismo-ottimismo di Hurwitz con indicatore di ottimismo, ad esempio, l=0,6, e secondo il criterio di Hurwitz generalizzato con coefficienti, ad esempio, l1=0,35; l2=0,24; l3=0,19; l4=0,13; l5=0,09.

I risultati del calcolo degli indicatori di performance e delle strategie ottimali sono presentati nella tabella seguente:

Tabella degli indicatori di performance e delle strategie ottimali

Strategie

Criteri

Khodja-Leman

Germeiger

Lavori

Maxi-max

Hurwitz generalizzato con coefficiente

l1=0,35
l2=0,24
l3=0,19
l4=0,13
l5=0,09

Ottimale. strategie


Si noti che poiché, nel criterio di Hodge-Lehman, l'indicatore della fiducia del giocatore A nella distribuzione di probabilità degli stati indicati nell'ultima riga della matrice (24) è l=0,4, allora l'indicatore del pessimismo del giocatore A è 1-l =0,6.

Nel criterio di Hurwitz, l'indicatore di ottimismo del giocatore A è pari a l=0,4 e, di conseguenza, anche l'indicatore del suo pessimismo è pari a 1-l=0,6.

Nel criterio di Hurwitz generalizzato secondo la formula (23), l'indice di pessimismo

= 0,35+0,24+0,5×0,19=0,685

e, di conseguenza, l'indicatore di ottimismo l0=1-0,685=0,315.

Pertanto, in tutti i criteri applicati, tenendo conto delle manifestazioni individuali del giocatore A al pessimismo e all'ottimismo, il giocatore A è più propenso a una valutazione pessimistica della situazione che a una ottimistica, con all'incirca gli stessi indicatori.

Come risultato dell'applicazione di nove criteri, vediamo che la strategia ottimale A1 è 3 volte, la strategia A3 - 6 volte e la strategia A4 - 1 volta. Pertanto, se l'investitore A non ha obiezioni serie giustificate, la strategia A3 può essere considerata ottimale.

L'incertezza sullo stato del sistema può essere causata da due cose: mancanza di chiarezza, quando non si conoscono tutti gli stati possibili, e mancanza di certezza, quando tutti gli stati sono noti, ma non è possibile specificare esattamente quale si realizza.

L'incertezza implica anche l'assenza di informazioni sulla distribuzione di probabilità degli stati. In caso contrario, si riferisce a una situazione di rischio.

Come si possono prendere decisioni in una situazione di incertezza?

Se l'incertezza è causata da una mancanza di chiarezza, allora è quasi impossibile prendere una decisione oggettiva formalizzata. Non puoi valutare accuratamente le alternative quando non sai cosa potrebbe succedere. Pertanto, è necessario, se non eliminare l'incertezza, almeno ridurla a una mancanza di certezza. Questo può essere fatto in due modi:

esplorare il fenomeno che genera incertezza, saperne di più e identificare tutti i possibili stati,

· o accettare un'ipotesi che limiti l'insieme dei possibili stati (ad esempio, l'insieme di tutti gli stati conosciuti). Certo, una tale semplificazione incide sull'affidabilità delle decisioni prese, ma spesso è l'unica via d'uscita possibile.

Se l'incertezza è causata dall'incapacità di prevedere con precisione quale dei possibili stati si realizza, allora ci sono anche due modi:

- applicare metodi decisionali formalizzati in condizioni di incertezza, fornendo la scelta migliore basata solo sulle informazioni disponibili sugli esiti;

Oppure cerca di portare tutto a una situazione di rischio ottenendo informazioni sulla distribuzione probabilistica dei risultati attraverso ricerche o ipotesi. Diventa quindi possibile applicare metodi di decisione del rischio che diano risultati più equilibrati, a condizione che la distribuzione ipotizzata sia vicina a quella reale.

Uno dei metodi che consentono di prendere decisioni in condizioni di incertezza sono i cosiddetti "giochi" studiati nell'ambito della teoria matematica dei giochi. Fondamentalmente, ci sono due tipi principali di giochi di questo tipo:

giochi di strategia e

giochi con la natura.

L'apparato dei giochi strategici viene utilizzato per prendere decisioni nelle condizioni di interazione. Lì, l'incertezza è associata alle azioni di altre persone che cercano intenzionalmente di massimizzare il proprio guadagno. Il decisore non sa esattamente cosa faranno gli avversari. Tuttavia, può ragionevolmente presumere che scelgano consapevolmente le migliori strategie per se stessi e le peggiori per gli altri (incluso il nostro decisore). I metodi dei giochi strategici ti consentono di scegliere la strategia ottimale di fronte a tale opposizione.

Se non c'è opposizione intenzionale e l'incertezza è associata a circostanze oggettive (indipendenti dalla volontà di soggetti specifici), viene utilizzato l'apparato dei "giochi con la natura". Allo stesso tempo, "natura" non significa necessariamente natura animata o inanimata (biosfera, atmosfera, ecc.). Questo può essere il mercato o un altro insieme di soggetti che non sono in conflitto con il nostro decisore, ma semplicemente eseguono azioni per lui imprevedibili. Una tale "natura" è indifferente al guadagno o alla perdita del decisore e non cerca di volgere i suoi errori di calcolo a proprio vantaggio. Naturalmente, la logica del processo decisionale in tali condizioni è alquanto diversa dalla logica dei giochi strategici.

Consideriamo alcune disposizioni della teoria dei giochi.

La teoria dei giochi è la scienza che studia le decisioni strategiche di persone, aziende, governi e altri agenti.

Le decisioni strategiche sono quelle decisioni che vengono prese tenendo conto delle azioni di altri agenti e che influenzano l'utilità di altri agenti.

Le situazioni in cui le azioni di alcuni agenti influiscono su altri agenti, ovvero le situazioni in cui gli agenti prendono decisioni strategiche, sono chiamate interazioni (o giochi) strategiche. Gli agenti che partecipano a queste interazioni sono chiamati giocatori. I tipi di interazioni strategiche sono mostrati in fig. venti.

Riso. 20. Tipi di interazioni strategiche.

I giochi possono essere presentati in forma normale (matrice), quando le decisioni vengono prese simultaneamente, e in forma espansa (albero), quando le decisioni vengono prese in sequenza. Consideriamo entrambi i metodi.

Le condizioni di rischio e di incertezza sono caratterizzate dalle cosiddette condizioni di aspettative multivalore sulla situazione futura nell'ambiente esterno. In questo caso, il decisore deve fare una scelta di alternativa (Ai), non avendo un'idea precisa dei fattori ambientali e della loro influenza sul risultato. In queste condizioni, il risultato, il risultato di ciascuna alternativa è funzione di condizioni - fattori ambientali (funzione di utilità), che non sempre è in grado di prevedere il decisore. Presentare e analizzare i risultati delle strategie alternative selezionate, una matrice decisionale, detta anche matrice di pagamento, o gioco di matrici. Un esempio di matrice è riportato in Tabella. 2.

Tavolo 2

A1, A2, A3 - strategie d'azione alternative; S1, S2, S3 - lo stato dell'economia (stabilità, recessione, crescita, ecc.); E11; E12; E13; E21; …E33; ... sono i risultati delle decisioni.

I numeri nelle celle della matrice rappresentano i risultati dell'attuazione Eij della strategia Ai nelle condizioni Sj. Allo stesso tempo, in condizioni di rischio, è nota la probabilità di accadimento di Sj - wj(Sj). I metodi decisionali sotto rischio utilizzano la teoria della scelta, chiamata teoria dell'utilità. In accordo con questa teoria, il decisore sceglie Ai dall'insieme (Ai) (i = 1 … n) che massimizza il costo atteso della sua funzione di utilità E,j. In condizioni di rischio, quando si prende una decisione, il punto principale è determinare la probabilità di insorgenza dello stato dell'ambiente Sj, ovvero il grado di rischio. Dopo aver determinato la probabilità wj(Sj) del verificarsi dello stato dell'ambiente Sj, si determina il costo atteso di implementazione di ciascuna alternativa, che è il costo medio ponderato E(Ai):

Si noti che nei problemi decisionali che stiamo considerando, come risultati E ij considereremo gli indicatori che è desiderabile massimizzare: guadagno, reddito, profitto. Per loro si applica il principio "più è meglio è". Tutti i principi per la scelta dell'alternativa ottimale saranno formulati per tali indicatori.

Se nella matrice del gioco come risultati è necessario presentare indicatori soggetti a minimizzazione: perdite, spese, perdite, allora ci sono due modi possibili:

1) rappresentarli nella matrice come valori negativi. Quindi puoi utilizzare le formule riportate più avanti nel libro, operazioni di confronto e principi per determinare l'alternativa ottimale senza modifiche;

2) rappresentarli nella matrice come valori positivi. In questo caso è necessario modificare le formule riportate nel libro: operazioni di massimizzazione a minimizzazione e viceversa, operazioni di confronto nella determinazione delle alternative ottimali da "maggiore di" e "maggiore o uguale a" - a "minore di" e "minore o uguale a" e viceversa.

albero decisionale utilizzato quando è necessario prendere una serie coerente di decisioni. Un albero decisionale è un metodo grafico che permette di collegare punti decisionali, possibili strategie Ai, le loro conseguenze Ei,j con possibili fattori, condizioni ambientali. La costruzione di un albero decisionale inizia con una decisione precedente, quindi vengono rappresentate le possibili azioni e conseguenze di ciascuna azione (evento), quindi la decisione viene presa di nuovo (scelta della direzione dell'azione) e così via, fino a quando tutte le conseguenze logiche di i risultati sono esauriti. Un albero decisionale viene costruito utilizzando cinque elementi:

1. Il momento del processo decisionale.

2. Il punto in cui si è verificato l'evento.

3. Relazione tra decisioni ed eventi.

4. La probabilità che si verifichi l'evento (la somma delle probabilità in ogni punto deve essere uguale a 1).

5. Valore atteso (conseguenze) - un'espressione quantitativa di ciascuna alternativa, situata alla fine del ramo.

La decisione più semplice è scegliere tra due opzioni: "Sì" o "No" (Fig. 20).

Riso. 20. L'albero decisionale più semplice

Dopo che l'interazione strategica è stata formalmente descritta, cioè che il gioco è stato dato, questo gioco deve essere risolto. Cosa significa "risolvere il gioco"? Risolvere un gioco significa trovare un profilo di strategie da giocare. Allo stesso tempo, crediamo che i giocatori si comportino in modo razionale.

Quando si risolvono i giochi, possono essere applicati vari concetti di equilibrio, come ad esempio

1. L'equilibrio nelle strategie dominanti.

2. Equilibrio ottenuto eliminando le strategie dominate.

3. Equilibrio di Nash.

Consideriamo il primo caso.

Sia un gioco di n persone in forma normale, e sia (s 1 , . . . , s n) un profilo di strategie. Per ogni i = 1, . . . , n poniamo s− = (s 1 ,...,s i-1 ,s i+1 ,...,s n).

In altre parole, s -i è l'insieme delle strategie di tutti i giocatori, eccetto l'i-esimo, del profilo (s 1 ,...,s n). L'insieme di tutti i possibili insiemi di strategie per tutti i giocatori eccetto l'i-esimo sarà indicato con S -i .

Tabella A

Sia i = 2 (Tabella A). Quindi per qualsiasi profilo di strategia (s 1 , s 2) s -2 denota la strategia del primo giocatore s 1 . L'insieme S -2 in questo gioco ha la seguente forma: S -2 = (a 1 , a 2 ).

strettamente dominante, se per qualsiasi altra strategia dell'i-esimo giocatore s′ i ∈ S i e qualsiasi insieme di strategie s -i ∈ S -i dei giocatori rimanenti, la disuguaglianza

u io (s i , s -i) > ui(s′ i , s -i).

Per qualsiasi strategia di altri giocatori, la vincita che il giocatore i riceve giocando la strategia s i è maggiore della vincita che riceve giocando la strategia s′ i .

Nell'esempio della tabella A

· la strategia a 1 del primo giocatore è strettamente dominante, poiché, per qualsiasi strategia del secondo giocatore, porta al primo giocatore una vincita strettamente maggiore rispetto a qualsiasi altra sua strategia.

· la strategia b 1 del secondo giocatore è strettamente dominante, poiché per qualsiasi strategia del primo giocatore porta al secondo giocatore una vincita strettamente maggiore rispetto a qualsiasi altra sua strategia.

Viene chiamata la strategia dell'i-esimo giocatore s i ∈ S i debolmente dominante, se per qualsiasi altra strategia dell'i-esimo giocatore s′ i ∈ S i e qualsiasi insieme di strategie s -i ∈ S -i dei giocatori rimanenti, la disuguaglianza

u io (s io , s -i) ⩾ u io (s′ io , s -i).

Le strategie debolmente dominanti devono soddisfare una condizione leggermente più debole di quelle fortemente dominanti.

Se nella tabella A correggiamo il pagamento del secondo giocatore 2 per 7 (cella a 1, b 2), allora la strategia b 1 per il secondo giocatore non sarà più strettamente, ma debolmente dominante, poiché esiste un'altra strategia b 2 , il cui payoff è equivalente.

Viene richiamato il profilo della strategia (s 1 , . . . , s n). bilancia in strategie strettamente dominanti se per ogni giocatore i, i = 1, . . . , n, la strategia s i è strettamente dominante.

Nella tabella A, il profilo della strategia (a 1 ,b 1) è un equilibrio nelle strategie strettamente dominanti, poiché le strategie a 1 e b 1 sono strettamente dominanti.

Allo stesso modo, il profilo delle strategie (s 1 , . . . , s n) è chiamato equilibrio in strategie debolmente dominanti se per ogni giocatore i, i = 1, . . . , n, la strategia s i è debolmente dominante.

Se un giocatore ha una strategia strettamente dominante in qualche gioco, allora ci sono tutte le ragioni per credere che la giocherà: se gioca questa strategia, il suo guadagno sarà massimo. Ma i giochi in cui ogni giocatore ha una strategia strettamente dominante sono rari: l'equilibrio nelle strategie strettamente dominanti è un concetto di soluzione che non è adatto a tutti i giochi.

Si consideri un noto esempio di gioco − il dilemma del prigioniero.

Contesto: la polizia ha catturato due persone sospettate di aver commesso una rapina, ma non hanno prove sufficienti contro di loro. Per raccogliere prove, la polizia ha diviso i sospettati in diverse celle, privandoli dell'opportunità di scambiare informazioni, e disposto che ciascuno venisse interrogato.

Ogni giocatore ha due strategie:

fate silenzio

Fai un accordo con le indagini e consegna il tuo partner.

Pagamenti dei giocatori:

· se entrambi i prigionieri rimangono in silenzio, la polizia manderà ciascuno di loro in prigione con un articolo morbido per 1 anno.

· se un prigioniero tradisce il secondo e il secondo tace, allora colui contro il quale hanno testimoniato andrà in prigione per 10 anni e l'altro andrà libero.

· se entrambi i detenuti si accordano con le indagini, la polizia potrà accusare entrambi di aver commesso una rapina, ma ciascuno di loro sarà ridotto a 5 anni.

Matrice di gioco:

I giocatori hanno strategie dominanti?

Il primo prigioniero ha una strategia strettamente dominante: la strategia del "tradimento".

Anche il secondo prigioniero ha una strategia strettamente dominante: la strategia del "tradimento".

Il profilo della strategia (tradire, tradire) è un equilibrio nelle strategie strettamente dominanti. Inoltre, l'equilibrio nelle strategie debolmente dominanti.

Il profilo strategico s è detto Pareto-dominante se il profilo strategico s′ è:

u i (s) ⩾ u i (s′) per qualsiasi giocatore i;

u i (s) > u i (s ) per almeno un giocatore i.

Viene chiamato il profilo della strategia s∗ Pareto ottimale, se non esiste tale profilo s′, che Pareto-domina s∗. Il profilo di equilibrio (tradire, tradire) Pareto è ottimale? Non! Il suo profilo dominato da Pareto (Silenzio, Silenzio): se entrambi i giocatori rimanessero in silenzio, ciascuno riceverebbe un guadagno maggiore rispetto all'equilibrio. Altri profili di strategie sono Pareto-ottimali? Sì. L'equilibrio del dilemma del prigioniero è l'unico profilo strategico che non è Pareto ottimale!

Consideriamo ora l'equilibrio di eccezioni strategie rigorosamente (o debolmente) dominate.

2) La strategia s i del giocatore i domina rigorosamente la strategia s′ i del giocatore i if

u i (s i , s -i) > u i (s′ i , s -i) per qualsiasi insieme di strategie di altri giocatori s -i ∈ S -i .

2) La strategia s i del giocatore i è strettamente dominata dalla strategia s′ i del giocatore i if

tu io (s io , si-i)< u i (s′ i , s -i) для любого набора стратегий остальных игроков s -i ∈ S -i .

Notazione: s i ≺ s′ i .

3) La strategia s i del giocatore i domina debolmente la strategia s′ i del giocatore i if

u i (s i , s -i) ⩾ u i (s′ i , s -i) per qualsiasi insieme di strategie di altri giocatori s -i ∈ S -i .

4) La strategia s i del giocatore i è debolmente dominata dalla strategia s′ i del giocatore i if

u i (s i , s -i) ⩽ ui(s′ i , s -i) per qualsiasi insieme di strategie di altri giocatori s -i ∈ S -i .

Notazione: s i ≼ s′ i .

Una strategia s i del giocatore i si dice fortemente dominata se esiste una strategia s′ i del giocatore i che domina rigorosamente la strategia s i .

Una strategia si del giocatore i si dice debolmente dominata se esiste una strategia s′ i del giocatore i che domina debolmente la strategia s i .

Se un giocatore ha una strategia rigorosamente dominata, allora, essendo razionale, non la giocherà mai: ovviamente gli porterà meno di altre sue strategie, che può anche giocare. Entrambi i giocatori capiscono che una strategia rigorosamente dominata non verrà giocata in nessun caso, quindi nella rappresentazione a matrice del gioco possiamo escludere la colonna o la riga corrispondente a questa strategia.

Considera il gioco

1. Elimina la strategia b 1 poiché b 2 ≺ b 3 .

2. Elimina la strategia a 1 poiché a 1 ≺ a 2 .

3. Eliminare la strategia b 3 , poiché b 3 ≺ b 1 .

Il profilo rimanente (a 2 , b 1) è l'equilibrio ottenuto eliminando strategie fortemente dominate.

Se nel gioco finale (se l'insieme delle possibili strategie del giocatore è finito) in forma normale, a seguito dell'eliminazione sequenziale di strategie fortemente dominate, rimane una matrice di dimensione 1 × 1, allora il profilo rimanente è chiamato equilibrio ottenuto eliminando strategie fortemente dominate.

Notare che:

· non tutti i giochi possono essere risolti per esclusione successiva di strategie strettamente dominate;

· l'ordine di esclusione delle strategie strettamente dominate non importa – non importa in quale ordine escludiamo tali strategie, di conseguenza arriveremo allo stesso profilo;

· escludendo strategie debolmente dominate in un ordine diverso, otterremo equilibri diversi;

· se il gioco ha un equilibrio in strategie strettamente dominanti, allora è anche un equilibrio ottenuto eliminando strategie strettamente dominate;

· l'equilibrio ottenuto escludendo le strategie fortemente dominate non è necessariamente un equilibrio nelle strategie strettamente dominanti.

equilibrio di Nashè un altro tipo di equilibrio che può essere ottenuto nella matrice del gioco.

Un profilo (s∗ 1 ,..., s∗ n) è detto equilibrio di Nash (NE) se per un qualsiasi giocatore i e una qualsiasi delle sue strategie s i ∈ S i la disuguaglianza

u io (s∗ io , s∗ -i) ≥ u io (s io , s∗ -i).

In altre parole, equilibrio di Nashè un tale profilo di strategie che non è redditizio per nessuno dei giocatori deviare e giocare un'altra strategia con strategie fisse di altri giocatori.

L'equilibrio di Nash prende il nome dal famoso matematico John Nash, vincitore nel 1994 del Premio Nobel per l'Economia "per la sua analisi dell'equilibrio nella teoria dei giochi non cooperativi" (insieme a Reinhard Selten e John Harsanyi).

Possiamo formulare un algoritmo per trovare equilibri di Nash in giochi finiti a due giocatori:

1. Per ogni strategia del secondo giocatore, segna con dei punti le migliori risposte del primo giocatore.

2. Per ogni strategia del primo giocatore, segna con asterischi le migliori risposte del secondo giocatore.

3. I profili che risultano essere contrassegnati sia da punti che da asterischi sono gli equilibri di Nash.

Esempio: gioco “Battaglia dei sessi”

Allestimento del gioco. Marito e moglie decidono autonomamente dove andare la sera: calcio o balletto. Non c'è comunicazione tra loro, quindi nessuno dei due può scoprire nulla su dove l'altro ha deciso di andare. Le preferenze degli sposi sono tali che la sera vorrebbero essere in un posto, ma alla moglie piace di più il balletto e il marito preferisce il calcio. È meglio per un marito stare con la moglie al balletto che al calcio da solo. È meglio che una moglie vada a giocare a calcio con il marito che a ballare da sola.

Ogni coniuge può scegliere tra 2 strategie: andare al calcio (F) o andare al balletto (B). Le preferenze dei coniugi possono essere impostate utilizzando la seguente matrice di pagamento:

In risposta alle diverse strategie della moglie, è utile che il marito metta in atto strategie diverse. Lo stesso vale per la moglie.

Nella nostra matrice dei guadagni, abbiamo due celle in cui la scelta migliore del marito per la strategia di una moglie fissa ha coinciso con la scelta migliore della moglie per la strategia di un marito fisso.

I profili delle strategie (F, F) e (B, B) sono in un certo senso migliori dei profili delle strategie (F, B) e (B, F). Se marito e moglie erano insieme a un calcio o un balletto, non è redditizio per nessuno dei coniugi andare individualmente in un altro posto con la decisione invariata del secondo di rimanere. Se i coniugi sono finiti in luoghi diversi la sera, è vantaggioso per ciascuno di loro deviare dalla strategia inizialmente scelta.

Pertanto, i profili di strategia (F, F) e (B, B) da noi ottenuti sono equilibri di Nash.

5.3. Metodi per la scelta di alternative in condizioni di rischio e incertezza.
Criteri di selezione delle decisioni

In una situazione di incertezza, ci sono diversi stati possibili e diverse alternative per loro forniscono diversi guadagni. Cioè, abbiamo diverse alternative, ognuna delle quali è un insieme di valori di risultato per i corrispondenti stati di natura. Questi insiemi non possono essere semplicemente confrontati matematicamente "nel complesso" utilizzando i concetti di "maggiore-meno". Tale operazione può essere eseguita solo con i singoli membri di questi set.

Se tra le alternative non ci sono quelle strettamente o debolmente dominanti, ciò significa che in diversi stati di natura, diverse alternative mostrano il miglior risultato. Come possono essere confrontati questi insiemi di valori e come scegliere quello ottimale? Qui il cosiddetto Criteri di scelta o solo criteri.

L'idea principale di qualsiasi criterio è sostituire un intero set di valori con un indicatore numerico che caratterizza questo set da un certo punto di vista, quindi confrontare semplicemente questi indicatori numericamente tra loro. Per quale insieme questo indicatore numerico risulta essere "migliore" (più o meno - dipende dal tipo di criterio e dalla situazione), quello sarà considerato ottimale secondo tale criterio.

L'idea è semplice ma efficace. Tuttavia, uno svantaggio significativo di qualsiasi criterio è la "perdita di informazioni". A causa della "compressione" dell'intero insieme di valori in un unico numero, alcune proprietà (caratteristiche) dell'insieme diventano visibili e altre non sono visibili.

È come giudicare una persona solo in base al principio (cioè il criterio) "cattivo" o "buono". Qui tutte le qualità, i tratti caratteriali, i punti di vista di una persona sono descritti in una parola. È facile da ricordare, ma non ci sono informazioni dettagliate qui. Inoltre, potrebbe essere distorto. In primo luogo, non tutte le qualità di una persona cattiva possono essere peggiori di una buona (può essere più sano o anche più intelligente). In secondo luogo, il significato di "cattivo" o "buono" corrisponde al punto di vista di un particolare soggetto o gruppo che ha valutato una persona in base alla propria soggettività. E, molto probabilmente, altre persone hanno i propri approcci per assegnare il significato di "cattivo" o "buono". Pertanto, tale valutazione non è accurata e universale.

Generalmente procedura per l'applicazione del criterio come segue:

1) nella prima fase si seleziona il criterio in base al quale verrà effettuata la scelta;

2) per ciascuna alternativa viene calcolato il valore del criterio prescelto. Ad ogni alternativa, infatti, viene assegnato un valore numerico del criterio (la sua valutazione quantitativa);

3) le alternative vengono confrontate mediante la consueta comparazione numerica dei valori dei criteri ad esse corrispondenti;

4) in base ai risultati del confronto, l'alternativa con il miglior valore del criterio è riconosciuta come ottimale. Ciò che è considerato "migliore" - il valore massimo o minimo del criterio - dipende da ciò che mostrano i risultati delle alternative (profitto, guadagno o perdita, spese), e da quale criterio viene effettuato il confronto.

Considera sei criteri principali che possono essere utilizzati quando si confrontano le alternative in una situazione di incertezza:

il criterio di Wald;

Criterio di "maximax";

il criterio di Laplace;

· Il criterio del selvaggio;

il criterio di Hurwitz;

· criterio di Hurwitz generalizzato.

criterio Waldè il più "cauto". Secondo lui, l'alternativa ottimale è quella che fornisce il miglior risultato tra tutte le alternative possibili nelle peggiori circostanze.

Se i risultati riflettono indicatori da ridurre al minimo (perdite, spese, perdite, ecc.), il criterio Wald si concentra su "minima"(minimo tra i valori massimi di perdita di tutte le alternative).

Se i risultati delle alternative includono indicatori di profitto, reddito e altri indicatori che devono essere massimizzati (secondo il principio "più è, meglio è"), allora "massimo" vincite (massimo tra le vincite minime). Qui e di seguito, per tutti i criteri nel testo, considereremo proprio un caso del genere quando il risultato mostra un certo vantaggio.

Secondo il criterio Wald, la stima io -esima alternativa è il suo guadagno più piccolo:

W io = min( xij), j = 1..M

L'alternativa con il massimo peggior payoff è considerata ottimale:

A* = A k , W k = max( Wi), io = 1..N

Un esempio di applicazione del criterio di Wald

Ci sono due progetti X 1 e X 2 , che in tre possibili scenari di sviluppo della regione ( j=1..3) fornire profitti diversi. I valori di profitto sono mostrati nella Tabella 2.2. Devi selezionare un progetto da implementare.

Tabella 3

Dati iniziali

Se la scelta del progetto ottimale viene effettuata secondo il criterio Wald, il decisore deve eseguire le seguenti azioni:

1. Trova minimo risultati per ciascuna alternativa. Questi saranno i valori del criterio Wald:

V 1 = min (x 1j), j = 1..3 => W 1 = min (45, 25, 50) = 25

V2 = min (x 2j), j = 1..3 => W 2 = min (20, 60, 25) = 20

2. Confronta i valori del criterio Wald e trova il valore più grande. Alternativa con il valore massimo del criterio saranno considerati ottimali:

25 > 20 => W 1 > W 2 => X* = X 1

Se la decisione è stata presa solo secondo il criterio Wald, il decisore ha scelto il progetto per l'attuazione X 1 , poiché il profitto che questo progetto fornirà nello scenario peggiore è maggiore.

Scegliendo l'alternativa ottimale secondo il criterio di Wald, il decisore si garantisce che, nelle peggiori circostanze possibili, non riceverà meno del valore del criterio. Pertanto, viene anche chiamato questo indicatore criterio di risultato garantito.

Il problema principale del criterio Wald è il suo eccessivo pessimismo e, di conseguenza, non sempre un risultato logico. Quindi, ad esempio, quando si sceglie secondo questo criterio tra le alternative A(100; 500) e B(90; 1000) dovrebbe optare per l'opzione UN . Tuttavia, nella vita reale sarebbe più logico scegliere V , perché nel peggiore dei casi V solo un po' peggio UN , mentre in buone circostanze V fornisce molto più guadagno.

L'opposto diametralmente del criterio Wald è il cosiddetto criterio "maximax". Se Wald rifletteva il punto di vista del pessimista definitivo, allora "massimo" corrisponde a un atteggiamento di estremo ottimismo. Tutta l'attenzione è rivolta solo ai migliori risultati, quindi la valutazione io -l'ultima alternativa secondo questo criterio è il suo massimo profitto M io :

M io = max (x ij), j = 1..M

L'alternativa ottimale è quella con il payoff più alto:

Х* = Х k , М k = max( M io), io = 1..N

Un esempio di applicazione del criterio "massimo".

Nelle condizioni dell'esempio della tabella. Le 3 azioni del decisore che utilizzano il criterio "maximax" per prendere una decisione saranno le seguenti:

1. Trova massimo risultati per ciascuna alternativa:

M 1 = max (x 1j), j = 1..3 => M 1 = max (45, 25, 50) = 50

M2 = max (x 2j), j = 1..3 => M 2 = max (20, 60, 25) = 60

2. Confronta i valori trovati e determina l'alternativa con massimo valore del criterio:

50 < 60 =>M1< М 2 =>X* = X2

Secondo il criterio "maximax", il progetto è ottimale X 2 ., che può fornire il massimo profitto nelle migliori circostanze.

Il criterio "massimo" non tiene conto di altri risultati oltre al migliore. Pertanto, la sua applicazione, in primo luogo, può essere molto pericolosa e, in secondo luogo, proprio come il criterio Wald, può portare a decisioni illogiche. Ad esempio, tra le alternative A(-100; 0; 500) e B(200; 300; 400) dalla posizione di "maximax" il migliore è UN , tuttavia, comporta anche il rischio di perdita ( -100 ), e in generale, tutti i risultati, tranne il migliore, sono molto inferiori V . Pertanto, l'applicazione pratica del criterio del "massimo" è molto limitata.

Si basa sul criterio di Laplace principio di insufficiente giustificazione. Poiché nell'ambito dell'approccio informativo in una situazione di incertezza le probabilità degli stati sono sconosciute, non vi è motivo di affermare che siano differenti. Pertanto, possiamo presumere che siano la stessa cosa.

Di Criterio di Laplace il payoff medio viene utilizzato come stima dell'alternativa:

L'alternativa ottimale è quella con il payoff medio massimo:

Х* = Хk , Lk = max( L io), io = 1..N

Un esempio di applicazione del criterio di Laplace

Per le condizioni dell'esempio dalla tabella. 3 utilizzando il criterio di Laplace sarebbe simile a questo:

1. Trova media il valore dei risultati per ogni progetto. È una stima dell'alternativa con il criterio di Laplace:

L 1 \u003d (x 11 + x 12 + x 13) / 3 \u003d (45 + 25 + 50) / 3 \u003d 40

L 2 \u003d (x 21 + x 22 + x 23) / 3 \u003d (20 + 60 + 25) / 3 \u003d 35

2. Confronta i valori calcolati e trova un'alternativa con massimo valore del criterio:

40 > 35 => L 1 > L 2 => X* = X 1

Secondo il criterio di Laplace, il progetto è ottimale X 1 che ha il profitto medio più alto.

Significareè una misura abbastanza diffusa in condizioni di incertezza e persino di rischio, ma non tiene conto della diffusione dei risultati rispetto a questo valore. Quindi, per esempio, alternative A(400; 600) e B(0; 1000) sono equivalenti per il criterio di Laplace (L A = L B = 500) , ma l'alternativa V più "rischioso", in quanto implica la possibilità di non ottenere nulla in cattive circostanze.

Il criterio di Savage è alquanto diverso da tutti gli altri. Le alternative sono valutate non dalla matrice originale, ma dalla cosiddetta "matrice di rimpianti" o, come viene chiamato anche in alcune fonti, "matrice di rischio".

Per un'alternativa arbitraria e un particolare stato di natura, il valore del "rimpianto" è uguale alla differenza tra ciò che fornisce l'alternativa data e quanto si può vincere in uno stato dato. Da un punto di vista economico, il valore del "rimpianto" può essere interpretato come un mancato guadagno (o mancato guadagno) rispetto al massimo possibile in un determinato stato di natura.

Considera come scegliere l'alternativa migliore, guidato dal criterio Savage.

La scelta della strategia ottimale in condizioni di rischio e incertezza implica la considerazione di vari criteri di ottimalità, sviluppati nell'ambito del cosiddetto "giocare con la natura". Questo modello presuppone l'azione consapevole di un solo partecipante - il cosiddetto "giocatore", che nell'analisi dell'investimento è un investitore, nei limiti della sua realtà oggettiva incontrollata. Allo stesso tempo, il termine "natura" descrive un insieme di fattori oggettivi che cambiano indipendentemente dal desiderio del giocatore-investitore, ma hanno un'influenza decisiva sulla sua decisione di investimento. Nell'analisi degli investimenti, questo è lo stato del mercato degli investimenti .

L'investitore ha una stima predittiva delle possibili combinazioni di questi fattori (condizioni del mercato degli investimenti (P.)), che si verificano in modo casuale, indipendentemente dalle sue azioni. In alcuni casi, le previsioni possono contenere una stima delle probabilità di accadimento di tali stati (p), la cui somma per tutte le possibili opzioni per lo sviluppo della situazione dell'investimento è pari a 1.

L'investitore sviluppa opzioni per possibili strategie di investimento (A) e valuta il possibile ritorno sull'investimento per ciascuna strategia e per ciascuna variante dello stato del mercato degli investimenti

Sulla base di queste informazioni si può formare la cosiddetta matrice dei payoff (tabella 11.1).

Tabella 11.1

Matrice dei guadagni

La differenza tra la vincita massima di un giocatore in un dato stato di natura (max (u])) e la vincita di una certa strategia di comportamento del giocatore che può essere implementata in questo stato di natura è chiamata rischio della strategia A. allo stato di natura P:

mu = maxC ^) _ ar]. (11.1)

Pertanto, il rischio fa parte del più grande reddito da investimento in un determinato stato del mercato degli investimenti, che l'investitore non riceve in caso di utilizzo di una strategia di investimento imperfetta.

Per i rischi, puoi costruire una matrice di rischio simile nella forma alla matrice di payoff.

L'investitore ha il compito di scegliere quella ottimale tra le tante possibili strategie di investimento.

Per selezionare la strategia di investimento ottimale in una situazione di incertezza (quando le probabilità non sono note), vengono utilizzati i seguenti criteri:

Criterio Maximx - un criterio di estremo ottimismo, secondo il quale viene scelta una strategia di investimento che fornisce il massimo guadagno (reddito) tra tutti i massimi guadagni allocati per ciascuno dei possibili stati del mercato degli investimenti;

Il criterio di Wald è il cosiddetto "criterio pessimista", secondo il quale si presume che ogni decisione dovrebbe avere conseguenze peggiori, e, quindi, è necessario trovare una tale opzione in cui il risultato peggiore sarà relativamente meglio di altri cattivi risultati. Cioè, si trova il risultato peggiore per ogni stato del mercato degli investimenti e quindi viene selezionata la strategia di investimento con il miglior risultato tra di loro;

Il criterio Savage è un criterio di rischio minimax, simile al criterio Wald, ma prevede l'analisi della scelta in base ai dati della matrice di rischio;

Il criterio di Hurwitz è un criterio massimo-massimo, secondo il quale, nella scelta di una strategia di investimento, raccomanda di scegliere un'alternativa con il massimo risultato medio (in questo caso, esiste un'ipotesi tacita sulla stessa probabilità di accadimento per tutti i possibili stati del mercato degli investimenti).

I seguenti criteri vengono utilizzati per selezionare la strategia ottimale in condizioni di rischio:

Criterio di aspettativa matematica - prevede la selezione di una strategia di investimento per la quale il guadagno medio ponderato per la probabilità (aspettativa del guadagno, M) è il massimo:

mg = Xa, o Pj-> max; (11.2)

Il criterio di Laplace è un criterio per massimizzare la media ponderata dell'ottimalità della strategia, secondo il quale, con circa la stessa probabilità di accadimento degli eventi, la strategia ottimale è quella per cui il guadagno totale su tutti i possibili stati dell'investimento l'ambiente è massimo. È questo criterio che sta alla base della valutazione comparativa dell'efficacia dei progetti secondo il criterio del valore attuale netto.

La scelta finale della strategia di investimento ottimale viene effettuata sulla base della sintesi dei risultati della valutazione secondo i criteri sopra indicati. Allo stesso tempo, è consigliabile accettare per l'attuazione una strategia ottimale secondo la maggior parte dei criteri.