Teorema del minimax

Da testwiki.
Versione del 19 mar 2025 alle 23:59 di imported>YsaccZenga (growthexperiments-addlink-summary-summary:3|0|0)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Vai alla navigazione Vai alla ricerca

Il teorema del minimax è dovuto a von Neumann[1][2]. Il teorema del minimax fornisce condizioni sufficienti affinché la disuguaglianza max-min

maxy𝐾2minx𝐾1f(x,y)minx𝐾1maxy𝐾2f(x,y).

sia un’uguaglianza.

Il teorema costituisce non solo il punto di inizio della teoria dei giochi, ma altresì un teorema della dualità per i problemi di programmazione lineare laddove la regione ammissibile è convessa e compatta (chiusa e limitata).

Enunciato

Sia f:𝐾1×𝐾2 una funzione continua dove 𝐾1n e 𝐾2m sono insiemi convessi compatti. Se f è una funzione convessa-concava, ossia tale che

f(,y):𝐾1 è convessa per y fissato e
f(x,):𝐾2 è concava per x fissato,

allora

minx𝐾1maxy𝐾2f(x,y)=maxy𝐾2minx𝐾1f(x,y).

Esempi

  • Nella teoria dei giochi per un gioco finito a somma zero a due giocatori con un numero finito n di strategie (c.d. giochi simmetrici), è facile pensare alla funzione di pagamento f:S1×S2 come ad una forma bilineare alternante la cui proprietà di alternanza f(s1,s2)=f(s2,s1) matematizza la contrapposizione totale dei due giocatori, ossia il fatto che la somma dei pagamenti sia zero. Indicato con S1 e S2 l’insieme delle strategie pure dei due giocatori e ponendo
f1(s1,s2):=f(s1,s2)
f2(s1,s2):=f(s2,s1)
si ottiene la definizione di gioco a somma zero:
f1(s1,s2)+f2(s1,s2)0 per ogni s1S1 e per ogni s2S2
Nei giochi finiti è immediato constatare che i due insiemi S1 e S2 risultano essere compatti poiché sono finiti e dunque privi di punti di accumulazione. Le funzioni dei pagamenti fi risultano definite su insiemi privi di punti di accumulazione, insiemi dunque costituiti dai soli punti isolati, punti cioè in cui le due funzioni fi risultano essere continue (di più uniformemente continue). In merito alla richiesta che i due insiemi S1 e S2 siano convessi è sufficiente considerarne il politopo (involucro convesso) una volta introdotto il concetto di strategia mista come una ennupla non negativa di numeri (s~1,,s~n) tali che s~1+...+s~n=1. Il dominio di variazione delle strategie miste è più esteso di quello delle strategie pure: per queste ultime infatti il dominio è un semplice insieme finito di n ennuple ordinate, mentre le strategie miste sono definite su un sottoinsieme dello spazio vettoriale di dimensione n costituito da tutte le combinazioni lineari convesse delle n strategie pure e come tale risulta convesso ed avente dimensione finita pari a n+1. L’inviluppo convesso è compatto perché è costruito sull’insieme compatto delle strategie pure. Se f1(,s~2) risulta essere convessa rispetto a s~1 per s~2 fissato e poiché f1=f2, allora f2(s~1,) risulta essere concava rispetto a s~2 per s~1 fissato, sicché le condizioni del teorema del minimax risultano soddisfatte.
  • Il valore di un gioco simmetrico a somma zero a due giocatori esteso a strategie miste presenta valore pari a zero[3]. Il valore di un gioco per definizione è
mins~1maxs~2f(s~1,s~2)=v*=maxs~2mins~1f(s~1,s~2)
Si consideri dapprima la parte sinistra delle due eguaglianze appena scritte v*=mins~1maxs~2f(s~1,s~2), per ipotesi è f(s~1,s~2)=f(s~2,s~1) dunque
v*=mins~1maxs~2f(s~1,s~2)=mins~1maxs~2[f(s~2,s~1)]=maxs~1mins~2f(s~2,s~1).
Poiché l'insieme delle strategie per i due giocatori sono identiche S1=S2, scambiando s~1 con s~2 si ottiene
maxs~1mins~2f(s~2,s~1)=maxs~2mins~1f(s~1,s~2)=v*.
Per confronto risulta v*=v* e quindi necessariamente il valore del gioco è v*=0.
  • La matrice associata alla funzione dei pagamenti f è una matrice antisimmetrica e presenta quali elementi della diagonale principale solo zeri in quanto da f(s1,s2)=f(s2,s1) per ogni s1,s2 segue immediatamente che è f(s1,s1)=0 per ogni s1 una volta scelto s1=s2.

Il teorema del min-max e la programmazione convessa

Il teorema alla base dei giochi antagonisti può essere preso come punto di unione tra la teoria della dualità ed i problemi di programmazione convessa, in particolare quelli di programmazione lineare. Le coppie di problemi constitute dal problema primale e dal suo problema duale sono infatti strettamente legate al problema di determinare i punti di sella (𝐱,𝐲) della funzione lagrangiana (𝐱,𝐲). Se 𝐱 è soluzione del problema primale di massimizzazione e se 𝐲 è soluzione del problema duale di minimizzazione allora il valore all'ottimo della funzione lagrangiana del problema primale, maxmin, coincide con il valore all'ottimo della funzione lagrangiana del problema duale, minmax. In altri termini vale la relazione di dualità:

maxx𝐾1miny𝐾2(𝐱,𝐲)=(𝐱,𝐲)=miny𝐾2maxx𝐾1(𝐱,𝐲)

In generale almeno uno dei due insiemi 𝐾1 o 𝐾2 è un insieme illimitato, dunque non è compatto: ciò costituisce il motivo per cui il teorema di von Neumann non è largamente applicato nella programmazione convessa[4].

Esempio

In un generico gioco a somma zero a due persone per il giocatore massimizzante si ha il problema primale seguente:

maxx𝐾1v

soggetto ai vincoli:

{j=1nai,jxjvi=1,...,mj=1nxj=1xj0j=1,...,n

La funzione lagrangiana associata a questo problema è:

(𝐱,𝐲)=v+𝐲,A𝐱𝐯

dove 𝐯=(v,,v), mentre 𝐲=(y1,,ym) rappresentano i moltiplicatori di lagrange e costituiscono le strategie miste del giocatore avversario.

Osservato che la funzione lagrangiana (𝐱,𝐲)=v+𝐲,A𝐱𝐯 risulta essere una funzione convessa nella variabile 𝐱 sull'insieme 𝐾1={xn|j=1nxjαj|αj=1,j=1nxj=1,xj0j}, che la lagrangiana (𝐱,𝐲) è chiaramente una funzione lineare in 𝐲, dunque risulta essere banalmente concava in 𝐲 in quanto ogni funzione lineare è sia concava che convessa e che i due insiemi 𝐾1 e 𝐾2 sono compatti, si deduce che la relazione di dualità

maxx𝐾1miny𝐾2(𝐱,𝐲)=miny𝐾2maxx𝐾1(𝐱,𝐲)

è diretta conseguenza del teorema del minimax.

La formulazione esplicita del problema duale si ottiene considerando

miny𝐾2maxx𝐾1(𝐱,𝐲)

Dapprima si massimizza la lagrangiana per 𝐲 fisso e 𝐱 variabile in 𝐾1

maxx𝐾1(𝐱,𝐲)=maxx𝐾1[v𝐲,𝐯+𝐲,A𝐱]

Essendo j=1nxj=1 si può scrivere v=v1=v(j=1nxj)˙=vx1++vxn=𝐯,𝐱 dove 𝐯=(v,,v). Ricordato che 𝐲,A𝐱=At𝐲,𝐱 si ottiene

maxx𝐾1[𝐲,𝐯+𝐯,𝐱+At𝐲,𝐱]=𝐲,𝐯+maxx𝐾1[𝐯+At𝐲,𝐱].

Poiché xj0 per tutti i j da 1 a m, si avrà 𝐯+At𝐲,𝐱>0 se 𝐯+At𝐲>0 oppure 𝐯+At𝐲,𝐱0 se 𝐯+At𝐲0.

Dunque si ha:

miny𝐾2maxx𝐾1(𝐱,𝐲)=miny𝐾2[𝐲,𝐯]=miny𝐾2v per 𝐯+At𝐲0

ed il problema duale presenta la formulazione seguente:

miny𝐾2v

soggetto ai vincoli:

{i=1mai,jyivj=1,...,ni=1myi=1yi0i=1,...,m

Posto v~=v si ha

miny𝐾2v~
{At𝐲v~i=1myi=1yi0i=1,...,m

Note

Template:Portale