Metodo dei moltiplicatori di Lagrange

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:Doppia immagine

In analisi matematica e programmazione matematica, il metodo dei moltiplicatori di Lagrange permette di ottenere i punti stazionari di una funzione f(𝐱) in I variabili e J vincoli di frontiera 𝐠(𝐱)=𝟎, detta obiettivo, tramite una terza funzione in I+J variabili non vincolata, detta lagrangiana:

Λ(𝐱,λ)=f(𝐱)+λ𝐠(𝐱)=f(𝐱)+j=1Jλjgj(𝐱),

introducendo tante nuove variabili scalari λj, dette moltiplicatori, quanti sono i vincoli.

Se 𝐱* è stazionario, per esempio un massimo, per il problema vincolato originario, allora esiste un λ* tale che (𝐱*,λ*) è stazionario anche se non necessariamente dello stesso tipo, cioè nell'esempio un massimo, per la lagrangiana. Non tutti i punti stazionari portano a una soluzione del problema originario. Quindi il metodo dei moltiplicatori di Lagrange fornisce una condizione necessaria, ma non sufficiente per l'ottimizzazione nei problemi vincolati.[1]

Introduzione

Si consideri il caso bidimensionale. Si vuole massimizzare una f(x,y) soggetta al vincolo:

g(x,y)=c,

ove c è una costante. Si possono visualizzare le curve di livello[2] della f date da

f(x,y)=dn

per vari valori di dn, e le curve di livello della g date da g(x,y)=c.

Si supponga di camminare lungo la curva di livello con g=c. In generale le curve di livello della f e della g sono distinte, quindi la curva di livello per g=c può intersecare le curve di livello della f. Questo equivale a dire che mentre ci si muove lungo la curva di livello per g=c il valore della f può variare. Solo quando la curva di livello per g=c è tangente a una delle curve di livello della f (senza attraversamento), il valore di f non aumenta né diminuisce. Nelle equazioni questo succede quando il gradiente della f è perpendicolare al vincolo (o ai vincoli) ovvero quando f è una combinazione lineare dei gi.

Introducendo lo scalare incognito λ, si deve dunque risolvere il sistema di equazioni:

x[f(x,y)+λ(g(x,y)c)]=0;
y[f(x,y)+λ(g(x,y)c)]=0;
λ[f(x,y)+λ(g(x,y)c)]=g(x,y)c=0.

Differenze tra massimi, minimi e punti di sella

Le soluzioni sono punti stazionari della lagrangiana Λ e possono essere anche punti di sella, ossia né massimi né minimi di Λ o F.

La funzione Λ è illimitata: dato un punto (x,y) che non giace sul vincolo, facendo il limite per λ± si rende Λ arbitrariamente grande o piccola.

Spiegazione analitica

Sia l'obiettivo f una funzione definita su n, e siano i vincoli dati da gj(x)=0 (ottenuti da un'equazione del tipo hj(x)=cj con gj(x)=hj(x)cj). Si definisca la lagrangiana Λ come:

Λ(𝐱,λ)=f+jλjgj.

Sia il criterio di ottimizzazione sia i vincoli gj sono compresi in modo compatto come punti stazionari della lagrangiana:

𝐱Λ=0𝐱f=jλj𝐱gj,

nei gradienti delle funzioni originarie, e

λΛ=0𝐠=𝟎.

Spesso i moltiplicatori di Lagrange sono interpretabili come una certa quantità interessante. Si osservi ad esempio che:

Λgj=λj.

Il valore di λj è interpretabile come la velocità con cui cambia la quantità da ottimizzare come funzione della variabile vincolata. Per esempio, nella meccanica lagrangiana le equazioni del moto sono ottenute trovando i punti stazionari dell'azione, l'integrale nel tempo della differenza tra energia cinetica e potenziale. Dunque la forza su una particella dovuta a un potenziale scalare, 𝐅=V può essere interpretata come un moltiplicatore di Lagrange che determina il cambiamento dell'azione (trasferimento di energia potenziale in energia cinetica) conseguente a una variazione della traiettoria vincolata della particella. In economia, il profitto ottimale per un giocatore è calcolato in base a uno spazio di azione vincolato, dove un moltiplicatore di Lagrange indica il rilassamento di un dato vincolo, ad esempio attraverso la corruzione o altri mezzi.

Il metodo dei moltiplicatori di Lagrange è generalizzato dalle condizioni di Karush-Kuhn-Tucker.

Esempi

Esempio 1

Figura 3. Illustrazione del problema di ottimizzazione vincolata.

Si voglia massimizzare f(x,y)=x+y col vincolo x2+y21=0. Il vincolo è la circonferenza unitaria, e le curve di livello dell'obiettivo sono rette con pendenza 1: si vede subito graficamente che il massimo viene raggiunto in (2/2,2/2) e il minimo viene raggiunto in (2/2,2/2).

Analiticamente, ponendo g(x,y)=x2+y21, e

Λ(x,y,λ)=f(x,y)+λg(x,y)=x+y+λ(x2+y21).

Annullando il gradiente si ottiene il sistema di equazioni:

{Λx=1+2λx=0,(i)Λy=1+2λy=0,(ii)Λλ=x2+y21=0.(iii)

La derivata rispetto al moltiplicatore è il vincolo originario.

Combinando le prime due equazioni si ottiene:

1+2λx=1+2λy,

cioè x=y (x0 altrimenti la (i) diventa 1=0). Sostituendo nella (iii) si ottiene 2x2=1, cosicché x=±2/2 e i punti stazionari sono (2/2,2/2) e (2/2,2/2). Valutando l'obiettivo x+y su questi si ottiene:

f(2/2,2/2)=x+y=2 e f(2/2,2/2)=x+y=2,

dunque il massimo è 2, raggiunto nel punto (2/2,2/2), e il minimo è 2, raggiunto nel punto (2/2,2/2).

Secondo il teorema di Weierstrass: essendo x+y una funzione continua definita sul vincolo che è un insieme chiuso e limitato, essa ammette sicuramente un minimo e un massimo assoluti. Nessuno dei due punti stazionari trovati può quindi essere un punto di sella.

Esempio 2: entropia

Supponiamo di voler trovare la distribuzione di probabilità discreta con entropia d'informazione massimale. Allora l'obiettivo è:

n=1Npnlog2pn.

Il vincolo è che le configurazioni n siano le uniche alternative possibili, cioè che la loro somma sia unitaria. La funzione di vincolo è allora:

n=1Npn1.

Per tutti gli n da 1 a N, si impongono le equazioni:

pn(n=1Npnlog2pn+λn=1Npnλ)=0.

Procedendo con la derivazione si ottiene, oltre all'equazione del vincolo originario:

(1ln2+log2pn)+λ=0pn=2λ/e.

Questo dimostra che tutti i pn sono uguali perché dipendono soltanto da un parametro comune. Introducendola nell'equazione vincolare, ossia imponendo

n=1Npn=1,

si ottiene:

pn=1N.

Dunque, la distribuzione uniforme è la distribuzione di massima entropia per variabili aleatorie discrete.

Economia

L'ottimizzazione vincolata gioca un ruolo centrale in economia. Per esempio il problema della scelta per un consumatore è rappresentato come quello che massimizza una funzione di utilità[3] soggetta a un vincolo di bilancio. Il moltiplicatore di Lagrange ha un'interpretazione economica come prezzo ombra (shadow price) associato al vincolo, in questo caso l'utilità marginale[4][5] del capitale.[6].

Vincoli monolateri

Se i vincoli che vengono presentati impongono disequazioni si procede come segue:

  • In caso di massimizzazione porre il vincolo nella forma normale gj(𝐱)0.
  • In caso di minimizzazione porre il vincolo nella forma normale gj(𝐱)0.
  • Il sistema da risolvere si trasforma in
{𝐱Λ=𝟎λΛ=𝟎λj0.

Note

  1. Template:SpringerEOM.
  2. Courant, Richard, Herbert Robbins, and Ian Stewart. What Is Mathematics?: An Elementary Approach to Ideas and Methods. New York: Oxford University Press, 1996. p. 344.
  3. Alfred Marshall. 1920. Principles of Economics. An introductory Volume. 8th edition. London: Macmillan.
  4. Stigler, George Joseph; “The Development of Utility Theory”, I and II, Journal of Political Economy (1950), issues 3 and 4.
  5. Stigler, George Joseph; “The Adoption of Marginal Utility Theory” History of Political Economy (1972).
  6. Paul A. Samuelson and William D. Nordhaus (2004). Economics, 18th ed., [end] Glossary of Terms, "Capital (capital goods, capital equipment."
       • Deardorff's Glossary of International Economics, Capital.

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Portale