Metodi di Runge-Kutta

Da testwiki.
Vai alla navigazione Vai alla ricerca

In analisi numerica i metodi di Runge-Kutta [ˌʁʊŋəˈkʊta] sono un'importante famiglia di metodi iterativi impliciti ed espliciti per l'approssimazione delle soluzioni delle equazioni differenziali ordinarie. Queste tecniche furono sviluppate intorno al 1900 dai matematici tedeschi Carl Runge e Martin Wilhelm Kutta, dai quali prendono il nome.

Introduzione

I metodi di Runge-Kutta, spesso abbreviati con le iniziali "RK", sono una famiglia di metodi iterativi discreti utilizzati nell'approssimazione numerica di soluzioni di equazioni differenziali ordinarie (ODE), e più specificatamente per problemi ai valori iniziali. Fanno parte della famiglia più generale di metodi discreti per le equazioni differenziali ordinarie, ovvero di quella classe di metodi numerici che fornisce un'approssimazione della soluzione di un'equazione differenziale (o più precisamente di un problema di Cauchy) in un insieme discreto di punti.

Per trovare un'approssimazione della funzione y(t):d che verifichi il generico problema di Cauchy:

{y(t)=f(t,y(t))y(t0)=y0

in un insieme discreto di punti in cui si considera il problema (solitamente nell'intervallo [t0,tf]), si considera un campionamento dell'intervallo Δ in un insieme di punti {tii=0n}, dove ti=t0+ih e h=(tft0)/n. Il metodo numerico fornisce allora l'approssimazione dei valori y(ti), e per ottenere una ricostruzione abbastanza fedele della funzione il numero n deve essere sufficientemente elevato.

Formulazione

L'idea che sta alla base dei metodi di Runge-Kutta è la trasposizione del problema dalla forma differenziale alla forma integrale, per la quale esistono metodi numerici (come le formule di quadratura) che permettono l'approssimazione della soluzione. In generale un metodo di Runge-Kutta è caratterizzato da tre parametri: un vettore b=(bi)i=0,,s, una matrice a=(ai,j)i,j=0,,s e un vettore θ=(θi)i=0,,s. L'approssimazione è data dal sistema:

{yn+1=yn+hi=1sbif(tn+θih,Yi)Yi=yn+hj=1saijf(tn+θjh,Yj)i=1,,s

dove i valori yi approssimano il valore esatto y(ti).

Considerando il generico problema di Cauchy:

{y(t)=f(t,y(t))y(t0)=y0

Si può considerare una sua riformulazione in forma integrale:

y(t)=y0+t0ty(s)ds=y0+t0tf(s,y(s))ds

dove l'ultima sostituzione è legittima in quanto la funzione è soluzione dell'equazione differenziale. Da questa riformulazione segue in particolare che, per una suddivisione uniforme Δ={ti}={t0+ih}{i=0,,n}, il valore della soluzione nel punto t1 è dato da:

y(t1)=y0+t0t0+hf(s,y(s))ds

Da questo risultato, attraverso la sostituzione s=t0+θh si può normalizzare l'intervallo di integrazione e ottenere:

y(t1)=y0+h01f(t0+θh,y(t0+θh))dθ

Da questa scrittura appare evidente che con opportune sostituzioni si può esprimere il valore della funzione in ogni punto intermedio tra t0 e t1.

Utilizzando un'approssimazione per via numerica dell'integrale attraverso delle formule di quadratura sui nodi θi e pesi bi (che dipendono dalla scelta della formula di quadratura) si ottiene una stima del valore y1:

y1=y0+hi=0νbif(t0+θih,Yi)

dove i valori Yi sono approssimazioni di y(t0+θih), che sono ignote a priori. Applicando nuovamente il ragionamento precedente si può scrivere che:

y(t0+θih)=y0+h0θif(t0+vh,y(t0+vh))dv

Questi valori possono essere approssimati a loro volta utilizzando una formula di quadratura con pesi aij; si ottiene così che (per semplicità si considerano formule con i medesimi nodi di quadratura di quelle usate in precedenza):

Yi=y0+hj=1νaijf(t0+θjh,Yj)

Iterando tale costruzione si ottengono le approssimazioni nei punti ti, e come conseguenza la formulazione generale per i metodi di Runge-Kutta.

Metodi espliciti

Dato il problema ai valori iniziali:

y˙=f(t,y)y(t0)=y0

dove i valori di t0 e y0 sono noti, si consideri un intervallo sufficientemente piccolo h>0 e si definiscano:

yn+1=yn+h6(k1+2k2+2k3+k4)tn+1=tn+h

per n=1,2,3,. In questo modo y(tn+1) è approssimato con yn+1, e yn+1 è determinato da yn più la media pesata di quattro incrementi k1, k2, k3 e k4:

k1=f(tn,yn)k2=f(tn+h2,yn+12k1h)k3=f(tn+h2,yn+12k2h)k4=f(tn+h,yn+k3h)

dove ogni incremento è il prodotto di h e una stima della pendenza di f. Nello specifico:

  • k1 è l'incremento basato sulla pendenza all'inizio dell'intervallo, utilizzando y˙n (metodo di Eulero)
  • k2 è l'incremento basato sulla pendenza alla metà dell'intervallo, utilizzando k1
  • k3 è un altro incremento basato sulla pendenza alla metà dell'intervallo, utilizzando k2
  • k4 è l'incremento basato sulla pendenza alla fine dell'intervallo, utilizzando k3

Nel fare la media, gli incrementi valutati in un punto intermedio dell'intervallo hanno peso maggiore, ed i coefficienti sono scelti in modo che se f è indipendente da y, sicché l'equazione dipende da un semplice integrale, allora il metodo RK coincide con la regola di Cavalieri-Simpson.

In generale, la famiglia di metodi espliciti di Runge-Kutta è data da:

yn+1=yn+i=1shbiki

dove:

k1=f(tn,yn)k2=f(tn+c2h,yn+h(a21k1))k3=f(tn+c3h,yn+h(a31k1+a32k2))ks=f(tn+csh,yn+h(as1k1+as2k2++as,s1ks1))

Per specificare un particolare metodo si deve definire il numero s ed i coefficienti aij (per 1j<is), bi (per i=1,2,,s) e ci (per i=2,3,,s). La matrice dei coefficienti aij è detta matrice di Runge-Kutta. Si usa spesso rappresentare i coefficienti in una tabella:

0
c2 a21
c3 a31 a32
cs as1 as2 as,s1
b1 b2 bs1 bs

e si deve avere:

j=1i1aij=cii=2,,s

Derivazione per il quarto ordine

In generale, un metodo di Runge-Kutta di ordine s può essere scritto come:

yt+h=yt+hi=1saiki+𝒪(hs+1)

dove:

ki=f(yt+hj=1sβijkj,tn+αih)

sono gli incrementi ottenuti valutando le derivate di yt all'i-esimo ordine.

Un modo per derivare il metodo per s=4 utilizzando la formula generale è il seguente.[1] Si sceglie:

αiβijα1=0β21=12α2=12β32=12α3=12β43=1α4=1

con βij=0 altrimenti. Si definiscono quindi le quantità:

yt+h1=yt+hf(yt,t)yt+h2=yt+hf(yt+h/21,t+h2)yt+h3=yt+hf(yt+h/22,t+h2)

dove:

yt+h/21=yt+yt+h12yt+h/22=yt+yt+h22

Se si pone:

k1=f(yt,t)k2=f(yt+h/21,t+h2)k3=f(yt+h/22,t+h2)k4=f(yt+h3,t+h)

sostituendo si ha a meno di O(h2):

k2=f(yt+h/21,t+h2)=f(yt+h2k1,t+h2)=f(yt,t)+h2ddtf(yt,t)k3=f(yt+h/22,t+h2)=f(yt+h2f(yt+h2k1,t+h2),t+h2)=f(yt,t)+h2ddt[f(yt,t)+h2ddtf(yt,t)]k4=f(yt+h3,t+h)=f(yt+hf(yt+h2k2,t+h2),t+h)=f(yt+hf(yt+h2f(yt+h2f(yt,t),t+h2),t+h2),t+h)=f(yt,t)+hddt[f(yt,t)+h2ddt[f(yt,t)+h2ddtf(yt,t)]]

dove:

ddtf(yt,t)=yf(yt,t)y˙t+tf(yt,t)=fy(yt,t)y˙+ft(yt,t):=y¨t

è la derivata totale di f rispetto a t. Scrivendo la formula generale con quanto ricavato:

yt+h=yt+h{af(yt,t)+b[f(yt,t)+h2ddtf(yt,t)]++c[f(yt,t)+h2ddt[f(yt,t)+h2ddtf(yt,t)]]++d[f(yt,t)+hddt[f(yt,t)+h2ddt[f(yt,t)+h2ddtf(yt,t)]]]}+𝒪(h5)=yt+ahft+bhft+bh22dftdt+chft+ch22dftdt++ch34d2ftdt2+dhft+dh2dftdt+dh32d2ftdt2+dh44d3ftdt3+𝒪(h5)

e confrontando con l'espansione di serie di Taylor di yt+h intorno a t:

yt+h=yt+hy˙t+h22y¨t+h36yt(3)+h424yt(4)+𝒪(h5)==yt+hf(yt,t)+h22ddtf(yt,t)+h36d2dt2f(yt,t)+h424d3dt3f(yt,t)

si ottiene un sistema di equazioni per i coefficienti:

{a+b+c+d=112b+12c+d=1214c+12d=1614d=124

che fornisce:

a=16b=13c=13d=16

Note

Bibliografia

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Portale