Categorie: Matematica
Tags: approsimazione derivate successive sviluppi in serie
Scritto da: Vincenzo Zappalà
Commenti:5
34. Approssimiamo una funzione divertendoci con una matematica molto fantasiosa **
L’approccio che cerchiamo di usare, per introdurre lo sviluppo in serie di funzioni, vuole arrivare ad approssimare una data funzione attraverso un semplice polinomio di grado n. E’ un approccio, però, che non troverete nei libri, ma che reputo oltremodo intuitivo e utile per arrivare al nocciolo del problema ed essere poi pronti a una trattazione ben più rigorosa e generale. Nel contempo, le derivate successive incominciano ad assumere un ruolo di primo piano. Divertiamoci un po’ a fare un tentativo che appare campato in aria solo a prima vista…
Facciamo un gioco un po’ strano e senza un vero significato matematico e/o geometrico. Ma, ogni tanto ci si può anche divertire eseguendo tentativi che sembrano del tutto campati in aria. L’importante è che questi tentativi non vengano poi tacciati come teorie alternative o cose del genere. Inoltre, vedremo che questo gioco non è poi tanto assurdo come potrebbe sembrare a prima vista. In qualche modo risponde a una domanda che era stata fatta tempo fa: “Che significato hanno le derivate successive?”.
Consideriamo, allora, una funzione qualsiasi
y = f(x)
La scegliamo in modo che esistano tutte le sue derivate successive e non siano mai zero. Questa frase non è molto strana se pensiamo a una funzione come il seno (o il coseno). La sua derivata vale coseno, la cui derivata è – seno, la cui derivata è – coseno, la cui derivata è seno, e via dicendo… Ovviamente, se calcolata in un certo punto, può anche valere zero, ma non lo è in generale. La stessa cosa vale ovviamente per la funzione ex, le cui derivate successive valgono sempre ex.
Ammettiamo quindi che la funzione sia sempre derivabile fino a un ordine n grande a piacere. Esistono perciò e sono finite le derivate
f ’(x), f ”(x), f III(x), f IV(x), …., f n(x)
Immaginiamo di conoscerle calcolate nel punto x0.
Andiamo avanti lentamente e immaginiamo che la nostra funzione sia quella rappresentata nella Fig. 1. Consideriamo un suo punto P(x0,y0). Cerchiamo di approssimare la funzione con quel poco che sappiamo.
Beh… la prima cosa ovvia è che il punto P appartiene alla curva, perciò deve essere:
y = y0 = f(x0) …. (1)
La (1) non dice molto, ma non vi è dubbio che rappresenta una retta orizzontale, parallela all’asse delle x. Tracciamola nella Fig.1 . Sicuramente abbiamo fatto un passo in avanti: la (1) approssima meglio la nostra funzione (intorno al punto P) di quanto non faccia l’asse delle x. Questa retta ha, sicuramente, un punto in comune con la funzione.
Cerchiamo di migliorare un po’ il risultato…
Scriviamo la retta tangente alla curva nel punto P. Questo lo sappiamo fare senza problemi.
y – y0 = m (x – x0) = f ’(x0) (x – x0)
Conosciamo x0, y0 e f ’(x0) e possiamo scrivere:
y = y0 + f ’(x0) (x – x0)
o anche:
y = f(x0) + f ’(x0) (x – x0) …. (2)
Disegniamo, in Fig. 2, la Fig. 1 con l’aggiunta della tangente in P.
Beh… non possiamo che concludere, nel nostro piccolo, che la (2) approssima la funzione molto meglio della (1). Facciamo qualche riflessione grafica, considerando i punti A sull’asse x; il punto A0 sulla parallela all’asse x, passante per P; il punto A1 sulla tangente; il punto An sulla curva relativa a f(x). Ogni punto ha come ascissa una qualsiasi x (meglio se vicina a x0). Risulta subito che:
AAn = AA0 + A0A1 + A1An
Ossia:
f(x) = f(x0) + f ’(x0) (x – x0) + A1An
E anche
f(x) - f(x0) - f ’(x0) (x – x0) = A1An
Possiamo anche chiamare A1An = R e chiamarlo “errore”, commesso approssimando la funzione con la retta tangente in P. Un errore che tende naturalmente a ZERO per x che tende a x0. A questo riguardo potremmo anche dire (senza sbagliare concettualmente) che se la retta y = y0 ha un solo punto in comune con la funzione (P), la tangente in P ha "due punti" in comune ed entrambi coincidono con P. In qualche modo la tangente sembra “adattarsi” di più alla funzione nel punto P di quanto non faccia la retta parallela all’asse x. E’ un po’ il discorso che avevamo fatto per i massimi e minimi e per i flessi… ricordate? In fondo, se guardiamo la figura ruotandola in modo che la tangente diventi l’asse delle x, facendo coincidere il punto P con O, quest'ultimo diventa una specie di minimo (e annulla oltre che la funzione anche la derivata prima).
Ricordiamo, poi, un punto essenziale sul quale ci si confonde spesso. Si dice che la derivata prima rappresenta la tangente alla curva in un certo punto. In realtà non è esatto. Bisognerebbe dire che la derivata prima rappresenta il coefficiente angolare della retta tangente, ossia ha un senso solo se è calcolata nel punto e diventa un coefficiente numerico. In altre parole (sto tirando l’acqua al mio mulino per dare forza al gioco che inizierà tra poco), la derivata che compare nella tangente (che approssima la curva in P) è solo e soltanto un coefficiente numerico. Pensateci un po' sopra e andiamo pure avanti…
Riguardiamo con attenzione la (2) e il suo significato geometrico rappresentato in Fig. 2.
Cosa potremmo fare per approssimare ancora meglio la funzione di partenza? Non certo cambiare la retta, ma cercare di utilizzare una curva che si avvicini ancora di più alla f(x). Beh… se dobbiamo usare una curva, la cosa migliore è quella più semplice, ossia un polinomio di secondo grado, cioè una parabola. Potremmo anche chiamarla parabola osculatrice nel punto P. Essa avrebbe tre punti in comune con la f(x), tutti e tre coincidenti con P. Questa “pazza” idea sembra essere confermata dall’andamento della (2), la quale è formata da un termine noto, y0 = f(x0), ossia la funzione stessa calcolata in x0, moltiplicato per (x – x0) elevato a ZERO e da un coefficiente (la derivata prima calcolata in x0) moltiplicato per (x – x0) elevato all’esponente UNO. Come fare per farla diventare una parabola? La prima idea che “mi” viene in testa (no, non credeteci, è già venuta ad altri prima che a me!) è aggiungere un termine in cui compare (x – x0) elevato all’esponente DUE.
Per cosa lo moltiplichiamo? Tanto vale provare: per la derivata seconda di f(x), sempre calcolata in x0. Ciò che sicuramente si ottiene è qualcosa come quella rappresentata in Fig. 3 (curva verde) che possiamo chiamare parabola osculatrice. Siamo sicuri che questa curva approssimi meglio la curva? Beh… direi proprio di sì. Se non altro, il termine di secondo grado ci assicura che la nostra parabola tende a y0 più velocemente di quanto non faccia la retta tangente, che è di primo grado in x, al tendere di x verso x0.
La funzione che dovrebbe approssimare la f(x) meglio della tangente sarebbe data da:
f(x) = f(x0) + f ’(x0) (x – x0) + f ”(x0) (x – x0)2 + A2An
A2An rappresenta la parte che ci manca per un’approssimazione perfetta della nostra parabola con la funzione di partenza. Esso è chiaramente più piccolo di quello precedente. Ossia R diminuisce.
Una trattazione più accurata e meno campata in aria potrebbe fare uso del calcolo differenziale, ma andrebbe ben oltre i nostri scopi e quindi accontentiamoci di queste conferme molto grossolane. Ci torneremo sopra tenendo per mano il teorema di Lagrange e tutto sarà più logico.
A questo punto, tanto vale insistere per la stessa strada. Possiamo continuare con la derivata terza e aggiungere un termine. Alla nostra funzione costruita attraverso un polinomio (eh sì, stiamo usando solo potenze di x moltiplicate per coefficienti numerici…), aggiungiamo il termine di terzo grado:
f III (x0) (x – x0)3
La nostra funzione che tende ad approssimare la f(x) in un intorno del punto P, è diventata:
f(x) = f(x0) + f ’(x0) (x – x0) + f ”(x0) (x – x0)2 + f III(x0) (x – x0)3 + A3An
Una bella cubica (cubica osculatrice, chiamiamola così…) che approssima ancora meglio la nostra funzione di partenza f(x) in un intorno di P (curva marrone in Fig. 3). L’errore che si commette diventa sempre più piccolo e possiamo dire con certezza che deve essere un infinitesimo di ordine superiore a TRE. Un errore che possiamo ormai permetterci di chiamare “resto”.
Ovviamente, possiamo proseguire fino ad arrivare all’ordine n che preferiamo e che ci regala un errore più piccolo rispetto alle nostre esigenze.
Tutto bene? Nemmeno per sogno! Purtroppo, i primi due termini che ci sono serviti per il nostro gioco non ci regalano informazioni sul coefficiente numerico che deve veramente moltiplicare (x –x0) elevato alle potenze successive. Non ci resta che fare una cosa, molto banale ma illuminante e decisiva. Applichiamo la nostra “fantasia” matematica a una funzione che sia davvero un polinomio. Ad esempio una bella cubica e vediamo se funziona veramente. Se funziona per lei siamo abbastanza sicuri che funzionerà anche per funzioni diverse dai polinomi. Lagrange ci aiuterà di nuovo per passare da fantasia a realtà.
Bene, la prossima volta faremo questo tentativo.
Sì, lo so, abbiamo fatto un po’ di pseudo-matematica, molto empirica e poco rigorosa. Abbiamo veramente scherzato? Mica tanto e, comunque, abbiamo introdotto lo sviluppo in serie in modo estremamente semplice e intuitivo. Inoltre le derivate successive acquistano un significato “quasi” geometrico, dato che sono i coefficienti dei termini di grado equivalente.
Chi storce un po’ il naso, vedrà che correremo ai ripari, sempre grazie a Lagrange (uffa!)
QUI il capitolo precedente
QUI il capitolo successivo
QUI l'intero corso di matematica
5 commenti
Caro Enzo, vorrei provare fare due brevi considerazioni.
La prima riguarda le derivate successive.
Nella figura che ho realizzato ho provato a mostrare il comportamento delle tangenti alla curva iniziale (derivate prime) nei dintorni del punto P.
http://www.astrobin.com/full/215950/L/
In particolare volevo evidenziare come cambia il coefficiente angolare m delle rette tangenti la curva, ossia il valore delle derivate prime, calcolato nei dintorni del punto P (ho indicato altri due punti: B e C, che per ragioni grafiche non sono vicinissimi a P..).
La seconda figura ricostruisce in maniera approssimativa le variazioni della derivata prima in funzione di x (curva nera) e mostra le derivate seconde come rette tangenti la curva in prossimità del solito punto P (x0).
http://www.astrobin.com/full/215950/M/
Ho disegnato queste figure poiché l'idea che mi sono fatto è che ogni volta che eseguo una derivata successiva aggiungo informazioni utili per approssimare la funzione che si vuole ricostruire.
Un po' come se la derivata della derivata “sintetizzasse” il comportamento della curva intorno al punto P, dato che la derivata successiva è la tangente della curva che descrive come varia il valore di m della derivata precedente.
E' un'idea così assurda?
La seconda questione riguarda il grado della funzioni iniziale e il numero di derivate ricavabili.
Per esempio se uso una funzione cubica classica, tipo
y= ax³ +bx² +cx +d
y' = 3ax² + bx +c
y'' = 6ax +b
y'''= 6a
y''''= ?? ho finito le derivate
Ogni derivata successiva abbassa la funzione iniziale di un grado.
Se invece uso una funzione tipo:
y =1/x
y' = -1/x²
y'' = 2/x³
y''' = - 6/x^4
y'''' = 24/x^5
Se la x è al denominatore, la funzione aumenta di grado e cambia di segno ad ogni passaggio.
Volevo solo chiedere conferma su questo comportamento delle derivate successive che a me sembra importante.
Paolo
caro Paolo,
vediamo se ho capito bene e cerco di risponderti...
1) se la curva non è una retta è sicuro che la sua funzione derivata sia variabile al variare del punto. Il modo più semplice per rendersene conto è considerare la parabola più semplice: y = x^2. La sua derivata è sempre la stessa y' = 2x, ma ovviamente inserendo x diversi, il coefficiente angolare della tangente (la derivata calcolata nel punto) cambia con x. x = 0, y' (o)= 0 (asse x); x = 1, y'(1)=2; y=2, y'(2)=4; x =3, y'(0) = 6. Il coefficiente angolare aumenta sempre di più tendendo a infinito... ma aumenta con x e non con x^2.
2) Dici bene: la derivata seconda ci dice proprio come varia la derivata prima. Nel caso della stessa funzione di prima (y=x^2), y" = 2 sempre. Ci dice che la derivata prima varia in modo costante... infatti la x viene sempre moltiplicata per 2.
Tutto torna perfettamente con la velocità e l'accelerazione...
In generale, più derivate calcoli per una funzione qualsiasi (sempre che vi siano) e più vai a studiare come varia la derivata precedente e quindi cerchi di capire meglio cosa fa la curva e come si piega...
3) la prima funzione è un polinomio che ammette un numero finito di derivate (lo useremo la prossima volta...); la seconda no... e quindi può ammettere infinite derivate. Se noti ogni termine della seconda è un infinitesimo di ordine maggiore per x che tende a infinito...
Il fatto che cambi di segno non è un problema (come vedremo tra non molto): è più importante che la variazione sia sempre più piccola. Ricordiamo sempre che la derivata non è una curva (se calcolata in un punto), ma è una specie di coefficiente relativo a una certa curva... E proprio questo diventerà nello sviluppo in serie. Chi approssima veramente è il polinomio: i coefficienti lo indirizzano nel modo giusto... Le derivate successive aiutano a trovare i giusti coefficienti...
Vedrai che molte cose si chiariranno in fretta...
Ciao Vincenzo, ho capito che questo è un metodo ancora empirico per spiegare gli sviluppi in serie, ma mi chiedevo, se la curva fosse stata concava si sarebbe potuto fare un ragionamento analogo? Ho provato a disegnare prima la retta parallela all'asse delle x passante per un punto della curva sopra l'asse x, poi la tangente in quello stesso punto, ma adesso si ha che AA1 è maggiore di AAn, quindi non si può procedere come prima sommando i segmenti AA0, A0A1, A1A2 ecc. per "raggiungere" la funzione.
Ah credo di aver capito: in questo caso A1A2 assume valore negativo, quindi una volta sommato ci fa "riavvicinare" alla funzione
esatto!