Relazioni di ricorrenza per la covarianza

come per la Varianza Gli algoritmi per il calcolo della covarianza giocano un ruolo molto importante nella statistica computazionale. Una difficoltà chiave nel progetto di un buon algoritmo per questo problema è che le formule per la covarianza possono includere somme di quadrati, che possono condurre a instabilità numerica così come overlow aritmetico quando vengono trattati grandi valori.

La covarianza è un indice bivariato, ovvero per ogni unità sono registrate le modalità di due variabili e si calcola nel seguente modo:

La formula della covarianza può essere vista come una generalizzazione della varianza, in quanto se X e Y fossero la stessa variabile di fatto si ha proprio la formula generale della varianza.

In programmazione è utile avere un algoritmo iterativo che permette di calcolare facilmente la covarianza. Per cui si considerano due variabili X e Y a cui sono sottratte delle quantità costanti c e d, e attraverso i seguenti passaggi algebrici in cui si aggiungono e si sottraggono le medie delle due variabili, si ottiene:

che si minimizza ponendo le costanti c e d pari alle medie delle due variabili al passo n-1. Per cui la somma dei prodotti che si ha nel calcolo della covarianza lo possiamo riscrivere attraverso i seguenti passaggi algebrici:

Infine, si può ottenere la somma dei prodotti in maniera ricorsiva equivalentemente nei due seguenti modi:

Lascia un commento

Progetta un sito come questo con WordPress.com
Comincia ora