giovedì 3 aprile 2014

Algoritmo per calcolare MEDIA e VARIANZA

Se si parla di media e varianza, si sta parlando senza dubbio dei principali e più famosi indici statistici. 


LA MEDIA

La media più usata è la media aritmetica (arithmetic mean) calcolata nel seguente modo:




Nel caso in cui però si dispone di grandi quantità di dati, i quali vengono costantemente e frequentemente aggiornati, è ragionevole pensare alla costruzione di un algoritmo iterativo. Un algoritmo per risolvere l'inconveniente degli aggiornamenti di dati, e che quindi eviti di ricalcolare da capo la media ogni qual volta vengano fornite nuove osservazioni, è l'algoritmo running mean


RUNNING MEAN

L'algoritmo running mean calcola la media nel seguente modo:

LA VARIANZA

La varianza, non è altro che la somma degli scarti dalla media al quadrato diviso il numero delle osservazioni. 
Proprio come per la media, esiste un algoritmo in grado di calcolare la varianza per ogni nuova osservazione aggiunta, e l'algoritmo in questione è il running variance.

RUNNING VARIANCE

L'algoritmo running variance calcola la varianza nel seguente modo:


Analogamente, si può calcolare la misura di covarianza attraverso l'algoritmo running covariance.

RUNNING COVARIANCE

 


  

Nessun commento:

Posta un commento