Serie storiche
Analisi delle serie storiche
In statistica descrittiva viene definita come un insieme di osservazioni ordinate rispetto ad un carattere qualitativo (ad esempio il tempo) che, prese tutte insieme, esprimono la dinamica del fenomeno osservato.
Le serie storiche vengono studiate sia per interpretare, individuando componenti di trend (andamento generale, orientamento, tendenza; moda), di ciclicità, di stagionalità e/o di accidentalità, sia per prevedere il suo andamento interpretativo e previsionale (ad esempio di budgeting) che influisce sulla pianificazione e il controllo delle attività produttive.
Le osservazioni ordinate vengono definite, anche, variabili del fenomeno osservato e si distinguono in:
- variabili di stato (numero dei dipendenti di un’azienda, quotazione di chiusura di un titolo negoziato in borsa, livello di un tasso di interesse ecc.);
- variabili di flusso (vendite annuali di un’azienda, PIL trimestrale ecc.).
Le serie storiche possono avere una correlazione seriale (presenza di dipendenza) essere di tipo:
- deterministico: i valori delle variabili sono determinate sulla base dei valori precedenti e si può determinare con diverse forme funzionali:
- additiva (tutte le componenti sono espresse nell’unità di misura di Y): “Yt = Tt + Ct + St + et” e può essere linearizzato con una trasformazione logaritmica: “ln(Yt) = ln(Tt) + ln(Ct) + ln(St) + vt”;
- moltiplicativa (C S ed e sono numeri puri cioè incidenze relative ovvero numeri indici): Yt = “Tt + Ct + St + et”;
- mista (C ed S sono numeri puri): “Yt = Tt + Ct + St + et”;
- stocastico (nel calcolo delle probabilità, dovuto al caso, casuale, aleatorio): i valori delle variabili sono determinate sulla base dei valori precedenti solo in misura parziale.
Procedere con l’analisi delle serie storiche su un fenomeno osservato consente di:
- descriverlo (analisi grafica, individuazione degli outliers);
- spiegarlo (comprensione);
- prevederlo (inferenza sui valori futuri del fenomeno di interesse);
- filtrarlo (estrazione/stima di componenti non osservabili della serie stessa);
- controllarlo (riguarda i processi produttivi e le loro caratteristiche di qualità).
L’analisi può avvenire con un approccio classico dove il processo generatore dei dati è costituito da una parte deterministica “f(t)” e una stocastica “ut” (Yt = f (t) + ut) secondo due componenti:
- legge di evoluzione temporale del fenomeno (componente deterministica): costituisce la parte sistematica e in quanto tale è perfettamente prevedibile;
- errori accidentali (componente casuale): rappresenta tutte le circostanze non considerate esplicitamente in “f(t)” e viene considerato stazionario e incorrelato.
Esiste anche un approccio moderno che considera il processo “Yt” come un tutt’uno di carattere stocastico da modellare con tecniche probabilistiche.
Nel processo stocastico la serie storica viene generata da “Yt” se:
- il valore atteso di “Yt” è costante (stazionarietò in media): “E(Yt) = μ ∀t”;
- la varianza di “Yt” è costante: “Var(Yt) = σ² 8t”;
- la covarianza tra due elementi “Yt” e “Ys” dipende soltanto dalla distanza “Cov(Yt, Ys) = Cov(Yt+m, Ys+m) = f(t - s) ∀t, s, m” quindi una serie osservata “Yt” sarà stazionaria se generata da un processo stazionario.
I compponenti delle serie storiche possono riferirsi:
- ai trend (T): movimento tendenziale di fondo dovuto all’evoluzione di lungo periodo del fenomeno e può essere polinominale (riscrittura del numero come somma polinomiale, in cui ogni cifra viene espressa come unità moltiplicata per un’opportuna potenza di 10) o esponenziale (che procede con progressione molto rapida);
- al ciclo (C): oscillazione congiunturale di carattere ricorrente, spesso dovuto all’oscillare di un sistema economico attorno alle condizioni di equilibrio;
- alla stagionalità (S): regolarità empirica legata ai periodi dell’anno e dovuta a fattori climatici (alternanza delle stagioni) oppure organizzativi (ferie, festività);
- all’accidentalità: componente residuale rispetto alle cause strutturali 1 e 3, in genere relativa a molte influenze di piccola entità o comunque non chiaramente identificabili né suscettibili di modellazione esplicita (ad esempio gli errori del modello OLS - Ordinary Least Squares).
Le componenti trend, ciclo e stagionalità, se presenti, costituiscono la parte sistematica e nell’approccio classico si ipotizza che la serie sia generata come “Yt = f (Tt; Ct; St; et)” dove la parte deterministica può consistere dei primi tre componenti (trend, ciclo e stagionalità) che, misurandoli, producono un errore diffuso (disturbo aleatorio).
Per quanto riguarda la stagionalità, con una frequenza infra-annuale, possono presentarsi regolarità legate alle stagioni e per evidenziarla, a livello descrittivo, la può essere utile visualizzare l’andamento della serie attraverso i periodi dell’anno (ad esempio i mesi, anno per anno, con grafici sovrapposti) oppure si possono visualizzare i mesi di ogni anno (mese per mese).
Una volta stabiliti i componenti si procede con le diverse fasi di analisi che saranno:
- analisi del problema;
- raccolta dei dati;
- analisi preliminare della struttura della serie storica;
- scelta e stima del modello;
- valutazione della bontà del modello a fini previsivi.