Tijdreeksanalyse

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Tijdreeksen: random data met een trend

Een tijdreeksanalyse is de analyse van gegevens die verzameld zijn in de loop van een bepaalde periode. Voorbeelden van een tijdreeks zijn de dagelijkse sluitingswaarde van de Dow Jones index en het jaarlijkse stroomvolume van de Nijl bij Aswan. Tijdreeksanalyse omvat methoden voor het analyseren van tijdreeksdata en om zinnige statistieken en andere karakteristieken te beschrijven. Tijdreeksanalyse wordt vaak gebruikt om met behulp van een model een goede voorspelling te geven, zoals bijvoorbeeld de waarde van een aandeel. Tijdreeksgegevens hebben een natuurlijke tijdsordening. Dit onderscheidt tijdreeksanalyse van andere gemeenschappelijke data-analyse problemen, waarbij er geen natuurlijke ordening van de waarnemingen is. Een tijdreeksmodel zal over het algemeen waarnemingen in de nabije toekomst beter voorspellen dan waarnemingen verder weg in de toekomst.

Analyse[bewerken]

Er zijn verschillende soorten van data-analyse beschikbaar voor tijdreeksen die geschikt zijn voor verschillende doeleinden.

Algemene verkenning[bewerken]

  • Het onderzoeken van de grafieken van de dataserie.
  • Het onderzoeken van de autocorrelatie.

Beschrijvend[bewerken]

  • Het onderverdelen in componenten die trend, seizoensgebondenheid, langzame en snelle variatie en cyclisch onregelmatigheid vertegenwoordigen.
  • Eenvoudige eigenschappen van marginale verdelingen.

Voorspellend[bewerken]

  • Volledige modellen, bedoeld voor stochastische simulatie.
  • Eenvoudige of volledig gevormde statistische modellen om de waarschijnlijke uitkomst van de tijdreeks in de nabije toekomst, gezien de kennis van de meest recente uitkomsten, te proberen te beschrijven.

Modellen[bewerken]

Modellen voor tijdreeksgegevens kunnen vele vormen aannemen en vertegenwoordigen verschillende stochastische processen. Bij het modelleren van schommelingen in het niveau van een proces, drie brede categorieën van praktisch belang zijn de autoregressieve (AR)-modellen, de geïntegreerde (I) modellen, en de voortschrijdend gemiddelde (MA) modellen. Deze drie categorieën zijn ieder lineair afhankelijk van de voorgaande niveaus van het proces. Combinaties van deze ideeën zijn het autoregressieve voortschrijdend gemiddelde (ARMA) model en het autoregressieve geïntegreerde voortschrijdend gemiddelde (ARIMA) model.

Er zijn ook non-lineaire modellen. Voorbeelden hiervan zijn modellen die heteroskedasticiteit vertegenwoordigen. Dit zijn de autoregressieve heteroskedastische (ARCH) modellen en deze vertegenwoordigen een grote verzameling van modellen (bijvoorbeeld GARCH en TARCH). In deze modellen is er ook een verandering in variabiliteit mogelijk.

Notatie[bewerken]

Er zijn verschillende vormen van notatie mogelijk. Een veelgebruikte notatie is die, waarbij X geïndiceerd is door de natuurlijke getallen. X is hierbij genoteerd als:

X = {X1, X2, ...}.

Een andere veelgebruikte notatie is:

Y = {Yt: tT},

waar T de indexverzameling is.

Voorwaarden[bewerken]

Er zijn twee voorwaarden waaronder een groot deel van de theorie gebouwd is: