Als een tijdreeks stationair is, dan heeft zij een integratie van orde nul I(0).
We kunnen niet afleiden of een tijdreeks stationair is op basis van de visualisatie. We zouden gebruik moeten maken van een raamwerk van statistische methoden om af te leiden of ze inderdaad stationair is.
Er zijn drie voorwaarden waaraan moet worden voldaan opdat een willekeurige tijdreeks Yt als stationair wordt gedefinieerd:
- E is constant voor alle t (dit impliceert mean-reversion)
- Var is constant voor alle t
- Covar is constant voor alle t
Als een aandelenpaar met een hoge mate van zekerheid stationair kan worden geïdentificeerd, dan kunnen we dat paar met succes gebruiken in onze pairs trading-strategie.
Wat is een autoregressief (AR) model?
Het is een weergave van een type willekeurig proces. In ons geval zal het een random walk zijn, die een benadering is van de discretiserende Brownse beweging (die wordt gebruikt om aandelenkoersen te modelleren). Het specificeert dat de output variabele lineair afhangt van zijn eigen vorige waarden en een willekeurige variabele – het is dus in de vorm van een stochastische verschilvergelijking.
Deze wordt als volgt weergegeven,
Yt=ρYt-₁+Ɛt ; waarbij Ɛt een onafhankelijke normaal verdeelde willekeurige variabele is.
Het is noodzakelijk op te merken dat, aangezien de bovenstaande vergelijking een AR-model van orde één is, we daarom een lag (L) van één zullen beschouwen.
Er zijn twee belangrijke voorbeelden van stationaire tijdreeksen en hun respectieve eigenschappen:
- Hangt niet af van de tijd
- Witte ruis
2.3 Coïntegratie
Let op,
Als een tijdreeks stationair is, dan heeft zij een integratie van orde nul I(0).
Welnu, daar gaan we op voortbouwen.
Stel dat we een paar aandelen hebben dat we al dan niet als een paar willen identificeren (met het oog op de parenhandel).
Laat de tijdreeks Xt voorraad A zijn en Yt voorraad B. Beide tijdreeksen zijn AR-modellen;
Xt=ρXt-₁+Ɛt en Yt=ρYt-₁+Ɛt ; neem aan dat Ɛt voor beide reeksen gelijk is.
Als we deze reeksen dan in een bepaalde verhouding zouden combineren, zouden we een nieuwe reeks μt krijgen die alleen bestaat uit de niet-willekeurige componenten van de AR-modellen.
Nu veronderstellen wij in een meer algemeen geval dat deze twee tijdreeksen beide geïntegreerd zijn van orde één (I(1)) en dus van meet af aan niet-stationair zijn. Laten we ook veronderstellen dat het AR-modellen zijn (van orde 1) waarbij de willekeurige component wordt geannuleerd (wegens het delen van gemeenschappelijke stochastische trends (Ɛt)) – er is dan een mogelijkheid dat een lineaire combinatie van de reeksen een stationaire I(0)-reeks zou opleveren. Dit is wat cointegratie is.
Wat is het verschil tussen cointegratie en correlatie?
Terwijl zowel cointegratie als correlatie activaprijzen kunnen meten die samen bewegen en dus een relatie tot stand kunnen brengen, gaat correlatie op de lange termijn kapot, maar is enigszins robuust bij het vaststellen van kortetermijnrelaties. Coïntegratie is daarentegen veel beter geschikt voor een handelsstrategie op middellange tot lange termijn. Ook worden correlaties meestal gebruikt om de co-movement van rendement te specificeren, terwijl cointegratie die van prijs specificeert.
Houd dit in gedachten?
… we zullen een statistische eigenschap tussen twee verschillende aandelen op dezelfde beurs exploiteren.
Die statistische eigenschap waarnaar we verwezen, was stationariteit door de cointegratiebenadering.
Cointegratiebenadering voor het vinden van paren
Het belangrijkste idee is dat we twee tijdreeksen hebben die niet stationair zijn, maar stationair worden door te differenceren (I(1)). Deze tijdreeksen worden geïntegreerd (van orde één) genoemd. Er zijn geïntegreerde (van orde één) tijdreeksen zodanig dat er een lineaire combinatie van bestaat die stationair wordt (I(0)) (zoals te zien is in figuur 2.3.1).
We kunnen dit proces in drie grote stappen verdelen:
- regressieanalyse gebruiken om de natuurlijke logaritmen van de koersen van beide aandelen tegen elkaar weg te drukken – de cointegratiecoëfficiënt vinden
- de residuen uit de regressie berekenen
- statistisch testen of de residuen stationair zijn met behulp van de Dickey-Fuller-test (DF)
In de onderstaande grafieken hebben we de historische koers van Citigroup Inc. van 20/07/18 tot 20/07/19 (dagelijkse frequentie). Met behulp van Matlab hebben we de volgende grafieken gegenereerd: