Ordinatie

Uit Wikipedia, de vrije encyclopedie
(Doorverwezen vanaf Gradiëntanalyse)
Ga naar: navigatie, zoeken

Ordinatie, (multivariate) gradiëntanalyse of multidimensional scaling is het rangschikken van objecten langs gradiënten op grond van waargenomen responsies (waarden) voor meerdere afhankelijke variabelen. De op elkaar "gelijkende" objecten staan dicht bij elkaar, de onderling sterk verschillende objecten staan ver van elkaar af. De plaatsing van de objecten vindt plaats in een plat vlak of in een drie of meer dimensies.

Ordinatietechnieken, zoals hoofdcomponentenanalyse, correspondentieanalyse en de canonische vormen daarvan, redundantieanalyse en canonische correspondentieanalyse, behoren tot de multivariate statistiek of multivariate analyse, evenals clusteranalyse. Ordinatie kan gebruikt worden voor de analyse van elke willekeurige verzameling multivariate objecten.

De ordinatietechnieken worden veelal toegepast om samenhang en onderliggende patronen in grote (meerdimensionale) gegevensverzamelingen te visualiseren en worden daartoe bijvoorbeeld vaak gebruikt in de gemeenschapsecologie ((en) "Community ecology")[1].

De ordinatietechnieken, in combinatie met regressieanalyse en statistische tests, worden tegenwoordig ook gebruikt in experimenteel (veld-)onderzoek.[2]

Inhoud

Termen en achtergrond[bewerken]

Definitie[bewerken]

Een definitie van "ordinatie" is: het rangschikken van objecten langs gradiënten op grond van waargenomen responsies voor meerdere afhankelijke variabelen.

  1. Onder rangschikken of ordenen wordt verstaan het positioneren of het ordenen van objecten;
  2. Objecten (entiteiten of steekproeven) zijn de operationele eenheden (instanties) die in de analyse beschreven of geclassificeerd moeten worden;
  3. Gradiënten en ordinatieassen zijn:
  4. Een respons of responsie is in dit verband de waargenomen waarden voor de afhankelijke variabele op grond van de waarneming;
  5. Afhankelijke variabelen of responsvariabelen zijn de variabelen voor de eigenschappen, kwaliteiten of kenmerken van de attributen. Meestal is er één variabele per attribuut, zodat deze als vereenvoudiging gewoonlijk gelijk gesteld worden.

Ordinatie kan zowel worden toegepast op de objecten als op de attributen. Bij een aantal ordinatiemethoden (zoals hoofdcomponentenanalyse en correspondentieanalyse) kan dit simultaan gebeuren en worden de resultaten weergegeven in een biplot of een triplot.

Gegevensverzameling[bewerken]

Multivariate gegevens (data) bestaan uit waarnemingen (observaties), gemaakt op een verzameling van objecten met behulp van een aantal variabelen - vandaar de term 'multivariaat'. Over het algemeen worden ordinatiemethoden gebruikt om te relaties beschrijven tussen de responsvariabelen (de waarden voor de afhankelijke variabelen) en de onderliggende variabelen, de verklarende variabelen en de factoren die deze patronen beïnvloeden. Door ordinatie wordt ruis onderdrukt, de redundantie opgespoord en samengevat, en worden uitbijters snel herkend.

Tabel[bewerken]

Een gegevensverzameling bestaat meestal uit een matrix of tabel met kolommen voor de objecten of "operationele eenheden") en rijen voor de attributen of variabelen. In de cellen staan de waargenomen waarden. Omdat het aantal rijen en kolommen hoog kan zijn, wordt visualisatie geholpen door een reductie in dimensies.

Tabel (matrix) met objecten en responsvariabelen
Afhankelijke variabele Object_1 Object_2 Object_3 Object_4
Responsvariabele_1 Respons_11 Respons_21 Respons_31 Respons_41
Responsvariabele_2 Respons_12 Respons_22 Respons_32 Respons_42
Responsvariabele_3 Respons_13 Respons_23 Respons_33 Respons_43
Responsvariabele_4 Respons_14 Respons_24 Respons_34 Respons_44
Responsvariabele_5 Respons_15 Respons_25 Respons_35 Respons_45
Tabel met objecten en onafhankelijke variabelen
Onfhankelijke variabele Object_1 Object_2 Object_3 Object_4
Onafhankelijke_var_1 Waarde_11 Waarde_21 Waarde_31 Waarde_41
Onafhankelijke_var_2 Waarde_12 Waarde_22 Waarde_32 Waarde_42

In exploratief onderzoek ontbreken vaak de waarden voor de onafhankelijke variabelen.

Typen variabelen[bewerken]

De variabelen zijn onder te verdelen in verschillende typen, afhankelijk van de rol die ze hebben in de ordinatie:

  • de afhankelijke variabele of responsvariabele: de gemeten variabele, voorspeld of geobserveerd door de onderzoeker. Van deze variabele wordt aangenomen dat hij wordt beïnvloed door de onafhankelijke variabelen.
  • de onafhankelijke variabele: de variabele waarvan wordt aangenomen dat het een oorzaak weergeeft van de waarden van de responsvariabele:
    • experimentele variabelen: door de onderzoeker ingestelde of gemanipuleerde variabelen,
    • passieve variabelen of factoren: variabelen die invloed hebben op de responsies en kunnen worden vastgesteld, maar niet experimenteel worden beïnvloed.

Meetschalen[bewerken]

Er kunnen verschillende meetschalen worden onderscheiden:

Transformatie van gegevens[bewerken]

In toepassingen van ordinatietechnieken moeten variabelen vaak getransformeerd worden.

Nominale en ordinale variabelen worden getransformeerd naar binaire "dummyvariabelen", zodat er mee gerekend kan worden.
Circulaire variabelen moet naar twee dummyvariabelen worden omgezet.

Sommige variabelen met kwantitatieve meetschaal kunnen geen negatieve waarden aannemen, zoals tellingen en aantallen, de temperatuur in Kelvin.

Distantie en similariteit (verschil en overeenkomst)[bewerken]

Objecten kunnen overeenkomen of verschillen van elkaar op grond van de waarden van de responsvariabelen. Op grond van de onderlinge verschillen (distanties, dissimilariteit, afstanden) tussen de objecten kunnen deze door ordinatie in een meerdimensionale ruimte worden geplaatst. De onderlinge afstanden kunnen met verschillende distantiematen worden aangegeven, zoals euclidische afstand, chikwadraat-afstand en verschillende correlatiematen.

Sommige ordinatietechnieken, zoals Nonmetric multidimensional scaling (NMDS) hebben een maat nodig voor de distantie. Door het berekenen van de distanties tussen de objecten gaat de informatie van de variabelen verloren. Methoden gebaseerd op afstand geven niet simultaan de scores voor de objecten en de attributen, in tegenstelling tot eigenanalysemethoden.

In bijvoorbeeld de ecologie en de psychologie zijn een zeer groot aantal andere maten voor distantie of voor overeenkomst in omloop. Maten voor overeenkomst kunnen vaak eenvoudig worden omgerekend in maten voor verschil, en omgekeerd. Objecten met overeenkomstige waarden voor de attributen krijgen in een ordinatie waarden op de ordinatie-assen die vlak bij elkaar liggen. Als er echter de verschillen groter zijn komen de objecten verder bij elkaar vandaan te liggen.

De eigenanalysemethoden kunnen ordinatieassen voor de objecten en de attributen simultaan berekenen zonder de tussenstap van het vooraf berekenen van distanties. Toch blijken deze methoden indirect verband te houden met distanties, zoals de euclidische afstand (bij hoofdcomponentenanalyse) of chi-kwadraatafstand (bij correspondentieanalyse).

Responsmodellen[bewerken]

Afhankelijk van het toepassingsgebied moet er een verwacht verband worden geformuleerd tussen de de ordinatieas en de respons. Niet altijd mag een lineair verband worden verwacht tussen de onafhankelijke variabele en de responsvariabele.

Lineair en gaussisch responsiemodel

Het unimodale model stelt dat responsiefuncties van attributen (dat wil zeggen het verband tussen de responsies als functie van positie langs een ordinatiegradiënt) unimodaal of eentoppig is.

Organismen hebben een beperkte tolerantie voor de milieufactoren: zij vertonen gewoonlijk geen lineair maar een unimodaal verband (gaussische functie) tussen de mate van voorkomen (abundantie, frequentie) en de milieugradient: beneden de minimumwaarde van de verklarende verklarende variabele (milieuvariabele) is de soortrespons voor de soort 0 (het organisme komt niet voor). De respons neemt toe bij hogere waarden van de verklarende variabele (milieuvariabele). De waarde van de verklarende variabele (milieuvariabele) waarbij de maximale respons optreedt heet het optimum. Bij hogere waarden van de verklarende verklarende variabele is de respons lager. Bij het maximum voor de verklarende variabele (milieuvariabele) benadert de respons de 0-waarde.

Er is een unieke set van optimale waarden op de ordinatieas voor de soorten, waarbij de soort maximale respons bereikt.

In het ideale geval heeft de responsecurve een symmetrische vorm en is eentoppig, maar in de praktijk komen andere vormen ook voor, zoals een bimodale respons. Veel ordinatiemethoden blijken in de ecologie goed te werken met het optimum-model als er voldoende spreiding is voor de waarden van de verklarende milieuvariabelen en door de aanwezigheid van een groot aantal soorten.

Eigenanalyse[bewerken]

Eigenanalyse staat centraal in de wiskundige discipline van lineaire (matrix) algebra. Eigenanalyse is een techniek die leidt tot een lineaire reductie in dimensionaliteit (singular value decomposition). Eigenanalyse kan worden uitgevoerd op een vierkante, symmetrische distantiematrix, of direct op de gegevensmatrix. Er is een unieke oplossing ongeacht de volgorde van de gegevens. Bij grote matrices vereist eigenanalyse een iteratieve aanpak voor benadering van het antwoord.

De ordinatie-assen zijn de eigenvectoren, die bestaan uit de scores voor de objecten en voor de attributen. De assen zijn ongecorreleerd door orthogonalisatie.

De eigenwaarden, die met een eigenvector samenhangen, vormen een maat voor de sterkte van de as. Ze hebben wiskundige betekenis, die kan helpen bij de interpretatie. In de hoofdcomponentenanalyse en redundantie-analyse zijn eigenwaarden de 'verklaarde variantie'; bij correspondentieanalyse en verwante methoden zijn eigenwaarden 'verklaarde inertia'. De eerste as heeft de hoogste eigenvalue, de volgende assen hebben een steeds lagere eigenwaarde.

Eigenanalyse-methoden pogen zo getrouw mogelijk attributen langs assen (gradiënten) te plaatsen. Sommige eigenanalyse-gebaseerde ordinatiemethoden zijn bijzondere gevallen van op distanties gebaseerde methoden, waar de distantie is gebaseerd op de euclidische afstand of op de chi-kwadraat afstand.

Objecten en attributen worden gelijktijdig geordineerd, en kunnen dus zowel worden weergegeven in hetzelfde ordinogram (dit wordt een biplot genoemd).

Indirecte of directe, canonische ordinatie[bewerken]

Men spreekt van indirecte ordinatie of ongebonden gradiëntanalyse als bij de ordinatie geen verklarende variabelen zijn betrokken. De gradiënten worden berekend uit de gegevensmatrix (tabel) met de onderlinge verschillen tussen de objecten (distantiematrix), of als latente variabelen uit de gegevens van de responsvariabelen. Veel gebruikte indirecte ordinatiemethoden zijn hoofdcomponentenanalyse (PCA), correspondentieanalyse (CA) en detrended correspondence analysis (DCA).

Men spreek van directe ordinatie, gebonden gradiëntanalyse of van canonische ordinatie als de gradiënten bestaan uit (combinaties van) verklarende variabelen. De gradiënten worden berekend uit de gegevensmatrix van de objecten en responsvariabelen en door regressie uit de verklarende variabelen. Hiervoor is ook een gegevensmatrix van de objecten en de verklarende variabelen nodig. De meest gebruikte directe ordinatiemethoden zijn redundantieanalyse (RDA) en Canonische correspondentieanalyse (CCA).

In partiële ordinatie worden de effecten van bepaalde verklarende variabelen door middel van partiële regressie geëlimineerd.

Overzicht van methoden[bewerken]

Overzicht van ordinatietechnieken
Afko Naam Methode Distantie Model Ordinatie-assen vervorming
2de as
PO Polar Ordination
Bray-Curtis Ordination
Wisconsin Ordination
informeel distantie onbekend indirect onbekend
PCoA Principal Coordinates Analysis
Metric Multidimensional Scaling
informeel distantie onbekend indirect onbekend
NMDS Nonmetric Multidimensional Scaling
MultiDimensional Scaling
informeel distantie onbekend indirect onbekend
PCA Principal Component Analysis eigenwaarde (euclidische afstand) lineair indirect hoefijzer
CA Correspondence Analysis
Reciprocal Averaging
eigenwaarde (chi-kwadraat afstand) unimodaal indirect boog
DCA Detrended Correspondence Analysis eigenwaarde (chi-kwadraat afstand) unimodaal direct, canonisch, partieel detrending
RDA Redundancy Analysis eigenwaarde (euclidische afstand) lineair direct, canonisch, partieel onbekend
CCA Canonical Correspondence Analysis eigenwaarde (chi-kwadraat afstand) unimodaal direct, canonisch, partieel onbekend
DCCA Detrended Canonical Correspondence Analysis eigenwaarde (chi-kwadraat afstand) unimodaal direct, canonisch, partieel detrending

Gewogen gemiddelden[bewerken]

Het ordenen of rangschikken van objecten volgens de waarden van gemeten onafhankelijke (verklarende) variabelen valt onder de informele methoden. Voor de attributen kunnen gewogen gemiddelden worden berekend aan de hand van:

  • de waarden van een verklarende variabele voor de objecten.
  • de waarden van de afhankelijk variabelen voor de objecten, die daarbij als gewicht dienen; deze mogen niet negatief zijn.

Deze methode is in de ecologie bekend geworden onder de naam Weighted Averaging (WA). Door deze eenvoudige methode kan in de ecologie op snelle wijze goed communiceerbare resultaten worden verkregen.

Polaire ordinatie (PO)[bewerken]

Polaire ordinatie, Bray-Curtis ordinatie of Wisconsin ordinatie is een eenvoudigste techniek om de ordinatie te visualiseren, en kan eventueel met de hand worden uitgevoerd. PO wordt uitgevoerd op grond van een matrix met distanties tussen de objecten. De ordinatie begint met de keuze van 2 objecten met een grote onderlinge distantie voor de eerste ordinatie-as. De plaats van de overige objecten op deze as wordt berekend met de distanties ten opzichte van beide eindpunten. Op deze as worden twee bij elkaar liggende objecten met desondanks grote distantie gezocht voor de volgende as.

Principal coordinates analysis (PCoA)[bewerken]

Principal coordinates analysis (PCoA), vroeger ook metric multidimensional scaling, maximaliseert de lineaire correlatie tussen afstandsmaten en afstand tussen de punten in de ordinatie. Als men alleen beschikt over een distantiematrix of een similariteitsmatrix is dit een geschikte methode. Het onderliggende is dat er een vast aantal van gradiënten is. Meestal worden er 2 of 3 assen geselecteerd. De methode maximaliseert de lineaire correlatie tussen de afstanden in de distantie matrix en de afstanden in een ruimte met een lage dimensie. Als de euclidische afstand als distantie wordt gekozen, dan is PCoA gelijk aan PCA.

Nonmetric multidimensional scaling (NMDS)[bewerken]

Nonmetric multidimensional scaling (NMDS) heet soms multidimensional scaling (MDS), hoewel deze term eigenlijk gebruikt wordt voor PCoA. Als men alleen beschikt over een distantiematrix of een similariteitsmatrix is dit een geschikte methode. Het onderliggende model is dat er een vast aantal van gradiënten is. NMDS maximaliseert rangordecorrelatie tussen afstandsmaten en afstand in de ordinatieruimte. Punten worden zodanig verplaatst dat de "stress" geminimaliseerd wordt. Stress is een maat voor de discrepantie tussen de twee attributen (soorten) afstand. Vooraf wordt het aantal dimensies opgeven. Dit kan op grond van een grafiek van de stress als functie van het aantal assen.

Hoofdcomponentenanalyse (PCA)[bewerken]

1rightarrow.png Zie Hoofdcomponentenanalyse voor het hoofdartikel over dit onderwerp.

Hoofdcomponentenanalyse is relatief objectief en biedt een redelijke, maar grove indicatie van relaties. Het is de eenvoudigste en oudste eigenanalyse-gebaseerde methode. Het is voor veel doeleinden gebruikt, ook als een ordinatie-methode. Hoofdcomponentenanalyse was een van de eerste op ecologische gegevens toegepast ordinatiemethoden.

Wiskundig is hoofdcomponentenanalyse een eigenanalyse. Meetkundig is PCA een starre rotatie van de oorspronkelijke gegevensmatrix, en kan gedefinieerd worden als een projectie van de objecten (monsters) op een nieuwe set van assen, zodanig dat de maximale variantie wordt geprojecteerd of "geëxtraheerd" langs de eerste as, het maximale verschil met niet-gecorreleerde as 1 is geprojecteerd op de tweede as, de maximale variatie ongecorreleerd met de eerste en tweede as is geprojecteerd op de derde as, enz. Zo wordt er een hoog-dimensionale ruimte geproduceerd, waarbij de afstanden tussen de objecten hun euclidische afstand wordt.

De eerste PCA-ordinatieas kan men zich voorstellen als een regressielijn in de n-dimensionale ruimte van attributen (soorten) en/of monsterpunten, waarbij de afstand tussen elk der punten en de lijn zo klein mogelijk is (kleinste kwadraten methode, lineaire regressie). De tweede en volgende PCA-assen worden op dezelfde wijze berekend als de eerste, waarbij echter een stap is ingebouwd waardoor de as ongecorreleerd wordt gemaakt aan de voor-gaande as(sen): zodat de loodrechte afstand van elk object naar de ordinatie assen tot een minimum wordt beperkt. De assen zijn lineaire combinaties van variabelen (attributen). De gewichten staan bekend als 'coëfficiënten' of 'lading'.

De eigenvalues vertegenwoordigen de door elke as geëxtraheerde variantie of verklaarde variantie. De som van de eigenvalues zal de som van de variantie van alle variabelen.

In de meeste toepassingen van hoofdcomponentenanalyse worden variabelen vaak gemeten in verschillende eenheden. De gegevens worden dan gestandaardiseerd, met gemiddelde van nul en variantie-eenheid (hoofdcomponentenanalyse met een correlatiematrix). De variabelen kunnen negatieve waarden aannemen. Indien uitgevoerd op een correlatiematrix is de som van de eigenvalues gelijk aan het aantal variabelen. Indien uitgevoerd op een covariantiematrix zal de som van de eigenvalues gelijk aan de som van de varianties van alle attributen.

Hoofdcomponentenanalyse is een methode die gebaseerd is op een lineair responsie model van de attributen. Deze benadering werkt in de ecologie alleen als een beperkt traject van de milieugradiënten wordt bekeken. Als hoofdcomponentenanalyse wordt toegepast op gegevens van uiteenlopende milieus, treedt het hoefijzereffect op. Dit komt doordat hoofdcomponentenanalyse is gebaseerd op een lineair responsmodel. Voor de vegetatie gegevens is dit een serieus probleem . Dit wordt veroorzaakt door de curvilinearity van attributen (soorten) langs gradiënten, vooral bij een matig tot hoge beta-diversiteit (lange milieugradiënt).

Correspondentieanalyse (CA)[bewerken]

Correspondentieanalyse (ook wel Reciprocal Averaging (vaak aangeduid als RA), 'two-way weighted averaging') kan worden beschreven in termen van chi-kwadraat afstanden, op de zelfde manier waarop hoofdcomponentenanalyse kan worden beschreven in termen van euclidische afstanden. Reciprocal Averaging (wederzijdse middeling) betekent dat scores van de objecten worden berekend als een gewogen gemiddelde van de scores van de attributen en attribuutscores worden berekend als een gewogen gemiddelde van het objectscores. De iteraties worden voortgezet totdat er geen verandering meer optreedt. De methode een heuristische benadering is van een ordinatie die op een eentoppig (Gaussisch) responsmodel is gebaseerd (ter Braak 1985). Er zijn een aantal verschillende algoritmen voor CA. De eigenwaarde van een as is gelijk de correlatiecoëfficiënt tussen attributen scores en scores steekproef.

Correspondentieanalyse heeft als probleem het boogeffect: de tweede ordinatieas kan een kwadratische vervorming zijn van de eerste as. Het boogeffect wordt ook veroorzaakt door unimodale verdeling langs gradiënten. Omdat de uiteinden van de gradiënt niet zijn ingebogen is het boogeffect niet zo ernstig als het hoefijzereffect bij de hoofdcomponentenanalyse.

Detrended correspondence Analysis (DCA)[bewerken]

Bij Detrended correspondence Analysis worden twee tekortkomingen van correspondentieanalyse kunstmatige verholpen. De tweede ordinatieas is vaak een kwadratische vervorming van de eerste ordinatieas (Jongman et al. 1995). Door middel van 'detrending' wordt het kwadratische verband verwijderd. Daarnaast treedt het verschijnsel da de uiteinden van de ordinatieassen gecomprimeerd zijn waardoor de objecten of attributen daar te dicht op elkaar liggen. Dit heeft te maken met het feit dat de attributen die voorkomen in de objecten (monsterpunten) die aan het einde van de gradiënt liggen in het gegevensmateriaal niet meer een unimodale respons vertonen, maar monotoon of dalend of stijgend zijn. Door middel van 'nonlinear rescaling' worden de uiteinden van de ordinatieassen opgerekt.

In de ecologie wordt deze techniek veelvuldig toegepast, omdat de lengte van de ordinatieas een schatting is voor de beta-diversiteit. Bij korte ordinatieassen wordt dan gekozen voor hoofdcomponentenanalyse, omdat het niet nodig is van een unimodaal model uit te gaan.

Redundantieanalyse (RDA)[bewerken]

Redundantieanalyse is de canonische uitvoering van hoofdcomponentenanalyse. De (canonische) ordinatieassen zijn lineaire combinaties van de verklarende variabelen. RDA is nuttig wanneer er korte gradiënten zijn. Redundantieanalyse is een geschikte methode bij korte termijn experimentele studie. De behandelingen (treatments) vormen de verklarende variabelen (en zijn meestal dummyvariabelen).

Canonische correspondentieanalyse (CCA)[bewerken]

Canonische correspondentieanalyse is de gebonden (canonische) uitvoering van hoofdcomponentenanalyse. De canonische ordinatieassen zijn lineaire combinaties van de verklarende variabelen. RDA is nuttig wanneer er korte gradiënten zijn. Evenals RDA is Canonische correspondentieanalyse een geschikte methode bij korte termijn experimentele studie. De behandelingen (treatments) vormen de verklarende variabelen (en zijn meestal dummyvariabelen).CCA is ook toepasbaar onder een lineair model, zolang men geïnteresseerd is in attributen-presenties in plaats van absolute waarden voor de attributen (ter Braak en Šmilauer).

De keuze van de milieu/verklarende variabelen van grote invloed op de uitkomst van CCA en andere gebonden ordinaties.

Detrended canonical correspondence analysis (DCCA)[bewerken]

Detrended canonical correspondence analysis is de gebonden (canonische) uitvoering van Detrended correspondence analysis (DCA). De canonische ordinatieassen zijn lineaire combinaties van de verklarende variabelen.

Toepassingen[bewerken]

In de toepassing van ordinatietechnieken zijn voorbeelden van objecten: kwadraten, relevés of vegetatieopnamen, archeologische sites, locaties, monsters, geografische locaties, stroomsedimenten, sedimentmonsters, pollenvallen; de variabelen of kenmerken zijn abundanties, dichtheid, biomassa, frequentie, voorkomen, aan-en afwezigheid van plantensoorten, artefacten, deeltjesgrootte klassen, morfometrische kenmerken, sporenelementen, pollentypen, diatomeeën typen, fossiele taxa e.a.

Toepassingen in de ecologie[bewerken]

Hoewel gemeenschapsecologie (biocoenologie, synoecologie, community ecology) een vrij jonge wetenschap is, begon de toepassing van kwantitatieve methoden vrij vroeg.

  • In 1930 begon Ramensky voor vegetatie informele ordinatietechnieken te gebruiken. Deze informele en grotendeels subjectieve methoden werd bekend in de vroege jaren 1950.
  • In 1951 ontwikkelden Curtis en McIntosh (1951) de continuüm-index, die later leidden tot conceptuele verbanden tussen soortresponsies op de gradiënten en multivariate methoden.
  • Kort daarna introduceerde Goodall (1954) de term ordinatie in een ecologische context voor de hoofdcomponentenanalyse.
  • Bray en Curtis (1957) ontwikkelden de polaire ordinatie, die de eerste veel gebruikte ordinatietechniek werd in de ecologie.
  • Austin (1968) gebruikt canonische correlatie om de plant-milieu relaties te beoordelen in wat misschien het eerste voorbeeld van een multivariate analyse van de directe gradiënt in ecologie.
  • In 1973 introduceerde Hill bij de ecologen de correspondentieanalyse, een techniek uit de jaren 1930. Correspondentie analyse heeft geleidelijk de polaire ordinatie verdrongen, die vandaag de dag nog weinig beoefenaars heeft.
  • Fasham (1977) en Prentice (1977) ontdekten en toonden onafhankelijk het nut aan voor de gemeenschapsecologie van Kruskal's (1964) metric multidimensional scaling, oorspronkelijk bedoeld als een psychometrische techniek.
  • Hill (1979) corrigeerde een aantal van de gebreken van correspondentieanalyse. Daardoor ontstond de Detrended Correspondence Analysis, tegenwoordig de meest gebruikte techniek voor indirecte gradiëntanalyse. De software die Detrended Correspondentie Analyse uit voert, DECORANA, werd de ruggengraat van vele latere softwarepakketten.
  • Gauch's (1982) boek Multivariate Analysis in Community Ecology beschreef ordinatie in niet-technische termen voor de gemiddelde beoefenaar, waardoor ordinatietechnieken binnen kwamen in de mainstream.
  • Fuzzy set theory, door Roberts (1986) ingevoerd bij de ecologen, is een veelbelovende aanpak die samenhangt met polaire ordinatie, maar moet nog veel aanhangers te winnen.
  • Ter Braak (1986) luidde het begin in van de grootste revolutie in de moderne ordinatiemethoden met Canonical Correspondence Analysis. Deze techniek koppelde correspondentie-analyse aan regressiemethoden, en voorziet in het testen van hypothesen.
  • Ter Braak en Prentice (1988) ontwikkelden een theoretisch basis van de ordinatietechnieken, en voorzagen de gradiëntanalyse zo van een stevige theoretische fundering.

De meeste matrices (tabellen) met gemeenschapsgegevens komen overeen in enkele algemene kenmerken, ongeacht de omvang of de betrokken taxa:

  • Ze zijn meestal schaars: een groot deel (vaak de meerderheid) van de waarden bestaat uit nullen. De meeste soorten zijn zeldzaam, dat wil zeggen dat de meeste soorten gewoonlijk aanwezig zijn in een minderheid van de locaties (objecten) en weinig bijdragen aan de totale abundantie.
  • Het aantal factoren die van invloed soortensamenstelling is potentieel zeer groot. Zo kan bijvoorbeeld in een bos de boomdichtheid worden beïnvloed door de tijd sinds brand, opstand, nutriënten, bodem diepte, bodemtextuur, de beschikbaarheid van water. Het aantal belangrijke factoren is meestal klein: een paar factoren verklaren het grootste deel van de variatie. Een andere manier om dit te zeggen is dat de intrinsieke dimensionaliteit laag is.
  • Er is veel ruis. Zelfs onder ideale omstandigheden zullen de monsters sterk van elkaar verschillen. Dit is grotendeels te wijten aan toevallige gebeurtenissen, hoewel ook de waarnemerfout van invloed kan zijn.
  • Er is veel redundante informatie: soorten delen vaak dezelfde verspreiding. Het is deze eigenschap van redundantie die ons in staat om gevoel van gegevens over de samenstelling.
Bronnen, noten en/of referenties

Referenties

  • Braak, C.J.F. ter & I.C. Prentice (1988) A theory of gradient analysis. Adv. Ecol. Res. 18:271-313.
  • Braak, C.J.F. ter & P. Šmilauer (2002) CANOCO Reference Manual and CanoDraw for Windows User's Guide: Software for Canonical Community Ordination. (version 4.5)
  • Causton, D.R. (1988) An introduction to vegetation analysis. Unwin Hyman, London.
  • Clark, C. An Introduction to Ordination
  • Gauch, H.G. (1982) Multivariate Analysis in Community Ecology. Cambridge University Press, Cambridge.
  • Jongman et al (1995) Data Analysis in Community and Landscape Ecology. Cambridge University Press, Cambridge.
  • Katwijk, M.M. van & C.J.F. ter Braak (2008) Handleiding voor het gebruik van multivariate analysetechnieken in de ecologie.
  • Kent, M., and P. Coker (1992) Vegetation description and analysis: a practical approach. Belhaven Press, London.
  • Pielou, E.C. (1984) The Interpretation of Ecological Data: A Primer on Classification and Ordination. Wiley, New York.
  • Økland, R.H. (1990) Vegetation ecology: theory, methods and applications with reference to Fennoscandia. Sommerfeltia Supplement 1:1-233.