Stuksgewijze regressieanalyse

Uit Wikipedia, de vrije encyclopedie
(Doorverwezen vanaf Stuksgewijze regressie-analyse)

In de statistiek is stuksgewijze regressieanalyse, of naar het Engels: gesegmenteerde regressieanalyse, een methode van regressieanalyse waarbij het bereik van de onafhankelijke variabele opgedeeld wordt in intervallen (segmenten) en een regressieanalyse wordt uitgevoerd voor ieder segment. Stuksgewijze regressieanalyse wordt toegepast als de relatie tussen de onafhankelijke en afhankelijke variabele plotselinge veranderingen vertoont van segment tot segment. Als in de segmenten lineaire regressies worden uitgevoerd, spreekt men van stuksgewijze of gesegmenteerde lineaire regressie.

De grenzen tussen de segmenten worden breekpunten genoemd. Men onderscheidt breekpunten met een kritieke, een veilige en een drempelwaarde waarboven of waaronder (on)gewenste effecten optreden.[1] Het eerste deel van de analyse houdt de bepaling van de breekpunten in. Soms volgen deze op natuurlijke wijze uit de probleemstelling, in andere gevallen moeten ze geschat worden.

Voorbeeld[bewerken | brontekst bewerken]

Gesegmenteerde lineaire regressie

In de nevenstaande figuur is het verband weergegeven tussen de opbrengst van mosterd en het zoutgehalte van de bodem. De opbrengst is gemeten in ton/ha en het zoutgehalte als de specifieke elektrische geleidbaarheid (Ec) van de bodem in dS/m.[2]

Er is één breekpunt B = 4,93. De geschatte regressievergelijking links van B is:

,

met correlatiecoëfficiënt

(niet significant verschillend van 0)

en rechts van B:

.

met correlatiecoëfficiënt

(significant verschillend van 0)

hetgeen er op wijst dat bodemzoutgehalten < 4.93 dS/m veilig zijn en bodemzoutgehalten > 4.93 dS/m de opbrengst verlagen met 0,129 ton/ha per eenheid van toename van het zoutgehalte.

De figuur is gemaakt met het computerprogramma SegReg.[3] De grens tussen de segmenten (het breekpunt) wordt hierin zo geoptimaliseerd dat de kwadratensom van de afwijkingen van de Y waarden ten opzichte van de regressielijnen minimaal is.

Men mag echter op biologische gronden verwachten dat de respons van mosterd op de milieufactor elektrische geleidbaarheid unimodaal is en lijkt op een gaussische functie. Met behulp van regressie kan een schatting gemaakt worden van het optimum (elektrische geleidbaarheid waarbij de groeirespons van mosterd maximaal is) en van de tolerantie.

Referenties[bewerken | brontekst bewerken]

  1. Frequency and Regression Analysis. Chapter 6 in: H.P.Ritzema (ed., 1994), Drainage Principles and Applications, Publ. 16, pp. 175-224, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands. ISBN 90 70754 3 39 : [1]
  2. R.J.Oosterbaan, D.P.Sharma, K.N.Singh and K.V.G.K.Rao, 1990, Crop production and soil salinity: evaluation of field data from India by segmented linear regression. In: Proceedings of the Symposium on Land Drainage for Salinity Control in Arid and Semi-Arid Regions, February 25th to March 2nd, 1990, Cairo, Egypt, Vol. 3, Session V, p. 373 - 383.
  3. SegReg for segmented regression, vrije download van