Gebruiker:T.vanschaik/Kladblok2

Uit Wikipedia, de vrije encyclopedie

Matrixformulering[bewerken | brontekst bewerken]

Regressiecoëfficiënten[bewerken | brontekst bewerken]

Naast de hierboven aangegeven methoden om de "beste lijn" door een aantal meetpunten te berekenen is het ook mogelijk deze berekening in matrixnotatie uit te voeren. Het voordeel hierbij is dat de manier van werken voor alle variaties van verbanden toegepast kan worden zolang ze geschreven kunnen worden als:
verg. 1
Bij het uitvoeren van een lineaire regressie is het aantal meetpunten altijd groter dan wiskundig strikt genomen noodzakelijk is: wiskundig zijn twee punten voldoende om een rechte lijn te bepalen. Een rechte lijn wordt ook door twee parameters beschreven: de helling en hoe groot het stuk is dat van de y-as wordt afgesneden. Zijn drie parameters nodig om de lijn te beschrijven, dan zijn ook minimaal drie meetpunten nodig, en zo verder. Voor het bepalen van de betrouwbaarheid van de uitgevoerde metingen zijn meer meetpunten nodig. In onderstaand voorbeeld wordt uitgegaan van een verband dat geschreven kan worden als:
verg. 2
of iets gebruikelijker:
verg. 3
Je kunt hierbij denken aan een eenparig versnelde beweging waarbij de afstand tot het voorwerp (y), een functie is van de tijd (x), de afstand waarmee begonnen wordt (c), de beginsnelheid (b) en de versnelling(a). In de natuurkunde ziet de vergelijking er als volgt uit:
verg. 4
Om de verschillende parameters a, b en c te bepalen wordt een aantal (meer dan 3!) metingen gedaan:
tijd afstand
2 6.4
3 10.2
4 12.4
5 13.2
6 13.4
7 13.3

Voluit uitgeschreven zien de vergelijkingen er als volgt uit:

6.4 = a 2^2 + b 2 + c
10.2 = a 3^2 + b 3 + c
12.4 = a 4^2 + b 4 + c
13.2 = a 5^2 + b 5 + c
13.4 = a 6^2 + b 6 + c
13.3 = a 7^2 + b 7 + c

in een matrixnotatie wordt dit:

y-matrix   x-matrix   b-matrix
verg. 5
Om het resultaat van de berekening te laten passen op de manier waarop kwadratische vergelijkingen genoteerd worden (} en anderzijds aan te sluiten bij de manier waarop met name meestal genoteerd wordt (de eerste kolom voor de constante, de tweede voor de eerste graad van x, de derde voor de tweede graad van x etc.) is de volgorde van de parameters in omgedraaid.

De waarden van y die horen bij de verschillende waarden voor x kunnen berekend worden met behulp van de matrixvermenigvuldiging:

verg. 6
De waarden in zijn in principe te berekenen, want vergelijking 5 is één vergelijking met één onbekende. In matrixnotatie werkt dit iets minder eenvoudig dan in de gewone algebra, al zijn de principes identiek.

Voor matrices is de bewerking "delen" niet gedefinieerd. Dat betekent dat <math.\bar{X}</math> "naar de andere kant brengen" door te delen, niet werkt. Via een aantal vermenigvuldigingen kan het wel gerealiseerd worden. De volgorde van bewerken is daarbij ook belangrijk. Wel geldt de regel: vermenigvuldig je links en rechts met hetzelfde, dan blijft de gelijkheid waar. De sleutelstap is zorgen dat de <math.\bar{X}</math>-matrix wordt omgezet in het matrix-equivalent van "1", de eenheidsmatrix. In dit geval is dat een 3*3-matrix. Deze matrix ontstaat op de volgende manier:

verg. 7
is de getransponeerde die ontstaat uit door de rijen en de kolommen te verwisselen. Aan de rechterzijde ontstaat nu de eenheidsmatrix door { * } met zijn inversie te vermenigvuldigen.
verg. 8
Het product van de verschillende matrices voor <math.\bar{B}</math> is de eenheidsmatrix. Daarvoor geldt dat ermee vermenigvuldigen hetzelfde is als vermenigvuldigen met 1: Je kunt het dus weglaten:
verg. 9
De getransponeerde van is:
 
 
verg. 10
en het matrixproduct van * wordt:
* =
* =
verg. 11
De volgende stap is de lastige omdat dit bijna niet handmatig is uit te voeren: het bepalen van de inverse van de laatste matrix. Binnen de nauwkeurigheid geeft dit:[1]
 
 
verg. 12
Invullen van de verschillende matrices in vergelijking 7 levert nu:
* * =
* * =
verg. 13
Berkenen van het eerste matrixproduct geeft dan:
* =
* =
verg. 14
wat uiteindelijk leidt tot:
=
=
verg. 15
Worden de hier verkregen getallen in de 2e graads vergelijking ingevuld dan leidt dit tot:
verg. 16
Worden de hier verkregen getallen vervolgens ingevuld en de bij de x-waarden horende y-waarden berekend dan leidt dit tot:
x-waarden   gemeten y-waarden   berekende y-waarden
verg. 17

Betrouwbaarheid[bewerken | brontekst bewerken]

Deze manier van rekenen wordt veel toegepast in de natuurwetenschappen. Daarbij is niet alleen de grootte van de best passende getallen belangrijk, maar ook de betrouwbaarheid ervan. Dat blijkt ook uit het vergelijken van de laatste twee kolommen in vergelijking 17 hierboven. De trend klopt, maar het is geen absolute match. De verschillen worden meestal, als de onderzoeker voldoende vertrouwen heeft in zijn model van de werkelijkheid waarin hij de metingen gedaan heeft, toegeschreven aan onnauwkeurigheden in de meting.

Om aan te geven hoe goed de gevonden getallen passen bij de uitgevoerde metingen wordt gebruik gemaakt van het verschil tussen de gemeten waarde en de waarde die volgens de berekende parameters gevonden zouden moeten worden, de residuen. De waarden zijn een schatting, ze worden aangeduid met de term "geschatte waarden". Om de geschatte waarden te bepalen wordt de volgende matrixnotatie gebruikt:

verg. 18
De aanduiding van en met het accent circonflexe wordt gebruikt om aan te geven dat dit geschatte waarden zijn (zie vergelijking 17). De residuen laten zich nu berekenen uit:
                  =         
=
verg. 19


  1. Berekening me behulp van OpenOffice Calc, 19-2-2021