Overleg:Factoranalyse

Pagina-inhoud wordt niet ondersteund in andere talen.
Uit Wikipedia, de vrije encyclopedie

Stappen in de factoranalyse

1. Het uitgangspunt is de correlatiematrix 2. Kies een benadering 3. Ga na of factoranalyse een geschikte techniek is gegeven de data 4. Bereken de initiële factoroplossing 5. Bepaal het aantal factoren 6. Roteer de initiële oplossing 7. Benoem de factoren 8. Bereken voor elke respondent een score op elke factor

Wat is techniek hier anders dan rekentechniek?

statistische rekentechniek is dubbelop. Het rekenen is al opgesloten in het (meer specifieke) statistische. Ofwel je zegt factoranalyse is een rekentechniek, of je zegt factoranalyse is een statische techniek. Een statische rekentechniek is een tautologie. Mijn voorkeur heeft het om te zeggen dat het een statistische techniek is, omdat je daarmee een meer specifieke situatie aanduidt; integraalrekenen is ook een rekentechniek, maar wel een andere familie dan statistiek.
OK, maar een tautologie is het niet. Niet iedere statistische techniek is een rekentechniek, denk aan steekproeftechnieken. Bovendie zou ik niet iedere vorm van wiskunde als rekentechniek willen beschouwen.
Een beetje een gelegenheidsargument, maar gelet op het feit dat je zelf de grafische methode expliciet tot de factoranalyse betrekt (evenmin een rekentechniek, maar wel factoranalyse) geldt dat factoranalyse buiten de verzameling van de (statistische) rekentechnieken valt, maar (nog steeds) binnen de verzameling van (alle) statistische technieken.

Waarom die nadruk op geobserveeerde variabelen. Dat doet denken aan de "obsservables" in de natuurkunde, maar daar gaat het hier niet om. De factoren, die weliswaar niet waargenomen zijn, zijn, als combinaties van de geobserveerde variabelen, in zekere zin wel waarneembaar.

juist om het verschil tussen de twee type variabelen duidelijk te maken; in de oorspronkelijke versie van het artikel werd voor alles (factoren, en gemeten 'items') het woord variabele gebruikt, wat op mij erg verwarrend over kwam. Overigens verwar je waarnemen met interpreteren. Factoren zijn niet direct waarneembaar; hun 'bestaan' kan afgeleid worden uit de waarneming. Consequent gebruik van geobserveerde variabelen en latente variabelen past ook beter in de wetenschapsfilosofischetraditie (denk bijv. aan het logisch positivisme).
Ik schreef "in zekere zin waarneembaar". Soms zelfs echt. Het ging me erom dat ze niet zo "unobservable" zijn als de unobservables in de fysica.
Ik weet niet precies tegen welk gebruik van "unobservables" in de natuurkunde je je verzet; ik vermoed echter dat het niet eens zo ver aflicht van wat ik bedoel, juist omdat een groot aantal wetenschapsfilosofen juist een natuurkundigde achtergrond hebben.
De enige directe waarneming die je aan een factor kunt doen is als de factor uit 1 'observeerbare' variabele bestaat. Als een factor al uit twee items is opgebouwd, komt er (een klein beetje) interpretatie aan te pas. En zelfs dan heb je eerst nog de data moeten interpreteren om te 'weten' dat het slechts een 1-item factor betrof.
Dat klinkt nogal triviaal, maar zoals ik met mijn verwijzing naar logisch positivisme al probeerde aan te geven zijn er complete scholen van filosofen die stellen dat interpretatie niet tot echte kennis kan leiden.

Ik hecht toch wel aan de benaming verklarende variabelen. In de statistiek zijn verklarende variabelen ook waarneembaar, of instelbaar.

Maar volgens mij niet precies hetzelfde. De term is sowieso niet heel erg specifiek; bedoel je bijvoorbeeld onafhankelijke (verklarende) versus afhankelijke (verklaarde) variabelen? Of bedoel je slechts die variabelen die een grote verklarende kracht bezitten? Daarnaast is een 'geobserveerde' verklarende variabele in het ene model exogeen (verklarend), terwijl dezelfde 'geobserveerde' variabele in het andere model endogeen (verklaard) is. In beide modellen blijven het echter wel geobserveerde variabelen.
OK, ik denk dat ik me vooral verzette tegen het "geobserveerde". Daar ben ik nog niet echt gelukkig mee.
Heb er even een boek bij gepakt om het mogelijk wat "aanvaardbaarder" te maken. Using Multivariate Statistics (Tabachnick & Fidell, 2007:650) "because there are normally fewer factors than observed variables...", ook een google search geeft me de indruk dat ik niet de enige ben die in deze context over observeerbare variabelen spreekt.

Waarom zo de nadruk op matrixalgebra? Het gebruik daarvan is niet essentieel voor factoranalyse.

Een boude bewering; even een korte opsomming van matrices waar je m.i. bij factoranalyse niet zonder kunt: het begint al bij de correlatiematrix; factor-score matrix, factor-loadings matrix, pattern-matrix, factor-score coefficienten matrix, structuur-matrix, Factor correlatie matrix, Eigenwaarde matrix, Eigenwaarde vector matrix.
Bij een 2 factor model kan ik me voorstellen hoe je een oplossing kunt benaderen zonden matrices te gebruiken (bijvoorbeeld grafisch), maar de nadruk ligt er dan op dat je a) de oplossing slechts benadert en b) tot twee dimensies beperkt bent. De enige manier om bijvoorbeeld een rotatie met meer dan 2 factoren uit te voeren is echt via matrixalgebra.
Alleen als het eigenwaardeprobleem aan de orde komt, heb je recht van spreken. Alle andere genoemde matrices zijn gewoon getalverzamelingen. Een factoranalyse hoeft niet perse als eigenwaardeprobleem behandeld te worden, al is dat de gangbare analysevorm. Er zijn grafische methoden, zoals je al aangaf en ad hoc-methoden.
Matrices zijn per definitie 'getal'-verzamelingen. Het gaat juist om de bewerkingen die op deze verzamelingen worden uitgevoerd. Bijvoorbeeld ook bij het roteren van factor-scores (doorgaans essentieel) ontkom je niet aan matrixalgebra. Ik weet niet precies wat je precies met ad hoc-methoden bedoelt, maar beperkte benaderingen & speciale gevallen zijn voor mij geen overtuigende voorbeelden om aan te geven dat matrixalgebra niet essentieel is bij factoranalyse.

Madyno 26 apr 2007 17:44 (CEST)[reageer]