Term
|
Definition
een methode om naar samenhang tussen meerdere items tegelijkertijd te kijken. Factoranalyse kan worden gebruikt bij het ontwikkelen van meetinstrumenten, maar dus ook bij de verificatie van de validiteit van meetinstrumenten. |
|
|
Term
Wat is het verschil tussen item-analyses en factoranalyses? |
|
Definition
Terwijl item-analyses kijken naar de onderdelen van het meetinstrument en hoe elk onderdeel samenhangt met elk andere onderdeel, wordt factoranalyse gebruikt om naar alle onderdelen van een meetinstrument samen te kijken.
Iets accurater beschouwd betreft item-analyse het onderzoeken van de onderdelen van een meetinstrument. Er wordt dus niet naar de hele koelkast tegelijk gekeken, maar naar of de deur goed sluit, of de thermostaat goed werkt, en of het lampje wel werkt.
Factoranalyse kijkt naar of de onderdelen van het meetinstrument wel samenwerken zoals ze dat moeten doen: gaat het lampje in de koelkast ook aan als de deur opengaat? Waar item-analyse dus atomair werkt door de kleinste onderdelen in het meetinstrument te bekijken, is factoranalyse meer ‘holistisch’ en wordt gekeken of de onderdelen van een meetinstrument die moeten samenwerken wel goed samenwerken. |
|
|
Term
Leg de 2 vormen factoranalyses uit. |
|
Definition
Exploratieve factoranalyse (EFA): Wordt vaak gebruikt om te zoeken naar mogelijke onderliggende factoren om een set variabelen te verklaren.
Confirmatieve factoranalyse (CFA): Onderzoekt hoe goed een vooropgestelde set factoren presteert.
Daarnaast bestaat er een derde variant, principale componentenanalyse (PCA). Deze is in de psychologie zelden bruikbaar, maar wordt daarbuiten wel veel gebruikt. |
|
|
Term
Wat is het verschil tussen een covariantiematrix en een correlatiematrix? |
|
Definition
Omdat correlaties de covarianties zijn, maar dan gecorrigeerd voor de schaal waarop beide variabelen zijn gemeten, is de covariantiematrix van een set gestandaardiseerde variabelen gelijk aan de correlatiematrix. Namelijk, als een variabele wordt gestandaardiseerd (door van elk datapunt eerst het gemiddelde af te trekken en dan te delen door de standaarddeviatie) is de schaalinformatie al verwijderd. Correlaties worden daarom ook wel gestandaardiseerde covarianties genoemd.
Correlaties zijn niet per se beter of slechter dan covarianties. Soms is schaalinformatie belangrijk, en soms is het juist belangrijk om te kunnen vergelijken los van de schalen van en spreiding in de verschillende variabelen. Het is wel belangrijk het verschil en de implicaties te kennen, vooral bij factoranalyse waarbij je moet kiezen of je correlaties of covarianties wilt analyseren. |
|
|
Term
Wat is het doel van principale componentenanalyse (PCA)? |
|
Definition
het terugbrengen van een grote groep variabelen tot een kleinere groep componenten. Componenten kun je beschouwen als nieuwe variabelen. Eigenlijk zijn het zogenaamde ‘lineaire combinaties’ van de bestaande variabelen. Een simpel voorbeeld: stel je hebt drie variabelen A, B en C. De eerste component is dan bijvoorbeeld 25% van A, 50% van B en 75% van C. De tweede component is 50% van A, 25% van B en 10% van C en de derde component is 25% van A, 25% van B en 15% van C. Die lineaire combinaties kun je dus een beetje zien als herformuleringen van de oorspronkelijke variabelen. |
|
|
Term
Wat is het Kaiser-criterium? |
|
Definition
Als je een correlatiematrix wilt reproduceren, draagt elke variabele precies 1 bij aan de totale variantie. Dat betekent dat een component met een eigenwaarde lager dan 1 minder variantie verklaart dan een van de oorspronkelijke variabelen. Je zou dit als criterium kunnen gebruiken om te bepalen of je een component wilt behouden. In ons geval houden we dan nog maar één component over (het tweede component verklaart namelijk al minder dan 1 van de totale variantie). Dit heet ook wel het Kaiser-criterium, genoemd naar een van de pioniers van de factoranalyse. |
|
|
Term
|
Definition
Een andere manier om te kiezen hoeveel componenten je wilt behouden is door een zogenaamde screeplot te maken. Hierin worden de eigenwaarden gevisualiseerd. |
|
|
Term
Wat houdt eigenwaarde in? |
|
Definition
Om het optimale aantal componenten te kunnen kiezen, is het handig om te weten hoeveel elke component bijdraagt aan het reproduceren van de correlatiematrix. Dat kunnen we uitrekenen. De som van de gekwadrateerde ladingen van een component is de proportie van de totale variantie in de covariantiematrix die een component verklaart. Dit getal noemen we de eigenwaarde. |
|
|
Term
|
Definition
Die unieke variantie heet de uniciteit en is altijd het complement van de communaliteit. |
|
|
Term
|
Definition
Bij PCA (en EFA) kunnen we de componenten ‘roteren’ zodat in elke component vooral die variabelen tot uitdrukking komen die er het sterkst mee samenhangen. Er bestaan verschillende soorten rotaties. Als we willen dat de componenten ongecorreleerd blijven, kunnen we de zogenaamde varimax-rotatie gebruiken.
Rotatie is primair een hulpmiddel om de interpretatie van de componenten te vergemakkelijken. Rotatie leidt niet tot een betere voorspelling. |
|
|
Term
Waar is rotatie primair een hulpmiddel voor? |
|
Definition
Rotatie is primair een hulpmiddel om de interpretatie van de componenten te vergemakkelijken. Rotatie leidt niet tot een betere voorspelling. |
|
|
Term
Welke 2 soorten rotaties bestaan er? |
|
Definition
Orthogonale (onafhankelijk, als de correlatie tussen de componenten 0 is, bv de Varimax) en nonorthogonale rotaties. |
|
|
Term
Wat is communaliteit en hoe kom je daaraan? |
|
Definition
De communaliteit is het deel van de variantie in een item dat wordt beschreven door de componenten (in PCA) of de factoren (in EFA). |
|
|
Term
Wat is het complement van de communaliteit? |
|
Definition
De uniciteit: de unieke variantie in het item. Binnen een reflectief meetmodel neem je aan dat de gedeelde variantie veroorzaakt wordt door de onderliggende factor of factoren: dat zijn de latente constructen. De uniciteit is dan dus de error. Hier ben je niet in geïnteresseerd en je wilt de factoren dus ook niet zo kiezen dat ze proberen om die error te verklaren. |
|
|
Term
Wat is proportie verklaarde variantie (R2)? |
|
Definition
R2 is het kwadraat van de zogenaamde multipele correlatie (R) en kan worden berekend met een regressieanalyse. Wanneer we een regressieanalyse uitvoeren met daarin het eerste item als afhankelijke variabele en alle andere items als voorspellers, dan volgt daaruit de proportie verklaarde variantie (R2) in dat eerste item op basis van al die andere items.
De R2 is dus een schatting van hoeveel overlap er is tussen het eerste item enerzijds en alle andere items anderzijds. Omdat we binnen een reflectief meetmodel aannemen dat die overlappende variantie wordt veroorzaakt door een of meer onderliggende latente constructen, is die proportie verklaarde variantie (R2) een goede schatting voor de communaliteit. |
|
|
Term
Verwerkingsopdracht 3.1.4: Wat kunnen we van de totale variantie aftrekken om te bepalen hoeveel we wel willen reproduceren?
De communaliteiten. De uniciteiten |
|
Definition
De communaliteit is wat een variabele deelt met de factoren; de uniciteit is de variantie die uniek is voor die specifieke variabele. Die uniciteiten zijn daarom wat we niet hoeven te verklaren, en die kunnen we dus aftrekken van de totale variantie om te kijken welk deel we willen verklaren. |
|
|
Term
Hoeveel deelnemers heb je nodig als de communaliteiten rond .5 liggen? |
|
Definition
100 tot 200, maar alleen als je zeker weet dat er maar weinig factoren zijn waar alle items op laden. |
|
|
Term
Hoe zit het met de benodigde omvang van een steekproef als de variabelen dichotoom zijn? |
|
Definition
Als de variabelen dichotoom zijn, zijn de benodigde steekproeven overigens nog groter (Pearson & Mundform, 2010). Dit geldt altijd als er minder meetwaarden zijn, omdat er informatie over variantie verloren gaat. |
|
|
Term
Hoe zit het met de steekproefomvang als het meetinstrument al is ontwikkeld? |
|
Definition
Als een meetinstrument al is ontwikkeld, is de situatie anders. De items zijn dan al geselecteerd op basis van onder andere hun communaliteit en factorladingen. Bovendien zijn die bekend uit de eerdere analyses. Dat betekent dat het niet langer nodig is om in de steekproefomvang rekening te houden met tegenvallende (lage) communaliteiten of meer factoren dan verwacht.
Dit betekent dat vaak kleinere steekproeven zullen volstaan en bovendien dat de ontwikkelaars van het meetinstrument hebben kunnen specificeren hoeveel deelnemers nodig zijn. De richtlijnen die zij geven kun je volgen. Als er geen richtlijnen gegeven zijn, dan weet je in elk geval alvast hoeveel factoren er zijn en hoe hoog de factorladingen en communaliteiten zijn, zodat je kunt opzoeken hoeveel deelnemers je ongeveer nodig hebt. |
|
|
Term
Wanneer wordt er exploratieve en wanneer confirmatieve factoranalyse gebruikt? |
|
Definition
Exploratieve factoranalyse (EFA) wordt dus gebruikt voor het ontdekken van clusters van items, als er nog geen theoretische indeling bekend is, terwijl confirmatieve factoranalyse (CFA) is bedoeld om een bestaande theoretische groepering van variabelen (items) te toetsen of te valideren. |
|
|
Term
Hoe zit een confirmatieve factoranalyse eruit? |
|
Definition
n CFA specificeer je hoeveel factoren er zijn en welke items onder welke factor vallen. Die items laden vervolgens alleen op de factor waar ze bij horen. Alle variantie die ze niet delen met die ene factor wordt beschouwd als ruis (error). De factoren mogen onderling met elkaar correleren in CFA, maar ook ongecorreleerd zijn. |
|
|