Shared Flashcard Set

Details

Cross-sectioneel onderzoek
Hoofdstuk 21
12
Psychology
Not Applicable
07/30/2023

Additional Psychology Flashcards

 


 

Cards

Term
Wat is regressieanalyse?
Definition
Een instrument voor onderzoekers (en studenten) waarmee op basis van de waarde op de ene variabele, een voorspelde waarde op de andere variabele berekend kan worden. Bovendien geeft regressieanalyse een indruk hoe accuraat die voorspelling zal zijn.
Term
Hoe moet de regressielijn lopen en wat doet regressieanalyse precies?
Definition
De lijn moet zo lopen dat de afwijking tussen elke geobserveerde y-score en de correspondeerde voorspelling zo klein mogelijk is. Dat is precies wat regressieanalyse doet: het is een methode om de lijn te vinden waarbij deze (gekwadrateerde) afwijkingen geminimaliseerd worden. De uitkomst van een regressieanalyse zijn twee getallen die de lijn beschrijven. Deze getallen heten de regressiecoëfficiënten en worden aangeduid met b’s of β’s, oftewel bèta’s.
Term
Wat houdt extrapolatie in?
Definition
Het berekenen van voorspellingen van een model voor waarden buiten het bereik van de data waarop dat model gebaseerd is.
Term
Wat is interpolatie?
Definition
Het gebruik van een model om tussenliggende waarden te berekenen
Term
Wat is het intercept?
Definition
Het intercept is de eerste zogenaamde regressiecoëfficiëent in het regressiemodel en wordt aangeduid met β0,B0 of b0.
Term
Wat geeft de tweede regressiecoëfficiënt oftewel, β1 aan?
Definition
De helling van de lijn. Deze regressiecoëfficiënt geeft de stijging (of daling) in de variabele op de y
-as aan als de variabele op de x
-as met 1 eenheid toeneemt.
Term
Wat is bij een dichotome variabele het regressiecoëfficiënt van de helling?
Definition
het verschil tussen de gemiddelden in de twee groepen.
Term
Wat betekent R2 (lees: R-kwadraat)?
Definition
Hoeveel van de variantie van de afhankelijke variabele verklaard kan worden met een regressiemodel: de ‘proportie verklaarde variantie’.

Hoe hoger R2, hoe meer van de afhankelijke variabele wordt verklaard met de voorspeller(s). Anders gezegd: de R2
zegt iets over de proportie variantie in
y die door x verklaard wordt.
R2 kan waarden aannemen van 0 tot en met 1
. Als alle geobserveerde scores, dus de punten in de puntenwolk, exact op een rechte lijn liggen en y dus perfect uit x te voorspellen is, zal R2 gelijk zijn aan 1. In dat geval verklaart x 100% van de variantie in y-scores, ofwel y kan perfect voorspeld worden uit x.
Term
Hoe bereken je de vrijheidsgraden (Df) voor de t-verdeling?
Definition
Die zijn gelijk aan het aantal deelnemers in de steekproef min het totale aantal regressiecoëfficiënten. De t-verdelingen voor 5, 10, 15, 20, 50,
100 en 200 deelnemers zijn in dit geval dus de t-verdelingen voor 3, 8, 13, 18, 48, 98 en 198 vrijheidsgraden. We hebben namelijk twee regressiecoëfficiënten: een voor het intercept en een voor de helling.
Term
Wat doe je bij centreren?
Definition
Centreren is de eerste stap van standaardisatie: je trekt het gemiddelde van elk datapunt af. Hiermee verandert de schaalverdeling van de variabele dus niet. Het enige gevolg is dat het gemiddelde na het centreren gelijk is aan 0.
Term
Wat gebeurt er met de hellingscoefficiënt en het intercept bij centreren?
Definition
Als je met een gecentreerde variabele een regressieanalyse doet, is de hellingscoëfficiënt nog hetzelfde, maar het intercept verandert.
Term
Welke 5 aannames worden er gemaakt in enkelvoudige regressieanalyse?
Definition
1) Continu meetniveau. In een regressieanalyse wordt aangenomen dat beide variabelen een continu meetniveau hebben (dus interval of ratio).

2) Lineariteit. Regressieanalyse veronderstelt dat het verband tussen de twee variabelen lineair is. Dat betekent dat voor elke waarde van de ene variabele de toe- of afname van de andere variabele hetzelfde moet zijn. Als de toe- of afname in de afhankelijke variabele hoger of lager is wanneer de voorspeller een lage of een hoge waarde heeft, dan kan enkelvoudige lineaire regressieanalyse het verband niet goed modeleren.

3) Onafhankelijkheid. Regressieanalyse neemt aan dat alle observaties onafhankelijk zijn. Het gaat hier niet om de observaties van de onafhankelijke en de afhankelijke variabele. Deze worden namelijk bij dezelfde onderzoekseenheid gemeten. Verondersteld wordt dat de onderzoekseenheden onafhankelijk zijn.

4) Normaliteit. Regressieanalyse neemt ook aan dat voor elke waarde van de voorspeller, de afhankelijke variabele normaal verdeeld is, oftewel dat de ruis (de error) normaal verdeeld is. Dit is nodig vanwege het algoritme dat in regressieanalyse wordt gebruikt om de best passende lijn te bepalen (en dus de regressiecoëfficiënten). De definitie van ‘best passende’ lijn is de lijn waarbij de residuen zo klein mogelijk zijn (dit heet ook wel ‘ordinary least squares’ of ‘ols’). Als de error in de afhankelijke variabele niet gemiddeld nul is, klopt dat algoritme niet.

5) Homoscedasticiteit. Dit betekent homogeniteit (gelijkheid) van varianties. Deze aanname houdt in dat voor elke waarde van de onafhankelijke variabele, de variantie in de afhankelijke variabele gelijk is. Als deze zachte aanname wordt geschonden zijn de regressiecoëfficiënten geen efficiënte schatters meer.
Supporting users have an ad free experience!