Hulp bij statistiek en SPSS!

Overzicht statistiek 2018-2019

Dit document bevat manieren die ik zelf gebruik, maar dit sluit niet uit dat het op een andere manier kan, of dat alle informatie waterdicht is. Ik ben dus niet verantwoordelijk voor jouw cijfer, maar dit lijkt mij logisch.

Belangrijke kennis

SPSS

  • 3 schermen waarin wij werken:
    • Het databestand (rood): hierin staan alle variabelen en alle data. Het databestand heeft zelf 2 vensters: data view en variable view. De data view bevat alle data en de variable view bevat alle informatie over de variabelen. Belangrijk om bij de variable view altijd na te gaan of de gegevens in de kolommen kloppen. Besteed extra aandacht aan de kolommen values (antwoordmogelijkheden) en measure (meetniveau).
  • Syntax (oranje): in dit venster komen alle opdrachten/commando’s die wij SPSS uit willen laten voeren. Denk bijvoorbeeld aan een frequentieanalyse of het berekenen van de Cronbachs alfa. Zorg dus dat je bij alle opdrachten die je wil uitvoeren eerst op PASTE drukt en ze vanuit de syntax uitvoert.
    • Output (blauw): hierin komen alle resultaten van de opdrachten die je via de syntax uitvoert.

Meetniveaus

Centrummaten en spreidingsmaten

  • Centrummaten: modus, mediaan en gemiddelde
  • Spreidingsmaten: spreidingsbreedte, standaardafwijking en variantie
  • Makkelijke manier om alle maten in één keer weer te geven: analyze/descriptive statistics/frequencies – kies nu de juiste variabele(n) – statistics en vink dan alle zes de maten aan (mode, median, mean, range, std. deviation en variance) (paste niet vergeten)

Betrouwbaarheid

  • Gemeten met Cronbachs alfa. Een waarde van 0,7 of hoger betekent dat de vragenlijst betrouwbaar is. De waarde kan tussen 1 en de min oneindig liggen.

Afhankelijke en Onafhankelijke variabele

Voorbeeld: Is er een verschil in inkomen in euro’s nauwkeurig tussen mannen en vrouwen?

Met logica kom je vaak een heel eind. Hangt mijn inkomen af van mijn geslacht of hangt mijn geslacht af van mijn inkomen? Wanneer je geslacht af zou hangen van je inkomen dan veranderd je geslacht dus op het moment dat je inkomen veranderd, wat natuurlijk zeer onlogisch is. Wel kan je inkomen afhangen van je geslacht. Inkomen is dus in dit voorbeeld de afhankelijke variabele en geslacht de onafhankelijke variabele. Aan het eind van dit document staan een aantal vragen om dit te oefenen! Een extra tip is dat wanneer het gaat over geslacht dit nagenoeg altijd de onafhankelijke variabele is.

Verschil

Een voorbeeldvraag hiervoor is: is er een verschil in inkomen (in euro’s nauwkeurig) tussen mannen en vrouwen. Deze vraag beantwoord je door de gemiddelde score van de mannen te vergelijken met de gemiddelde score van de vrouwen. (methode 1 van opdracht 26)

Samenhang

Gemeten met de Spearman of de Pearson Correlatie. Minimaal één variabele moet een interval meetniveau hebben. Is de andere variabele ordinaal dan gebruik je de Spearman Correlatie. Zijn beide variabele interval of ratio dat kijk je naar de grootte van de steekproef. Is de steekproef kleiner dan 25 personen dan gebruik je de Spearman Correlatie. Is de steekproef groter dan 25 personen gebruik je de Pearson correlatie. Voor de Pearson correlatie geldt dat deze tussen de -1 en de +1 kan liggen. Tussen de 0,1 tot 0,3 geeft een kleine samenhang weer, tussen de 0,3 en de 0,5 is een gemiddelde samenhang en boven de 0,5 spreken we van een grootte samenhang. Dit geldt dus zowel voor een positieve als negatieve Pearson correlatie. Wanneer de Pearson Correlatie: 0 is bestaat er dus geen enkel verband tussen de variabelen. Een antwoord op een samenhangvraag geef je als volgt: Er is een (kleine/gemiddelde/grote) (positieve/negatieve) samenhang tussen variabele 1 en variabele 2.

Stappen die je nodig hebt om tot een samengestelde variabele te komen

Algemeen

Zorg dat je bij je assessment al je schermen goed opslaat! Zowel het databestand, de syntax en de output.

De handleiding heeft het volgende leerdoel: De berekeningen waarvan we vinden dat u die voldoende moet beheersen zijn: gemiddelde berekenen, frequenties draaien, gemiddelde schaal- score maken, hercoderen, betrouwbaarheid variabele bepalen, nieuwe variabele aanmaken en het verband tussen twee variabelen berekenen en interpreteren.

De stappen hieronder staan niet precies in dezelfde volgorde maar bevatten wel al deze onderwerpen!

Start

  1. Controleren op fouten/onmogelijke waarden en deze vervolgens aanpassen/herstellen. Vaak hebben wij de originele vragenlijsten niet en vullen we dus een missende waarde in voor de waarden die niet kloppen.
  • Aan de hand van de vraag die je wil beantwoorden kijk je naar de juiste variabele
  • Welke antwoordmogelijkheden zijn er? (values in de variabele view) Veel vragen binnen de psychologie werken met een zogenoemde Likert schaal. Deze schaal bestaat vaak uit 5 en soms uit 7 antwoordmogelijkheden. Hierbij is het vaak zo dat een score van 1 laag is en een score van 5 hoog dus bijvoorbeeld: 1 = helemaal mee oneens en 5 is dan helemaal mee eens. De scores hiertussen lopen dan dus op. Hoewel een likerschaal officeel een ordinaal meetniveau heeft gebruiken wij in de psychologie het meetniveau interval zodat wij gemiddelden mogen berekenen.
  • Welk begrip/schaal wil je gaan bekijken en welke vragen horen hier? (dit wordt in de opdracht meestal aangegeven en anders verklapt de naam van de variabele vaak dat deze bij een bepaalde schaal hoort.)
    • Een sterke eerste stap is om te kijken naar de betrouwbaarheid van de vragen. Dit wil zeggen: meten de vragen samen, betrouwbaar, het begrip. Dit meten we met de cronbachs alfa.
    • De stappen hiervoor zijn: analyze/scale/reliability analysis – vul vervolgens de vragen in die samen de schaal meten. Voordat je op paste drukt moet je eerst onder het kopje statistics de opties scale en scale if item deleted aanvinken. Nadat je deze opdracht vanuit je syntax uitgevoerd hebt kan je het volgende zien:
/Users/Tim/Desktop/Schermafbeelding 2018-12-18 om 09.48.59.png
  • Voor Cronbachs Alfa geldt dat een waarde van 0,7 of hoger betekent dat de vragen samen voldoende betrouwbaar de schaal meten. In het voorbeeld is de schaal dus niet voldoende betrouwbaar, maar wanneer wij de vraag ‘ik koop graag een softijsje’ uit de lijst zouden verwijderen is de cronbachs alfa wel voldoende betrouwbaar. Dit is dus meteen de betekenis van ‘Cronbach’s Alpha if Item Deleted’. Is je Cronbachs alfa lager dan 0,7 dan is het zeker dat je vragen moet hercoderen voordat je een samengestelde variabele kan maken.
  • Nu je weet welke vragen samen de schaal vormen moet je gaan kijken of alle vragen in de juiste richting gesteld zijn, als dit niet zo is moet je hercoderen. Met de juiste richting wordt bedoeld dat een hoge score op de vraag ervoor zorgt dat de vraag het te meten begrip/schaal goed meet. Een manier die je kan gebruiken is om te werken met plus en min. Dit staat hieronder in het voorbeeld weergegeven. LET OP: als je zelf manier hebt die voor jou beter werkt dan moet je die natuurlijk gebruiken.

Voorbeeld: Het te meten begrip is zelfwaardering en de vragen/items zijn gemeten met een likertschaal van 1=helemaal mee oneens tot 5=helemaal mee eens (opdracht 23 van SPSS)

De schaal zelfwaardering is naar mijn mening positief dus wil ik dat een hoge score op de items ook positief is. We zien hier dat een hoge score op vraag 1 betekent dat die persoon erg tevreden is met zichzelf. Dit is goed voor de schaal zelfwaardering en krijgt van mij dus ook een plus. Een hoge score op vraag 2 betekend dat de persoon sterk het gevoel heeft nergens voor te deugen. Dit is in mijn ogen niet een hoge mate van zelfwaardering en daarom staat deze vraag niet in de juiste richting. Vraag 2 krijgt dus een min. Zo ga je de vragenlijst verder af.

            Wanneer je schaal een negatief begrip meet kan je dit met een min-teken aanduiden en de vragen die, met een hoge score, het negatieve begrip meten ook een min teken geven. Dit is dan precies het omgedraaide van het voorbeeld hierboven.

  • Wanneer je bepaald hebt welke vragen je wil hercoderen dan moet je dit gaan uitvoeren. Transform/recode into different variable/ levert het volgende scherm op:
  • Vul als nieuwe variabelennaam een simpele en logische naam in. Heet de originele variabele sest1_61 dan is het logisch om de nieuwe variabele sest1_61h te noemen. De h staat hierin dan voor hercoderen. (Heb je zelf een makkelijkere methode, gebruik die dan)
  • Klik vervolgens op de knop Old and New Values. Dit levert het volgende scherm op:
  • Aangezien we nu een likertschaal met de antwoordmogelijkheden 1 tot 5 gaan hercoderen moeten wij de waarden 1 tot en met 5 om gaan wisselen. De oude waarde 1 wordt de nieuwe waarde 5. De oude waarde 2 wordt de nieuwe waarde 4. De waarde 3 blijft de waarde 3, maar moet ook aangegeven worden. De oude waarde 4 wordt de nieuwe waarde 2 en de oude waarde 5 wordt de nieuwe waarde 1.
  • Zodra je dit gedaan hebt druk je op continue en in het volgende scherm op change en daarna op paste. De hergecodeerde variabelen zijn nu terug te vinden in de variable view in het databestand. Zorg er nu voor dat alle gegevens in de kolommen kloppen!! Kijk goed naar de values en de measure kolommen. (Bij hercoderen stelt SPSS automatisch een nominaal meetniveau in terwijl dit scale (interval) moet zijn!)
  • Na het hercoderen bereken we opnieuw de Cronbachs Alfa om te kijken of de vragenlijst voldoende betrouwbaar is. Volg dezelfde stappen als bij vier. Als je een betrouwbare vragenlijst hebt mag je een samengestelde variabele maken.
  • Nu duidelijk is dat de schaal betrouwbaar genoeg is maak je een samengestelde variabele. Deze nieuwe variabele combineert de scores van alle vragen/items die samen het begrip/schaal meten. Dit gaat als volgt: transform/compute – Vervolgens vul je bij target variable: een naam in voor de schaal. In het Numeric Expression veld vul je in dat jet het gemiddelde van de items wil meten. Vervolgens vul je de items in die samen het begrip meten. In het voorbeeld van vraag 23 zijn dit dus de variabelen (sest1_61 t/m sest10_70) Zorg er dus ook weer voor dat als je vragen gehercodeerd hebt je deze gebruikt in plaats van hun originele vorm.
  • Als je alle variabelen ingevuld hebt druk je op paste en voer je de opdracht vanuit je syntax uit. Het resultaat is een nieuwe variabele die terug te vinden is in het data bestand in de variable view. Kijk weer goed naar de kolommen of alle waarden kloppen. Omdat je het gemiddelde van gehele getallen berekend hebt moet je ervoor zorgen dat je twee decimalen achter de komma laat zijn, anders rond SPSS uit zichzelf af en kloppen je antwoorden niet meer.
  • Nu duidelijk is dat de vragen betrouwbaar genoeg zijn om het begrip/schaal te meten en je de samengestelde variabele gemaakt hebt kan je verschil en samenhang vragen gaan beantwoorden. Deze vragen bevatten altijd minimaal 2 variabelen en dus is het van belang om na te gaan wat de afhankelijke en wat de onafhankelijke variabele is.
    • Wanneer je de af- en onafhankelijke variabele bepaald hebt moet je bepalen welke meetniveaus gelden. Dit bepaalt namelijk op welke manier je gaat kijken naar een verschil of samenhang. De volgende tabel is een slimme om uit je hoofd te leren.

Extra info: een kleine steekproef is 25 of minder respondenten. Alles boven de 25 respondenten mag je als een grote steekproef rekenen.

  • De laatste stap is om de vragen te gaan beantwoorden. Voor alle vier de methoden hieronder de stappen die je moet zetten. Bij alle voorbeelden druk je dus ook weer op paste voordat je de opdracht uitvoert.
    • Vergelijken van gemiddelden: analyze/descriptive statistics/explore –
  • Kruistabel: analyze/descriptive statistics/crosstabs – onafhankelijke variabele altijd in de kolommen en de afhankelijke variabele zet je in de rijen. Onder de knop Cells vink je percentages voor de rijen aan. Dit maakt het makkelijker om een antwoord te formuleren.
  • Spearman en Pearson: let goed op het verschil in meetniveaus en de grootte van de steekproef! Analyze/correlate/bivariate

Vink hierbij dus de benodigde methode aan.

Extra:

Weergeven van resultaten in een Grafiek

  • Histogram: analyze/descriptive statistics/frequencies – kies nu de juiste variabele – charts/histogram/paste
  • Pie chart (cirkeldiagram): graphs/legacy dialogs/pie/define – zet nu de juiste variabele bij define slices by
  • Spreidingsdiagram(scatterplot): graphs/legacy dialogs/scatter/simple – definieer nu de x-as en de y-as.

Oefenen met afhankelijk en onafhankelijk

  1. Is er een verschil tussen mannen en vrouwen in de mate van zelfwaardering (gemeten met 10 zelfwaarderingsvragen met likertschaal)? N= 50
  2. Is er een samenhang tussen opleidingsniveau (vmbo/havo/vwo) en inkomen in euro’s nauwkeurig. N=30
  3. Is er een samenhang tussen inkomen (weing/veel) en geslacht (man/vrouw)? N=30
  4. Is er een samenhang tussen opleidingsniveau (vmbo/havo/mbo) en IQ (in IQ-punten nauwkeurig). N=50
  5. Is er een samenhang tussen mannelijkheid (cijfer 1 t/m 10, gemeten met 1 vraag) en aantal veroorzaakte verkeersongelukken (in aantallen nauwkeurig). N= 15

Antwoorden

  1. Variabelen: Geslacht (nominaal) en Zelfwaardering (interval)
    1. Afhankelijk: Zelfwaardering
    1. Onafhankelijk: Geslacht (bijna altijd zo)
  2. Variabelen: Opleidingsniveau (ordinaal) en Inkomen in euro’s nauwkeurig (ratio)
    1. Afhankelijk: Inkomen
    1. Onafhankelijk: Opleidingsniveau
  3. Variabelen: Inkomen (weinig/veel) ordinaal en Geslacht (nominaal)
    1. Afhankelijk: Inkomen
    1. Onafhankelijk: Geslacht (bijna altijd zo)
  4. Variabelen: Opleidingsniveau (nominaal want mbo past niet in het rijtje) en IQ (ratio)
    1. Afhankelijk: IQ
    1. Onafhankelijk: Opleidingsniveau
  5. Variabelen: Mannelijkheid (Interval) en aantal ongelukken (ratio)
    1. Afhankelijk: Aantal ongelukken
    1. Onafhankelijk: Mannelijkheid

Succes ermee!

De onderwijscommissie