Keywords: fragebogenauswertung,fragebogen auswertung bachelorarbeit,wie werte ich einen fragebogen aus,fragebogen auswerten methode,auswertung fragebogen beispiel,fragebogen auswerten programm,auswertungsverfahren fragebogen

Email: info@orges.leka.de, Tel.: 015751078391

Einführung

Im folgenden geht es um die Auswertung eines Fragebogens welcher hier ausgefüllt werden kann. Die Daten stammen von hier. Der Fragebogen besteht aus 20 Likert-Skala Fragen und wurde von 13156 Personen ausgefüllt. Am Ende des Tests wurde zu jeder Person ein Score ermittelt. Die Fragen aus dem Test sind:

The following items were rated on a likert scale where 1 = strongly disagre 2= disagree 3=neutral 4=agree 5=strongly agree (0=they skipped):

Wir laden die Daten in R ein und schauen uns an wie der Score verteilt ist:

d <- read.csv("data.csv",header=TRUE)
plot(density(d$score),main="Verteilung von Score")

Auf den ersten Blick erscheint es so, als ob der Score normalverteilt ist. Wir wollen diese Beobachtung mit einem statistischen Test untermauern: Dazu wollen wir den Kolmogorov-Smirnow Test verwenden. Da der Test bei einer sehr großen Anzahl an Beobachtungen sehr scharf ist, wollen wir 1000 Personen zufällig ohne Zurücklegen aus der Stichprobe ziehen und den Test auf diese Personen anwenden, da wir nur wissen wollen ob die Variable Score näherungsweise normalverteilt ist:

set.seed(124)
scoreSample <- sample(d$score,1000)
ks.test(scoreSample,"pnorm",mean(scoreSample),sd(scoreSample))
## Warning in ks.test(scoreSample, "pnorm", mean(scoreSample),
## sd(scoreSample)): ties should not be present for the Kolmogorov-Smirnov
## test
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  scoreSample
## D = 0.037085, p-value = 0.1277
## alternative hypothesis: two-sided

Interpretation: Da der p-Wert größer als 0.05 ist, können wir die Nullhypothese nicht verwerfen, dass Variable Score in der beobachteten Stichprobe normalverteilt ist. Wir können also im Weiteren davon ausgehen, dass die Variable Score normalverteilt ist.

Wir wollen untersuchen, ob das Geschlecht Einfluss auf den Score hat. Zuerst schauen wir uns deskriptiv an wie die Verteilung bezüglich Geschlecht ist:

print( table(d$gender) )
## 
##    0    1    2    3 
##    8 8574 4481   93
print( prop.table( table(d$gender) ) )
## 
##            0            1            2            3 
## 0.0006080876 0.6517178474 0.3406050471 0.0070690179

Die Variable Gender ist folgendermaßen kodiert:

Gender Bedeutung
0 keine Angabe
1 männlich
2 weiblich
3 sonstiges

Wir schauen uns die Mittelwerte der Scores an bezüglich des Geschlechts:

tapply(d$score, d$gender,mean)
##        0        1        2        3 
## 72.37500 67.68358 62.42401 68.18280

Wie man sieht ist der Score bei Männern größer als bei Frauen. Das wollen wir mit einem statistischen Test untermauern: Wir verwenden den Zweistichproben T-Test:

Die Nullhypothese lautet: Der Mittelwert-Score bei Männern ist kleiner als der Mittelwert-Score bei Frauen.

t.test(d$score[d$gender==1], d$score[d$gender==2],alternative="greater")
## 
##  Welch Two Sample t-test
## 
## data:  d$score[d$gender == 1] and d$score[d$gender == 2]
## t = 22.557, df = 9562, p-value < 2.2e-16
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  4.876002      Inf
## sample estimates:
## mean of x mean of y 
##  67.68358  62.42401

Interpretation: Da der p-Wert signifikant kleiner als 0.001 ist, können wir die Nullhypothese verwerfen.

Wir testen auch folgende Hypothese: Nullhypothese: Der Mittelwert-Score bei Männern ist gleich dem Mittelwert-Score bei Frauen.

t.test(d$score[d$gender==1], d$score[d$gender==2],alternative="two.sided")
## 
##  Welch Two Sample t-test
## 
## data:  d$score[d$gender == 1] and d$score[d$gender == 2]
## t = 22.557, df = 9562, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  4.802507 5.716624
## sample estimates:
## mean of x mean of y 
##  67.68358  62.42401

Interpretation: Da der p-Wert signifikant kleiner als 0.001 ist, können wir die Nullhypothese verwerfen.

Das heißt wir können davon ausgehen, dass der Score-Wert bei Männern größer ist als bei Frauen.