Keywords: Einstichproben-Gauß-Test, statistischer Test, Statistik Beratung, Data Science
Im folgenden geht es um den Einstichproben-Gauß-Test. Der Test prüft anhand des Mittelwerts aus einer normalverteilten Stichprobe, ob der Mittelwert einer Grundgesamtheit gleich einem vorgegebenem Mittelwert ist (bzw. kleiner oder größer). Die Nullhypothese lautet, dass die Mittelwerte gleich sind: \[H_0:\,\mu=\mu_0\] Die Alternativhypothese lautet, dass die Mittelwerte ungleich sind: \[H_1:\,\mu\neq\mu_0\]
Seien \(X_1, X_2, \dots, X_n\) unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \(\mu \in \mathbb{R}\) und bekannter Standardabweichung \(\sigma > 0\). Dann ist die Teststatistik \(Z\), ist wie folgt definiert:
\[Z = \sqrt{n}\frac{\bar X - \mu_0}{\sigma},\]
wobei
Die Teststatistik ist unter der Nullhypothese standardnormalverteilt.
Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\), Mittelwert \(=30\) Standardabweichung \(\sigma=5\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=30.5\) ist:
X <- rnorm(20, mean=30, sd=5)
Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:
n <- 20
Xmw <- 1/n*sum(X)
Z <- sqrt(n)*(Xmw-30.5)/5
print(Xmw)
## [1] 30.70812
print(Z)
## [1] 0.1861473
Der p-Wert zu dieser Teststatistik \(Z =0.1861473\) bzw. \(\bar X = 30.708119\) ist dann gegeben durch:
2*pnorm(q=-abs(Z))
## [1] 0.8523292
Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen
library(compositions)
Gauss.test(X,mean=30.5,sd=5,alternative="two.sided")
##
## Ein Stichproben Gauss-Test
##
## data: X
## T = 30.708, mean = 30.5, sd = 5.0, p-value = 0.8523
## alternative hypothesis: two.sided
Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, nicht verwerfen, da der p-Wert des Tests \(>0.05\) ist.
Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\), Mittelwert \(=30\) Standardabweichung \(\sigma=5\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=35\) ist:
X <- rnorm(20, mean=30, sd=5)
Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:
n <- 20
Xmw <- 1/n*sum(X)
Z <- sqrt(n)*(Xmw-35)/5
print(Xmw)
## [1] 29.74371
print(Z)
## [1] -4.701365
Der p-Wert zu dieser Teststatistik \(Z =-4.7013649\) bzw. \(\bar X = 29.7437142\) ist dann gegeben durch:
2*pnorm(q=-abs(Z))
## [1] 2.584282e-06
Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen
library(compositions)
Gauss.test(X,mean=35,sd=5,alternative="two.sided")
##
## Ein Stichproben Gauss-Test
##
## data: X
## T = 29.744, mean = 35, sd = 5, p-value = 3e-06
## alternative hypothesis: two.sided
Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, verwerfen, da der p-Wert des Tests \(<0.05\) ist.