Keywords: Einstichproben-Gauß-Test, statistischer Test, Statistik Beratung, Data Science

Einführung

Im folgenden geht es um den Einstichproben-Gauß-Test. Der Test prüft anhand des Mittelwerts aus einer normalverteilten Stichprobe, ob der Mittelwert einer Grundgesamtheit gleich einem vorgegebenem Mittelwert ist (bzw. kleiner oder größer). Die Nullhypothese lautet, dass die Mittelwerte gleich sind: \[H_0:\,\mu=\mu_0\] Die Alternativhypothese lautet, dass die Mittelwerte ungleich sind: \[H_1:\,\mu\neq\mu_0\]

Definition der Teststatistik

Seien \(X_1, X_2, \dots, X_n\) unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \(\mu \in \mathbb{R}\) und bekannter Standardabweichung \(\sigma > 0\). Dann ist die Teststatistik \(Z\), ist wie folgt definiert:

\[Z = \sqrt{n}\frac{\bar X - \mu_0}{\sigma},\]

wobei

Die Teststatistik ist unter der Nullhypothese standardnormalverteilt.

Beispiele

Der Mittelwert der Grundgesamtheit ist gleich einem vorgegebenem Mittelwert

Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\), Mittelwert \(=30\) Standardabweichung \(\sigma=5\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=30.5\) ist:

X <- rnorm(20, mean=30, sd=5)

Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:

n <- 20
Xmw <- 1/n*sum(X)
Z <- sqrt(n)*(Xmw-30.5)/5
print(Xmw)
## [1] 30.70812
print(Z)
## [1] 0.1861473

Der p-Wert zu dieser Teststatistik \(Z =0.1861473\) bzw. \(\bar X = 30.708119\) ist dann gegeben durch:

2*pnorm(q=-abs(Z))
## [1] 0.8523292

Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen

library(compositions)
Gauss.test(X,mean=30.5,sd=5,alternative="two.sided")
## 
##  Ein Stichproben Gauss-Test
## 
## data:  X
## T = 30.708, mean = 30.5, sd = 5.0, p-value = 0.8523
## alternative hypothesis: two.sided

Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, nicht verwerfen, da der p-Wert des Tests \(>0.05\) ist.

Der Mittelwert der Grundgesamtheit ist ungleich einem vorgegebenem Mittelwert

Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\), Mittelwert \(=30\) Standardabweichung \(\sigma=5\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=35\) ist:

X <- rnorm(20, mean=30, sd=5)

Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:

n <- 20
Xmw <- 1/n*sum(X)
Z <- sqrt(n)*(Xmw-35)/5
print(Xmw)
## [1] 29.74371
print(Z)
## [1] -4.701365

Der p-Wert zu dieser Teststatistik \(Z =-4.7013649\) bzw. \(\bar X = 29.7437142\) ist dann gegeben durch:

2*pnorm(q=-abs(Z))
## [1] 2.584282e-06

Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen

library(compositions)
Gauss.test(X,mean=35,sd=5,alternative="two.sided")
## 
##  Ein Stichproben Gauss-Test
## 
## data:  X
## T = 29.744, mean = 35, sd = 5, p-value = 3e-06
## alternative hypothesis: two.sided

Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, verwerfen, da der p-Wert des Tests \(<0.05\) ist.