Keywords: Einstichproben-t-Test, statistischer Test, Statistik Beratung, Data Science

Einführung

Im folgenden geht es um den Einstichproben-t-Test. Der Test prüft anhand des Mittelwerts aus einer Stichprobe, ob der Mittelwert einer Grundgesamtheit gleich einem vorgegebenem Mittelwert ist (bzw. kleiner oder größer). Die Nullhypothese lautet, dass die Mittelwerte gleich sind: \[H_0:\,\mu=\mu_0\] Die Alternativhypothese lautet, dass die Mittelwerte ungleich sind: \[H_1:\,\mu\neq\mu_0\]

Definition der Teststatistik

Seien \(X_1, X_2, \dots, X_n\) unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \(\mu \in \mathbb{R}\) und Standardabweichung \(\sigma > 0\). Dann ist die Teststatistik \(T\), ist wie folgt definiert:

\[T = \sqrt{n}\frac{\bar X - \mu_0}{S},\]

wobei

Die Teststatistik ist unter der Nullhypothese t-verteilt mit \(n-1\) Freiheitsgraden.

Beispiele

Der Mittelwert der Grundgesamtheit ist gleich einem vorgegebenem Mittelwert

Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\) und Mittelwert \(=30\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=30.5\) ist:

X <- rnorm(20, mean=30, sd=5)

Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:

n <- 20
Xmw <- 1/n*sum(X)
S <- sqrt(1/(n-1)*sum((X-Xmw)^2))
T <- sqrt(n)*(Xmw-30.5)/S
print(T)
## [1] 0.1913786

Der p-Wert zu dieser Teststatistik \(T\) ist dann gegeben durch:

2*pt(q=-abs(T),df=n-1)
## [1] 0.8502593

Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen

t.test(X, mu=30.5,alternative="two.sided")
## 
##  One Sample t-test
## 
## data:  X
## t = 0.19138, df = 19, p-value = 0.8503
## alternative hypothesis: true mean is not equal to 30.5
## 95 percent confidence interval:
##  28.43201 32.98423
## sample estimates:
## mean of x 
##  30.70812

Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, nicht verwerfen, da der p-Wert des Tests \(>0.05\) ist.

Der Mittelwert der Grundgesamtheit ist ungleich einem vorgegebenem Mittelwert

Wir erzeugen uns in R eine normalverteilte Stichprobe mit Fallzahl \(20\) und Mittelwert \(=30\) und wollen auf dem 5% Signifikanzniveau testen ob der Mittelwert \(=35\) ist:

X <- rnorm(20, mean=30, sd=5)

Nun berechnen wir die Teststatistik anhand der Hilfsvaraiablen wie oben angegeben:

n <- 20
Xmw <- 1/n*sum(X)
S <- sqrt(1/(n-1)*sum((X-Xmw)^2))
T <- sqrt(n)*(Xmw-35)/S
print(T)
## [1] -5.664714

Der p-Wert zu dieser Teststatistik \(T\) ist dann gegeben durch:

2*pt(q=-abs(T),df=n-1)
## [1] 1.842207e-05

Wir berechnen die Teststatistik mit der eingebauten Funktion in R, um zu vergleichen

t.test(X, mu=35,alternative="two.sided")
## 
##  One Sample t-test
## 
## data:  X
## t = -5.6647, df = 19, p-value = 1.842e-05
## alternative hypothesis: true mean is not equal to 35
## 95 percent confidence interval:
##  27.80160 31.68583
## sample estimates:
## mean of x 
##  29.74371

Wie man sieht stimmen sowohl die Teststatistik als auch der p-Wert überein. Die Interpretation des Tests lautet wie folgt: Wir können auf dem Signifikanzniveau \(\alpha\)=0.05 die Nullhypothese, dass die Mittelwerte gleich sind, verwerfen, da der p-Wert des Tests \(<0.05\) ist.