Formelsammlung Statistik/ Hypothesentests: Unterschied zwischen den Versionen

Aus testwiki
Zur Navigation springen Zur Suche springen
imported>Joxemai
 
(kein Unterschied)

Aktuelle Version vom 13. Mai 2016, 08:55 Uhr

Vorgehen beim Vorlage:Latex IndexHypothesentest

I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit

II. Aufstellen der Nullhypothese

III. Festlegen der Testfunktion T

IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)


Fällt die Prüfgröße x in den Bereich [xu; xo],

wird H0 nicht abgelehnt. Es soll sein

P(x¯uX¯x¯o)=1α

(beachte: ein- oder zweiseitig)

α : Signifikanzniveau oder α-Fehler


V. Stichprobe erheben

VI. Entscheidung treffen


H0 ist wirklich wahr H1 ist wirklich wahr
H0 wird beibehalten richtige Entscheidung (1-α) Fehler 2. Art (β-Fehler)
H1 wird angenommen Fehler 1. Art (α-Fehler) richtige Entscheidung (1-β)

Tests auf Lageparameter (Erwartungswert, Median, Anteilswert)

Vorlage:Latex IndexTest auf Erwartungswert

Test H0 H1
zweiseitig μ = μ0 μ ≠ μ0
rechtsseitig μ ≤ μ0 μ > μ0
linksseitig μ ≥ μ0 μ < μ0


1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30

Testfunktion
T=X¯nμ0σnN(0;1) (Gauß-Test):
Ablehnungsbereich
zweiseitig   |T|>z1α/2
rechtsseitig   |T|>z1α
linksseitig   |T|<z1α

2. X ist normalverteilt, σ ist unbekannt bei beliebigem n

Testfunktion
T=Xn¯μ0Snt(n1) (t-Test).
Ablehnungsbereich
zweiseitig   |T|>t1n,1α/2
rechtsseitig   |T|>tn1,1α
linksseitig   |T|<tn1,1α

3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30

Testfunktion
T=Xn¯μ0SnN(0;1) (Gauß-Test) .
Ablehnungsbereich
zweiseitig   |T|>t1n,1α/2
rechtsseitig   |T|>tn1,1α
linksseitig   |T|<tn1,1α

Vorzeichentest

Vorlage:Latex IndexEinstichprobenproblem

Einseitig Zweiseitig
H0 P(Xθ0)1/2 P(Xθ0)1/2 P(Xθ0)=1/2
H1 P(Xθ0)<1/2 P(Xθ0)>1/2 P(Xθ0)1/2
H0 θθ0 θθ0 θ=θ0
H1 θ<θ0 θ>θ0 θθ0

Die Stichprobenwerte, die größer als der hypothetische Median θ0 sind, bekommen ein "+" zugeordnet;

Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.

Vorlage:Latex IndexZweistichprobenproblem

Die n Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar (x1i,x2i) muss unabhängig

vom Wertepaar (x1j,x2j),ij sein.

Besitzen beide Grundgesamtheiten den gleichen Median, gilt P(X11>X12)=P(X11<X12).

Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:

Einseitig Zweiseitig
H0 P(X1X2)1/2 P(X1X2)1/2 P(X1X2)=1/2
H1: P(X1X2)<1/2 P(X1X2)>1/2 P(X1X2)1/2

Die Wertepaare der Stichproben, bei denen xi1>xi2 gilt, bekommen ein "+" zugeordnet;


Wertepaare, für die xi1<xi2 gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt

und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):

V=i=1nI(xi1>xi2)B(π=0,5,n)

mit

I(xi1>xi2)={1,wennxi1>xi20,sonst

Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.

Bei Gültigkeit der Nullhypothese H0 ist die Summe der positiven Differenzen binomialverteilt mit π=0,5,

da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)

verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.

Approximation durch die Normalverteilung

Mit n nähert sich die Binomialverteilung einer Normalverteilung mit N(np,np(1p)),

als Faustregel np(1p)9 (H0:p=1/2).

Mit 14n9 bzw. n36 ist die z-standardisierte Größe

zV=i=1n12n12nN(0,1)

näherungsweise standardnormalverteilt.

Bindungen (Nulldifferenzen) Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert

oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),

die man so behandeln kann:

  • Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
  • Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
  • Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.


Vorlage:Latex IndexTest auf Anteilswert (Vorlage:Latex IndexBinomialtest)

Der Anteilswert θ wird geschätzt durch

θ^=p=xn.

Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:

Test H0 H1
zweiseitig θ=θ0 θθ0
rechtsseitig θθ0 θ>θ0
linksseitig θθ0 θ<θ0


für n > 30 , nθ0 ≥ 10 n(1-θ0) ≥ 10
kann man durch die Gauß-Verteilung approximieren:
Testfunktion
T=θθ0θ0(1θ0)nN(0;1) (Gauß-Test) .
Ablehnungsbereich
zweiseitig   |T|>z1α/2
rechtsseitig   |T|>z1α
linksseitig   |T|<z1α
für n < 30 oder nθ0 < 10 oder n(1-θ0) < 10
ist der exakte Binomialtest anzuwenden:
Testfunktion

Die Teststatistik X gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang n aufgetreten ist.

Unter der Nullhypothese H0:θ=θ0 ist die Teststatistik B(θ0,n)-verteilt, das heißt

P(X=i)=B(i|θ0,n)=(ni)θ0i(1θ0)ni.
Ablehnungsbereich

Teststatistik für den Binomialtest, die roten Balken gehören zum kritischen Bereich.

Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau α in der Regel nicht eingehalten werden.

Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau αex gilt αexα.

Für den zweiseitigen Test werden daher als kritische Werte das größte c1 und das kleinste c2 bestimmt, für die gilt

  • i=0c1B(i|θ0,n)α/2 und
  • i=c2nB(i|θ0,n)α/2.

Das exakte Signifikanzniveau ergibt sich als

αex=i=0c1B(i|θ0,n)+i=c2nB(i|θ0,n).

Für die beiden einseitigen Tests wird analog verfahren.

Test Kritische Werte Kritischer Bereich Grenze(n)
zweiseitig   c1+1 und c21 {0,,c1}{c2,,n}
rechtsseitig   c1 {c,,n} c = kleinster Wert, für den i=cnB(i|θ0,n)=αexα
linksseitig c+1 {0,,c} c = größter Wert, für den i=0cB(i|θ0,n)=αexα

Tests auf Streuung

Vorlage:Latex IndexTest auf Varianz

Test H0 H1
zweiseitig   σ2=σ02 σ2σ02
rechtsseitig   σ2σ02   σ2>σ02
linksseitig   σ2σ02   σ2<σ02


1. X ist normalverteilt, μ ist unbekannt, n beliebig

Testfunktion
T=(n1)S2σ02=1σ02i=1n(XiX¯2)2χ2(n1)
Ablehnungsbereich
zweiseitig   T<χn1,α/22 oder T>χn1,1α/22
rechtsseitig   T>χn1,1α2
linksseitig   T<χn1,α2

2. X ist normalverteilt, μ ist bekannt, n beliebig

Testfunktion
T=(n1)S~2σ02=1σ02i=1n(Xiμ)2χ2(n)
Ablehnungsbereich
zweiseitig   T<χn,α/22 oder T>χn,1α/22
rechtsseitig   T>χn,1α2
linksseitig   T<χn,α2

Vorlage:Latex IndexTests auf Zusammenhangs- und Assoziationsparameter

Vorlage:Latex IndexChi-Quadrat-Unabhängigkeitstest

Nullhypothese
H0: Die Merkmale X und Y sind stochastisch unabhängig.

Die Beobachtungen der Merkmale X und Y liegen paarweise in m bzw. r Klassen vor.

Es gibt insgesamt n paarweise Beobachtungen von X und Y, die sich auf mr Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:
Merkmal Y Summe Σ
Merkmal X 1 2 k r nj.
1 n11 n12 ... n1k ... n1r n1.
2 n21 n22 n2k n2r n2.
j njk nj.
m nm1 nm2 nmk nmr nm.
Summe Σ n.1 n.2 n.k n.r n

Absolute Randhäufigkeiten nj bzw. nk

nj=k=1rnjk und nk=j=1mnjk


Prüfgröße für den Unabhängigkeitstest:

χ2=j=1mk=1r(njknjk*)2njk*.

Mit :njk*=njnkn,

H0 wird abgelehnt, wenn χ2>χ2(1α;(m1)(r1)) ist.

Anpassungs- oder Verteilungstests

Vorlage:Latex IndexChi-Quadrat-Anpassungs- oder Verteilungstest

Die Wahrscheinlichkeiten eines Merkmals X seien in der Grundgesamtheit unbekannt.

Nullhypothese: H0: Das Merkmal X besitzt die Wahrscheinlichkeitsverteilung F0(x)

Für n unabhängige Beobachtungen x1,,xn des Merkmals X wird die Zahl

der Beobachtungen in der j-ten Klasse ist die beobachtete Häufigkeit Nj.

Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit p0j,

dass eine Ausprägung von X in die Kategorie j fällt. Die unter H0 zu erwartende Häufigkeit ist:

n0j=p0jn

Die Prüfgröße (Größe der Abweichung)

χ2=j=1m(Njn0j)2n0j

ist bei ausreichend großen Nj annähernd chi-Quadrat-verteilt mit m1 Freiheitsgraden.

H0 wird abgelehnt, wenn χ2>χ(1α;m1)2 gilt.


Vorlage:Latex IndexKolmogorow-Smirnow-Anpassungstest

Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.

Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.

H0:FX(x)=F0(x) (Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F0.)
H1:FX(x)F0(x) (Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F0.)

Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion Fn mit F0 mittels der Teststatistik

dn=FnF0=supx|Fn(x)F0(x)|, (sup: Supremum)

Die Teststatistik ist unabhängig von der hypothetischen Verteilung F0.

Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.

Einstichprobenproblem

Von einer reellen Zufallsvariablen X liegen n aufsteigend sortierte Beobachtungswerte xi (i=1,,n) vor.

Von diesen Beobachtungen wird die relative Summenhäufigkeit S(xi) mit der entsprechenden hypothetischen

Verteilung der Grundgesamtheit F0(xi) verglichen. Voraussetzung: F0 ist stetig.

Für jedes i=1,,n werden die absoluten Differenzen

doi=|S(xi)F0(xi)| und :dui=|S(xi1)F0(xi)|

berechnet, wobei S(x0):=0 gesetzt wird. Wenn die größte Differenz dmax aus allen Differenzen doi, dui

einen kritischen Wert dα übersteigt, wird die Hypothese abgelehnt.

Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere n werden sie über dα=ln(2α)2n angenähert.


Zweistichprobenproblem

Liegt nun zusätzlich zur Zufallsvariablen X eine entsprechende Zufallsvariable Y vor (mit m geordneten Werten yi),

so kann durch den Zweistichprobentest überprüft werden, ob X und Y derselben Verteilungsfunktion folgen.

Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen SX(xi) bzw. SY(yi) ermittelt:

d(z)=|SX(z)SY(z)| und  :dmax=supzd(z) .


Die Nullhypothese wird abgelehnt, falls dmax den kritischen Wert dkrit(α,n,m) überschreitet.

Für kleine Werte von n und m greift man auf Tabellen zurück.

Für große Werte von n und m wird die Nullhypothese abgelehnt, falls

nmn+mdmax>Kα ,

wobei Kα für große n und m näherungsweise als Kα=ln(2α)2 berechnet werden kann.