Formelsammlung Statistik/ Zufallsvariablen und Verteilungsmodelle

Aus testwiki
Zur Navigation springen Zur Suche springen

diskrete Zufallsvariablen

Ein Merkmal X, das aufgrund zufälliger Ereignisse eine (endliche) Menge

von Ausprägungen x1, x2 ... annehmen kann, nennt man Vorlage:Latex Indexdiskrete

Zufallsvariable X.

Eindimensionale Zufallsvariablen

Wahrscheinlichkeitsfunktion:

f(x)={P(X=xi)=pi,x=xi{x1,x2,...,xk..}0sonst

Verteilungsfunktion:

F(x)=P(Xx)=i:xixf(xi).

Normiertheit:

i=1kpi=1.

Vorlage:Latex IndexErwartungswert

E(X)=μ=i=1kxipi=i=1kxif(xi),

VarianzVorlage:Latex Index

Var(X)=i=1k(xiE(X))2f(xi).

bzw. mit dem Vorlage:Latex IndexVerschiebungssatz

Var(X)=(i=1kxi2f(xi))E(X2)=

Standardabweichung

σ=+Var(X).

Varianz der Summe Vorlage:Latex Indexunabhängiger Zufallsvariablen

Var(X+Y)=Var(X)+Var(Y).

Mehrdimensionale Zufallsvariablen

Einzelwahrscheinlichkeit

P(X=x1)=fX(x1)=j=1mfX,Y(x1;yj)

Vorlage:Latex IndexKovarianz

covXY=i=1nj=1m(xiE(X))(yjE(Y))fX,Y(xi;yj)

bzw. mit dem Verschiebungssatz

covXY=i=1nj=1mxiyjfX,Y(xi;yj)E(X)E(Y)

Vorlage:Latex IndexKorrelationskoeffizient rxy nach Bravais-Pearson

für metrisch skalierte Merkmale zweier statistischer Variablen x und y

r=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2,

mit x¯=1ni=1nxi als dem arithmetischen Mittel des Merkmals x. Mit Hilfe des Verschiebungssatzes:

r=i=1nxiyinx¯y¯(i=1nxi2n(x¯)2)(i=1nyi2n(y¯)2)


Vorlage:Latex IndexRangkorrelationskoeffizient nach Spearman

  • für Variablen, die stark von der Normalverteilung abweichen
  • sowie ordinalskalierte Variablen

Nach Ordnung der einzelnen Beobachtungen von x bzw. y der Größe nach wird

jedem Wert wird seine Rangzahl rg(xi) und rg(yi) zugewiesen. Damit:

rSP=i(rg(xi)rg(x))(rg(yi)rg(y))i(rg(xi)rg(x))2i(rg(yi)rg(y))2.

diskrete Verteilungsmodelle

Vorlage:Latex IndexBinomialverteilung

Für eine binomialverteilte Zufallsvariable X mit den Parametern n und θ (0 ≤ θ ≤ 1) lautet die Wahrscheinlichkeitsfunktion

P(X=x)=b(x|n;θ)={(nx)θx(1θ)nxfalls x=0,1,,n0sonst.

Erwartungswert

E(X)=nθ

Varianz

Var(X)=nθ(1θ)

Vorlage:Latex IndexHypergeometrische Verteilung

Eine Zufallsvariable X ist hypergeometrisch verteilt mit den Parametern

N (Grundgesamtheit), M ("Kugeln der ersten Sorte") und n (Stichprobenumfang),

wenn ihre Wahrscheinlichkeitsfunktion lautet

P(X=x)=h(x|N;M;n)={(Mx)(NMnx)(Nn) für x = 0, 1, ... , n0 sonst

Erwartungswert

E(X)=nMN=nΘ

Varianz

Var(X)=nMN(1MN)NnN1.

Der Bruch NnN1 wird Korrekturfaktor genannt.

Vorlage:Latex IndexPoissonverteilung

Wahrscheinlichkeitsfunktion (λ>0)

P(X=x)=p(x|λ)={eλλxx! für x = 0, 1, ... 0 sonst


Erwartungswert und Varianz

E(X)=Var(X)=λ

stetige Zufallsvariablen

Eine stetige Zufallsvariable kann in jedem beschränkten Intervall unendlich viele Ausprägungen annehmen.

Ihre Verteilung lässt sich durch eine Dichtefunktion f(x) beschreiben.

(f(x) ist hier keine Wahrscheinlichkeit, sondern eine Dichte !)

Vorlage:Latex IndexVerteilungsfunktion

P(Xa)=F(a)=af(x)dx
  • Es gilt: P(X = a) = 0.
  • Wegen P(X = a) = 0 ist P(X ≤ a) = P(X < a) und P(X > a) = P(X ≥ a)

Die Vorlage:Latex IndexDichtefunktion f(x) ist die erste Ableitung der Verteilungsfunktion, falls diese an der Stelle x differenzierbar ist.

  • Die Dichtefunktion f(a) kann auch größer als 1 werden.
  • Ausgehend von P(Xx)=p ist das p-Quantil x(p) der Wert x, der zu einer gegebenen Wahrscheinlichkeit p gehört. Speziell x(0,5) ist der Median.

Vorlage:Latex Index Erwartungswert

E(X)=xf(x)dx,

falls E(X) existiert, d.h. nicht unendlich wird.

Varianz

Var(X)=(xE(X))2f(x)dx

wobei auch hier der Verschiebungssatz angewendet werden kann:

Var(X)=(x2f(x)dx)(E(X))2

stetige Verteilungsmodelle

Vorlage:Latex IndexStetige Gleichverteilung (Vorlage:Latex IndexRechteckverteilung)

Dichtefunktion der Gleichverteilung im Intervall [a,b]

f(x)={1bafür axb0sonst.

Erwartungswert

E(X)=a+b2

Varianz

Var(X)=λabx21badx=(ba)212

Vorlage:Latex IndexExponentialverteilung

Dichtefunktion der Exponentialverteilung

f(x)={λeλxfür x00für x<0

Verteilungsfunktion

P(Xx)=1eλx

Erwartungswert

E(X)=λ0xeλxdx=1λ

Varianz

Var(X)=1λ2 .

Vorlage:Latex IndexNormalverteilung

Für eine Zufallsvariable XN(μ,σ2) lautet die Dichtefunktion der NV

f(x)=12πσe(xμ)22σ2 für x

Normierung mit z=xμσ ergibt die Standardnormalverteilung mit der Dichtefunktion ϕx(z)N(0,1):

ϕx(z)=12πe12z2

Anm.:Es wird auch die Schreibweise ϕx(z|μ,σ2) anstelle N(μ,σ2) verwendet

Erwartungswert

E(X)=μ

Varianz

Var(X)=σ2

p-Quantil

Der zu einer gegebenen Wahrscheinlichkeit p zugehörige z-Wert z(p)

P(Zz(p))=p .

97,5%-Quantil der Standardnormalverteilung

Beispielsweise ist z(0,975) = 1,96.

Linearkombinationen normalverteilter Zufallsvariablen

Für n normalverteilte Zufallsvariablen Xi(i=1,...,n), mit XiN(μi;σi2)

ist die Linearkombination

Y=a0+a1X1+a2X2+...+anXn=a0+i=1naiXi

ebenfalls normalverteilt mit dem Erwartungswert

E(Y)=a0+i=1naiE(Xi)=a0+i=1naiμi .

Falls die Xi (i=1,...,n) stochastisch unabhängig sind, gilt für die Varianz

Var(Y)=i=1nai2(Xi)=i=1nai2σi2 .

Die Varianz muss größer Null sein, deshalb muss zudem aj0 für mindestens ein j{1,,n} gelten.

Verteilung des Stichprobendurchschnitts

Sind die n Zufallsvariablen Xi (i = 1, ... , n) sämtlich normalverteilt

mit gleichem μ und gleichem σ2, ist die Linearkombination

X mit a0 = 0, a1 = a2 = ... = an = 1/n, also :X¯=1ni=1nXi

normalverteilt dem Erwartungswert

E(X¯)=1ni=1nμ=μ

und, falls die Xi (i = 1, ... , n) stochastisch unabhängig sind, mit der Varianz

Var(X¯)=1n2i=1nσ2=σ2n .

Vorlage:Latex IndexCHI-Quadrat-verteilung

Die X1,X2,...Xn seien unabhängige standardnormalverteilte Zufallsvariablen.

Dann ist die Verteilung der Zufallsvariablen Z=X12+X22+...+Xn2

chi-quadrat verteilt mit n Freiheitsgraden Zχ2(n)

Erwartungswert:

E(Z)=n

Varianz

Var(Z)=2n .

Anm.: Die Gruppe der Hypothesentests mit χ2-Verteilung bezeichnet man als χ2-Test.

Hierunter sind mehrere Tests zu verstehen:

Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.

Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.

Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.

Für die unabhängigen Variablen X (standardnormalverteilt) und Z(Zχ2(n)) ist die Variable

T=XZ/n

t-verteilt (Tt(n)) mit n Freiheitsgraden.

Erwartungswert

E(T)=0 für (m2)

Varianz

Var(T)=nn2 für (n3)


Vorlage:Latex IndexFisher- Verteilung

Für die unabhängigen Variablen Xχ2(m) und Yχ2(n) ist die Verteilung der Variablen

Z=X/mY/n

Fisher- oder F-verteilt (ZF(m,n)) mit den Freiheitsgraden m und n.

Erwartungswert

E(T)=nn2 für (n3)

Varianz

Var(Z)=2n2(n+m2)m(n4)(n2)2 für (n3)


Approximation von Verteilungen

Gesuchte Verteilung Approximation durch
P(Xx) Binomial Poisson Normal
Binomial
B(x|nθ)
--- P(x|nθ)
 falls n50
 und θ0,05
Φ(x+0,5|nθ;nθ(1θ))
 falls n>9θ(1θ)
Hypergeometrische
H(x|N;M;n)
B(x|nMN)
 falls nN<0,05
über Binomialverteilung Φ(x+0,5|nMN ;nMN(1MN)NnN1
 falls n>9MN(1MN)
 und nN <0,05
Poisson
P(x|λ)
--- --- Φ(x+0,5|λ;λ) falls λ>9
χ2-Verteilung χ2(x|n)
P(2X2x)
--- --- Φ(2x |2n1;1)
 falls n>30
t-Verteilung
t(x|n)
--- --- Φ(x|0;1) falls n>30
F-Verteilung
F(x|m;n)
--- --- Φ(x|0;1) falls 
m>30 und n>30

Vorlage:Latex IndexGrenzwertsatz

Gesetz der großen Zahlen

Für ein beliebig kleines c > 0 gilt

P(|X¯nμ|c)1 für (n)

Vorlage:Latex IndexTheorem von Bernoulli

Die relative Häufigkeit, mit der ein Ereignis A bei n unabhängigen Wiederholungen

eines Zufallsereignisses eintritt, konvergiert nach Wahrscheinlichkeit gegen P(A)

Vorlage:Latex IndexHauptsatz der Statistik

Für eine Zufallsvariable X mit der Verteilungsfunktion F(x) gilt für die Verteilungsfunktion Fn(x)

für die unabhängigen wie identisch wie X verteilten X1…Xn (x∈ R)

P(sup|Fn(x)F(x)|c)1 für (n)

(sup: Maximale Abweichung zwischen F^n(x) und F^(x)).

Vorlage:Latex IndexZentraler Grenzwertsatz

Für unabhängig identisch verteilte Zufallsvariablen X1…Xn mit E(Xi ) = μ

und Var(Xi ) =σ2 > 0 konvergiert die Verteilungsfunktion Fn(z) = P(Zn≤z)

der standardisierten Summe

Zn=X1+..+Xnnμnσ=1ni=1nXiμσ

für n → ∞ an jeder Stelle z gegen die Verteilungsfunktion ϕx(z) der Standardnormalverteilung

Fn(z)ϕx(z)

Vorlage:Latex IndexGrenzwertsatz von De Moivre

Die Verteilung der standardisierten absoluten Häufigkeit Hnnπnπ(1π) der Standardnormalverteilung

konvergiert für n → ∞ gegen eine Standardnormalverteilung.