Scheefheid

Voorbeeld van rechtsscheef verdeelde data

In de statistiek is scheefheid (Engels: skewness) een maat voor asymmetrie van een kansverdeling.

Definitie

De scheefheid γ 1 {\displaystyle \gamma _{1}} is het derde gestandaardiseerde moment, mits dit bestaat, van de kansverdeling:

γ 1 = μ 3 σ 3 {\displaystyle \gamma _{1}={\frac {\mu _{3}}{\sigma ^{3}}}}

Hierin is μ 3 {\displaystyle \mu _{3}} het derde centrale moment en σ {\displaystyle \sigma } de standaardafwijking. De scheefheid kan dus ook geschreven worden als

γ 1 = E ( X μ ) 3 ( E ( X μ ) 2 ) 3 / 2 {\displaystyle \gamma _{1}={\frac {{\rm {E}}(X-\mu )^{3}}{({\rm {E}}(X-\mu )^{2})^{3/2}}}}

met X {\displaystyle X} een stochastische variabele verdeeld volgens de gegeven kansverdeling en μ = E X {\displaystyle \mu ={\rm {E}}X} de verwachtingswaarde daarvan.

Een symmetrische verdeling heeft een scheefheid γ 1 = 0 {\displaystyle \gamma _{1}=0} . Voorbeelden van symmetrische verdelingen zijn de normale verdeling, de uniforme verdeling (discreet en continu) en de binomiale verdeling met succeskans p = 1 / 2 {\displaystyle p=1/2} .

Een verdeling heet rechtsscheef, als deze aan de rechterkant een langere en zwaardere staart heeft dan aan de linkerkant. Bij deze verdeling is de mediaan kleiner dan de verwachtingswaarde. Deze benaming is enigszins verwarrend, omdat dit automatisch inhoudt dat de meeste massa zich juist links van de verwachtingswaarde bevindt (zie grafiek). Voor zo'n verdeling geldt dat γ 1 > 0 {\displaystyle \gamma _{1}>0} . Een voorbeeld van een rechtsscheve verdeling is de Gamma-verdeling. Voor de Γ ( k , θ ) {\displaystyle \Gamma (k,\theta )} -verdeling geldt dat γ 1 = 1 / 2 k {\displaystyle \gamma _{1}=1/{\sqrt {2k}}} .

Als de zwaardere staart zich aan de linkerkant bevindt, heet de verdeling linksscheef. Voor zo'n verdeling geldt dat γ 1 < 0 {\displaystyle \gamma _{1}<0} . Een voorbeeld van een linksscheve verdeling is de Beta(1,0)-verdeling met de kansdichtheid f ( x ) = 1 / ( 1 x ) ( 0 < x < 1 ) {\displaystyle f(x)=1/(1-x)(0<x<1)} , en scheefheid γ 1 = 0 , 94 {\displaystyle \gamma _{1}=-0{,}94} .

Steekproef

De scheefheid van een verdeling kan aan de hand van de uitkomst x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} van een aselecte steekproef geschat worden door de momentschatter:

g 1 = n i = 1 n ( x i x ¯ ) 3 ( i = 1 n ( x i x ¯ ) 2 ) 3 / 2 {\displaystyle g_{1}={\frac {{\sqrt {n}}\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{3}}{\left(\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}\right)^{3/2}}}} ,

waarin x ¯ {\displaystyle {\bar {x}}} het steekproefgemiddelde is. Omdat deze schatter geen zuivere schatter is, dat wil zeggen E g 1 γ 1 {\displaystyle {\rm {E}}g_{1}\neq \gamma _{1}} , wordt in praktijk meestal de volgende, wel zuivere, schatter gebruikt

G 1 = n ( n 1 ) n 2 g 1 {\displaystyle G_{1}={\frac {\sqrt {n\,(n-1)}}{n-2}}\;g_{1}}

Andere maten van asymmetrie

Karl Pearson suggereerde twee asymmetrie-maten die eenvoudiger te berekenen zijn:

  • (gemiddelde – modus) / standaardafwijking
  • 3 × (gemiddelde – mediaan) / standaardafwijking

Deze maten zijn echter minder gebruikelijk geraakt sinds de opkomst van de computer, die het berekenen van de gewone scheefheidsmaat vergemakkelijkte.