Variància i desviació típica

Variància

La variància d'unes dades és la mitjana aritmètica del quadrat de les desviacions respecte a la mitjana de la mateixa. Se simbolitza com σ2 i es calcula aplicant la fórmula σ2=i=1N(xix)2N=(x1x)2+(x2x)2++(xNx)2N que es pot simplificar com: σ2=i=1Nxi2Nx2=x12+x22++xN2Nx2

De la mateixa manera que per a la mitjana, no sempre serà possible trobar la variància, i és un paràmetre molt sensible a les puntuacions extremes. Es pot observar que en estar la desviació elevada al quadrat, la variància no pot tenir les mateixes unitats que les dades.

Comparant amb el mateix tipus de dades, un variància elevada significa que les dades estan més disperses. Mentre que un valor de la variància baix indica que els valors estan en general més propers a la mitjana.

Un valor de la variància igual a zero implica que tots els valors són iguals, i per tant també coincideixen amb la mitjana aritmètica.

Exemple

En un partit de bàsquet, es té la següent anotació en els jugadors d'un equip: 0,2,4,5,8,10,10,15,38. Calcular la variància de les puntuacions dels jugadors de l'equip.

Aplicant la fórmula x=0+2+4+5+8+10+10+15+389=929=10.22 s'obté la mitjana.

Seguidament s'aplica la fórmula de la variància: σ2=(010.22)2+(210.22)2+(410.22)2+(510.22)2+(810.22)2+(1010.22)2+(1010.22)2+(1510.22)2+(3810.22)29==10.222+8.222+6.222+5.222+2.222+0.222+4.782+27.7829==104.4484+67.5684+38.6884+27.2484+4.9284+0.0484+22.8484+771.72849==1037.55569=115.28

Càlcul de la variància per a dades agrupades

En el cas de N mostres agrupades en n classes s'aplica la fórmula: σ2=i=1n(xix)2fiN=(x1x)2f1+(x2x)2f2++(xnx2fnN que queda simplificada com: σ2=i=1nxi2fiNx2=x12f1+x22f2++xn2fnNx2 La interpretació que es pot fer del resultat és la mateixa que per a dades no agrupades.

Exemple

L'alçada en cm dels jugadors d'un equip de bàsquet està en la següent taula. Calcular la variància.

  xi fi
[160,170) 165 1
[170,180) 175 2
[180,190) 185 4
[190,200) 195 3
[200,210) 205 2

En primer lloc, emplenem la següent taula:

  xi fi xifi xi2fi
[160,170) 165 1 165 27225
[170,180) 175 2 350 61250
[180,190) 185 4 740 136900
[190,200) 195 3 585 114075
[200,210) 205 2 410 84050
    12 2250 423500

S'ha de calcular la mitjana x=225012=187.5 per poder aplicar la fórmula.

Es calcula llavors la variància ω2=42350012187.52=135.42

Propietats de la variància

  1. σ2 La variància és un valor positiu, com ja s'ha comentat anteriorment, la igualtat només es dóna en el cas que totes les mostres siguin iguals.

  2. Si a totes les dades se'ls suma una constant, la variància segueix sent la mateixa.

  3. Si totes les dades es multipliquen per una constant, la variància queda multiplicada pel quadrat de la constant.

  4. Si es disposen de diverses distribucions amb la mateixa mitjana i es calculen les diferents variàncies, es pot trobar la variància total aplicant la fórmula σ2=σ12+σ22++σn2n En el cas que les distribucions tinguin diferent grandària, la fórmula es pondera i queda com σ2=σ12k1+σ22k2++σn2knk1+k2++kn

Exemple

En un examen, tots els alumnes de la classe van treure un deu. Trobar la variància de les notes.

Al coincidir tots els valors la mitjana coincideix també amb ells x=10, i la variància és nul·la σ2=0.

Desviació típica

La desviació típica és l'arrel quadrada de la variància i es representa per la lletra σ. Per calcular-la es calcula la variància i es treu l'arrel. Les interpretacions que es dedueixen de la desviació típica són, per tant, semblants a les que es deduïen de la variància:

Comparant amb el mateix tipus de dades, una desviació típica elevada significa que les dades estan disperses, mentre que un valor baix indica que els valors són propers els uns dels altres, i per tant de la mitjana.

Propietats de la desviació típica

  1. σ0 La desviació típica és un valor positiu, la igualtat només es dóna en el cas que totes les mostres siguin iguals.
  2. Si a totes les dades se'ls suma una constant, la desviació típica segueix sent la mateixa.
  3. Si totes les dades es multipliquen per una constant, la desviació típica queda multiplicada per aquesta constant.
  4. Si es disposa de diverses distribucions amb la mateixa mitjana i es calculen les diferents desviacions típiques, es pot trobar la desviació típica total aplicant la fórmulaσ=σ12+σ22++σn2n En el cas que les distribucions tinguin diferent grandària, la fórmula es pondera i queda comσ=σ12k1+σ22k2++σn2knk1+k2++kn