La distribución normal o Gaussiana

La variable aleatoria continua X sigue una distribución normal N(μ,σ), es decir de media μ y desviación típica σ, si cumple que:

  • Puede tomar cualquier valor real: (,+)
  • La función densidad de probabilidad (fpd o pdf del inglés) sigue una curva gaussiana: f(x)=1σ2πe12(xμσ)2

Ejemplo

Encontrar la función densidad de probabilidad de una variable continua de media 1,75 y desviación típica 0,2 y representarla.

¿De qué podría ser una buena representación esta normal?

f(x)=10,22πe12(x1,750,2)2

imagen

La media y desviación típica proporcionadas hacen que esta variable sea un posible modelo de la altura de los hombres en Barcelona.

Para interpretar la gráfica hay que entender que la probabilidad de que la variable tome un determinado rango de valores es el área por debajo de la curva de la fdp en dicho rango.

  • El área total de la fdp es 1:+f(x) dx=1
  • La fdp es simétrica respecto a μ, es decir el área a la derecha de μ es 0,5, y a la izquierda de μ también. O, en el ejemplo anterior, el número de personas por encima de 1,75m es el mismo que el número de gente por debajo de la media.μf(x) dx=μf(x) dx=12
  • Además el número de gente más alta que 1,75+a es el mismo que el de gente más baja de 1,75a

μaf(x) dx=μ+af(x) dx

imagen

La distribución normal estándar

La distribución normal estándar es la que tiene media μ=0 y desviación típica σ=1:

N(0,1)

Su función densidad es:

f(x)=12πex22

En la siguiente gráfica vemos su representación:

imagen

Sobre la distribución normal estándar se puede afirmar:

0f(x) dx=0+f(x) dx=12af(x) dx=a+f(x) dx

Y, además, cumple todas las propiedades de una función par f(x)=f(x). Dado que la integral mostrada anteriormente no tiene solución analítica se utilizan tablas para calcularla.

A continuación, se puede ver la tabla correspondiente a los valores de la función distribución de probabilidad, es decir:

p(Zz)

La primera posición de la tabla indica la probabilidad de que el resultado del experimento de un valor inferior a cero (la media), y se puede observar que dicha probabilidad es 0,5. La tabla muestra que la probabilidad de un resultado menor que un determinado valor z crece a medida que crece z.

imagen

Para interpretar la tabla hay que ver que la columna indica la unidad y la décima de z, mientras que la fila indica el segundo decimal (la centésima). Es decir, en la primera casilla de la primera fila se ve la probabilidad.

p(Z0,00)=0,5000

mientras que en la última casilla de la primera fila se ve:

p(Z0,09)=0,5359

Se puede observar que la tabla sólo da las probabilidades para valores positivos de Z. Para los valores de Z<0 se utilizará la geometría, como se podrá ver en los ejemplos que siguen.

Cabe decir que a partir de 3 (3 veces la desviación típica) la probabilidad es muy cercana a uno (0,9987). Por simetría para valores menores a 3, la probabilidad será prácticamente nula.

Ejemplo

Encontrar la probabilidad de que una variable aleatoria Z que se modela como N(0,1) tenga un valor menor que 0,94.

imagen

Se mira la fila de 0,9 y la columna de 0,04:

p(Z0,94)=0,8264

Ejemplo

Encontrar la probabilidad de que una variable aleatoria Z que se modela como N(0,1) tenga un valor mayor que 0,94.

imagen

P(Z0,94)=AreatotalP(Z0,94)P(Z0,94)=1.0,8264=0,1736

Ejemplo

Encontrar la probabilidad de que Z esté entre 0,94 y 1,14

imagen

p(0,94Z1,14)=p(Z1,14)p(Z0,94)p(0,94Z1,14)=0,87280,8264=0,0465

Transformación de la normal estándar a cualquier otra normal

¿Qué hay que hacer si se quiere trabajar con una normal distinta a la N(0,1)?

Si Z es una variable aleatoria N(0,1) y X es N(μ,σ) se relacionan por la siguiente expresión:

Z=XμσX=σZ+μ

Ejemplo

Se tiene una variable aleatoria de media 4 y desviación estándar 2.

¿Cuál es la probabilidad de que sea mayor que 6,21?

p(X6,21)=p(σZ+μ6,21)p(X6,21)=p(Z6,2142)=p(Z1,105)p(Z1,105)=1p(Z1,105)=10,8531=0,1469

De esta forma, sólo serán necesarias las tablas para la normal N(0,1)

Aproximación de la distribución binomial a partir de una normal

Para n suficientemente grande, el cálculo de una binomial B(n,p) puede resultar complicado.

Por ello se utiliza una normal:

N(μ=np,σ=npq)B(n,p)

Así pues, para tratar la binomial que modela los 100 lanzamientos de una moneda se puede utilizar:

N(1000,5,1000,50,5)=N(50,5)

De esta forma se podrá evitar el cálculo con exponentes elevados que supone el uso de una binomial, y se podrán utilizar las tablas de la normal N(0,1).