pnorm(90,100,15)[1] 0.2524925
Sección en preparación
\[f(x)=\frac{1}{\sqrt{2\pi}\sigma} \exp\bigg\lbrace{-\frac{1}{2} \left( \frac{x-\mu}{\sigma} \right)^2 \bigg\rbrace} \] la función
dnorm(x,mu,sigma)
devuelve precisamente el valor de \(f(x)\), es decir, la ordenada de la función de densidad en el valor x. A efectos prácticos, al tratar con la distribución normal, esta función no nos interesa demasiado. Será distinto en el caso de las distribuciones discretas.
El término función de distribución en un valor dado de la variable \(X\), digamos \(x_0\), alude al área bajo la curva definida por la función de densidad desde el valor mínimo posible para \(X\) hasta ese valor \(x_0\). La interpretación de esta función es muy interesante, ya que resulta ser la probabilidad de que la variable \(X\) tome un valor menor o igual a \(x_0\):
\[F(x_0)=\Pr\left(X\le x_0 \right) \]
En R, la función de distribución de una distribución normal con parámetros dados \(\mu\) y \(\sigma\) es pnorm(x,mu,sigma). Si se omiten los valores de y de , se asume que estos son los de la distribución normal estándar, es decir, 0 y 1 respectivamente. Veamos algunos ejemplos:
pnorm(90,100,15)[1] 0.2524925
La probabilidad de que la variable aleatoria \(X\) tome un valor menor o igual a \(x_0\)=90, dado que dicha variable se distribuye de acuerdo a un modelo \(N(\mu=100,\sigma=15)\) es del 25,25%, es decir: \[F(x_0=90)=\Pr\left(X\le 90 \right)=0.2525 \] En otras palabras, el percentil 25 de la distribución \(N(\mu=100,\sigma=15)\) es un valor muy próximo a 90 (90 es exáctamente el percentil 25,25). Para saber el valor exacto del percentil 25 de esa distribución, se recurre a la función qnorm(alfa,mu,sigma), siendo alfa la probabilidad acumulada a la izquierda del valor que se desea determinar:
qnorm(0.25,100,15)[1] 89.88265
con lo que concluimos que el primer cuartil de la distribución \(N(\mu=100,\sigma=15)\) es exáctamente $x=$89,88.
La generación de números aleatorios que tengan una distribución de probabilidad concreta, proporciona una herramienta muy interesante para poder crear y analizar posibles escenarios de interés en el ámbito aplicado. Obtener en R una muestra de \(n\) valores aleatorios que tengan una distribución \(N(\mu,\sigma)\) es inmediato gracias a la función rnorm(n,mu,sigma). Por ejemplo, si se desea una muestra de \(n\)=10 observaciones aleatorias de la distribución \(N(100,15)\), no hay mas que escribir
rnorm(10,100,15) [1] 124.09799 92.83615 99.83333 109.71800 91.88884 108.56935 119.24231
[8] 114.11284 82.50426 137.29780
Conviene definir una variable que contenga estos valores, así podremos manejar la muestra obtenida fácilmente. Por ejemplo, en el código siguiente se asignan los valores a la variable muestra y se obtiene, seguidamente, su media y desviación típica. Observe que ahora los valores obtenidos son diferentes a los anteriores; cada vez que se ejecuta la función, el muestreo se reinicia.
muestra<-rnorm(10,100,15)
mean(muestra)[1] 102.9136
sd(muestra)[1] 14.13638
En todas, si se omiten los valores de mu y de sigma se asume que estos son 0 y 1 respectivamente, con lo que se estaría manejando la distribución normal estándar.
dnorm(x,mu,sigma)
pnorm(x,mu,sigma)
qnorm(alfa,mu,sigma)
rnorm(n,mu,sigma)
En todas, si se omiten los valores de min y de max se asume que estos son 0 y 1 respectivamente.
dunif(x,min,max)
punif(x,min,max)
qunif(alfa,min,max)
runif(n,min,max)
Uniforme discreta. Extracción de muestras
dbinom(x, n, p)
pbinom(x, n, p)
qbinom(alfa, n, p)
rbinom(t, n, p)
dpois(x,lambda)
ppois(x, lambda)
qpois(alfa, lamda)
rpois(n,lambda)