2017

Tamaño de Muestra - Simulación

R-Studio

¿Qué es?

R-Studio es un entorno de desarrollo integrado (IDE) para R (lenguaje de programación) . Incluye una consola, editor de sintaxis que apoya la ejecución de código, así como herramientas para el trazado, la depuración y la gestión del espacio de trabajo. https://es.wikipedia.org/wiki/RStudio.

Conceptos

  • Muestra
  • Población
  • Proporción
  • Simulación
  • Tamaño de muestra
  • Intervalo de confianza

SIMULACIÓN TAMAÑO DE MUESTRA

Número de Hombres y Mujeres

numhombres <- 50
nummujeres <- 17

#Tamaño de muestra
tammuestra <- 30

#Población toal
total <- c(rep("Hombre", numhombres), rep("Mujer", nummujeres))

# Tabla de frecuencia "real" a partir de la población
table(total)
## total
## Hombre  Mujer 
##     50     17

# Proporción "real" a partir de la población
table(total) / sum(table(total))
## total
##    Hombre     Mujer 
## 0.7462687 0.2537313
#Extraer sólo proporción de hombres
propHomR <- (table(total) / sum(table(total)))[1]
propHomR
##    Hombre 
## 0.7462687

# Generar una muestra aleatoria 
muestra <- sample(total,tammuestra)
muestra
##  [1] "Hombre" "Mujer"  "Hombre" "Mujer"  "Hombre" "Hombre" "Hombre"
##  [8] "Hombre" "Hombre" "Hombre" "Hombre" "Hombre" "Mujer"  "Hombre"
## [15] "Hombre" "Mujer"  "Hombre" "Mujer"  "Mujer"  "Hombre" "Hombre"
## [22] "Mujer"  "Mujer"  "Hombre" "Hombre" "Hombre" "Hombre" "Hombre"
## [29] "Hombre" "Mujer"
# Tabla de frecuencia de la muestra
table(muestra)
## muestra
## Hombre  Mujer 
##     21      9

# Proporción real
pR <- table(total)/sum(table(total))
pR
## total
##    Hombre     Mujer 
## 0.7462687 0.2537313
# Proporción de la muestra
pM <- table(muestra)/sum(table(muestra))
pM
## muestra
## Hombre  Mujer 
##    0.7    0.3

# Diferencia de las proporciones 
pR-pM
## total
##      Hombre       Mujer 
##  0.04626866 -0.04626866
# Diferencia de las proporciones en valor absoluto
abs(pR-pM)
## total
##     Hombre      Mujer 
## 0.04626866 0.04626866

Simulación

# Número de simulaciones para estimar el tamaño de muestra apropiado
nsim <- 10000
simula1 <- data.frame(replicate(nsim,sample(total,tammuestra)))

#Cálculo de la proporción de hombres para cada muestra generada
propHom <- sapply(simula1,function(x) (table(x)/sum(table(x)))[1])

#Resumen
summary(propHom)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.5000  0.7000  0.7333  0.7454  0.8000  0.9667
# Estimación del intervalo de confianza al 95%
quantile(propHom,c(0.025,0.975))
##      2.5%     97.5% 
## 0.6333333 0.8666667

Histograma de proporción de hombres

# Histograma de la proporciones de hombres de acuerdo a la muestra.
hist(propHom, col = "red")

Distribución del error

#Cálculo de la diferencia entre el valor "verdadero" y
# el valor obtenido de las muestras.
error1 <- propHomR-propHom
# Histograma de las diferencias, desviaciones o errores.
hist(error1,col="blue")

# Cálculo del intervalo de confianza al 95% de los errores.
quantile(error1,c(0.025,0.975))
##       2.5%      97.5% 
## -0.1203980  0.1129353