Introducción al Diseño Estadístico de Experimentos

Estudio R

Marzo de 2018

Conceptos básicos

Item Descripción
Integrantes Desarroladores del experimento
Título del experimento Conciso, diciente y específico
Objetivos del experimento Insesgados, específicos, cuantificables y de uso práctico
Variables respuesta Valores usuales de operación, distribución o rango usual, precisión o rango de medición, instrumento de medida y cómo será tomada
Factores Factores con cada uno de los niveles, distribución y rango de operación común, precisión o rango en la cual serán medidos.
Diseño Un factor, factorial, bloques, parcelas divididas, cuadro latino, entre otros

Métodos Estadísticos

Clasificiación de diseños experimentales:

Nota: tomado del libro Análisis y diseño de experimentos de Humberto Pulido y Román de la Vara.

Elementos de Inferencia Estadística

Fórmulas para intervalos de confianza:

Ejemplos con R

fAge mAge weeks premature visits gained weight sexBaby smoke
31 30 39 full term 13 1 6.88 male smoker
34 36 39 full term 5 35 7.69 male nonsmoker
36 35 40 full term 12 29 8.88 male nonsmoker
41 40 40 full term 13 30 9 female nonsmoker
42 37 40 full term NA 10 7.94 male nonsmoker
37 28 40 full term 12 35 8.25 male smoker

Solución:

  1. Planteamiento de hipótesis

\[H_0: \mu_f=\mu_nf\] \[H_0: \mu_f\neq\mu_nf\]

  1. Parámetro estimado
tapply(births$weight, births$smoke, mean)
## nonsmoker    smoker 
##    7.1795    6.7790
fuma <- 6.7790
nofuma <- 7.1795
(diferencia <- fuma - nofuma)
## [1] -0.4005
  1. Validar supuestos

    • Normalidad
library(ggplot2)
ggplot(births,aes(x = weight)) + 
  geom_histogram(aes(colour = smoke)) +
  facet_grid(~ smoke) +
  theme_bw() 

par(mfrow = c(1, 2))
qqnorm(births[births$smoke == "nonsmoker","weight"], xlab = "",
       main = "nonsmoker", col = "firebrick")
qqline(births[births$smoke == "nonsmoker","weight"])
qqnorm(births[births$smoke == "smoker","weight"], xlab = "",
       main = "smoker", col = "springgreen4")
qqline(births[births$smoke == "smoker","weight"])

shapiro.test(births[births$smoke == "smoker","weight"])
## 
##  Shapiro-Wilk normality test
## 
## data:  births[births$smoke == "smoker", "weight"]
## W = 0.89491, p-value = 0.0003276
shapiro.test(births[births$smoke == "nonsmoker","weight"]) 
## 
##  Shapiro-Wilk normality test
## 
## data:  births[births$smoke == "nonsmoker", "weight"]
## W = 0.92374, p-value = 2.234e-05

library(car)
leveneTest(weight ~ smoke, data = births, center = "median")
## Levene's Test for Homogeneity of Variance (center = "median")
##        Df F value Pr(>F)
## group   1  0.4442 0.5062
##       148
  1. Nivel de significancia \(\alpha\)

\[\alpha=0.05\]

  1. Obtener el valor P.
t.test(x = births[births$smoke == "smoker", "weight"],
       y = births[births$smoke == "nonsmoker", "weight"],
       alternative = "two.sided", mu = 0, var.equal = TRUE, conf.level = 0.95)
## 
##  Two Sample t-test
## 
## data:  births[births$smoke == "smoker", "weight"] and births[births$smoke == "nonsmoker", "weight"]
## t = -1.5517, df = 148, p-value = 0.1229
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.9105531  0.1095531
## sample estimates:
## mean of x mean of y 
##    6.7790    7.1795
  1. Conclusión

Dado que el valor P es igual a 0.1229 (mayor que 0.05), no existe evidencia suficiente para rechazar \(H_0\), es decir, que el peso promedio de los recien nacidos con madres que fuman, no difiere de aquellos cuyas madre sí lo hacen. En otras palabras, no existe suficiente evidencia para decir que los promedios de peso de los recien nacidos son diferentes.