1. Intervalo para la media (normal con varianza conocida)

Una empresa dedicada al diseño de sistemas de climatización industrial ha desarrollado un nuevo sensor de temperatura. Este sensor ha sido calibrado en laboratorio y se sabe que tiene una desviación estándar constante de 1.2°C. Para verificar su precisión en campo, se toman 30 lecturas en condiciones de operación real y se obtiene una media de 75.3°C. Estime un intervalo de confianza del 95% para la temperatura real medida por el sensor.

\[IC_{\mu}: \bar{x} \pm z_{\alpha/2} \hspace{.1cm}\dfrac{\sigma}{\sqrt{n}} \]

set.seed(101)
datos1 <- rnorm(30, mean = 75.3, sd = 1.2)  # μ = 75.3, σ conocida = 1.2
cat("IdeC para mu (95%) : (", mean(datos1)+ qnorm(c(0.025,0.975)*1.2/sqrt(30)),")")
IdeC para mu (95%) : ( 72.6564 74.4066 )



2. Intervalo para la media (normal con varianza desconocida, muestra pequeña)

Un laboratorio de materiales desea conocer la resistencia promedio de un nuevo compuesto que podría usarse en estructuras de soporte para maquinaria pesada. Se realiza un ensayo destructivo en 10 muestras del material, obteniéndose los valores de resistencia. Estime un intervalo de confianza del 95% para la resistencia media del material con base en esta muestra.

\[IC_{\mu}: \bar{x} \pm t_{\alpha/2} \hspace{.1cm}\frac{s}{\sqrt{n}} \]

set.seed(102)
datos2 <- rnorm(10, mean = 200, sd = 3)  # Resistencia de material

cat("IdeC para mu (95%) : (", mean(datos1)+ qt(c(0.025,0.975),29)*1.2/sqrt(30),")")
IdeC para mu (95%) : ( 74.75246 75.64863 )



3. Intervalo para la media (muestra grande, TLC)

En una planta de ensamblaje automatizado, se está monitoreando el tiempo promedio que tarda una máquina en completar una operación crítica. Se recolectan datos de 100 ciclos consecutivos. Suponiendo que la distribución del tiempo es desconocida pero el tamaño muestral es suficientemente grande, estime el intervalo de confianza del 95% para el tiempo medio de operación.

\[IC_{\mu}: \bar{x} \pm z_{\alpha/2} \hspace{.1cm}\dfrac{s}{\sqrt{n}} \]

set.seed(103)
datos3 <- rnorm(100, mean = 50, sd = 5)  # Tiempos de operación máquina

cat("IdeC para mu (95%) : (", mean(datos1)+ qnorm(c(0.025,0.975)*sd(datos3)/sqrt(length(datos3))),")")
IdeC para mu (95%) : ( 72.938 75.10375 )



4. Intervalo para una proporción (n grande)

En una línea de producción de componentes electrónicos, se realiza un control de calidad sobre 200 unidades producidas. Se detecta que 18 de ellas presentan defectos que requieren reproceso. Estime un intervalo de confianza del 95% para la proporción real de productos defectuosos en esta línea de producción.

\[\Bigg[ \hspace{.3cm} \widehat{p}-z_{\alpha/2}\sqrt{\frac{\widehat{p}\hspace{.1cm}(1-\widehat{p})}{n}} \hspace{.2cm};\hspace{.2cm} \widehat{p}+z_{\alpha/2}\sqrt{\frac{\widehat{p}\hspace{.1cm}(1-\widehat{p})}{n}} \hspace{.3cm} \Bigg] \]

set.seed(104)
datos4 <- c(rep(1, 18), rep(0, 182))  # 1 = defectuoso, 0 = no defectuoso

x=18
n=200
phat= 18/200

cat("IdeC p (95%) :(", phat + qnorm(c(0.025,0.975))*phat*(1-phat)/200,")")
IdeC p (95%) :( 0.08919739 0.09080261 )



5. Intervalo para una varianza

Un ingeniero de calidad está interesado en conocer qué tan consistente es el proceso de corte de piezas metálicas en una planta. Para ello, mide la longitud de 15 piezas producidas consecutivamente. Estime un intervalo de confianza del 95% para la varianza poblacional de la longitud de las piezas producidas por esta máquina.

\[IC_{\sigma^{2}}: \Bigg( \displaystyle\frac{(n-1)S^{2}}{\chi^{2}_{1-\alpha/2 ; v=n-1}} ;\displaystyle\frac{(n-1)S^{2}}{\chi^{2}_{\alpha/2; v=n-1}} \Bigg)\]

set.seed(105)
datos5 <- round(rnorm(15, mean = 10, sd = 0.2), 2)  # Longitud de ejes

cat("IdeC para sigma^2 : (", 14*var(datos5)*1/qchisq(c(0.975,0.025), 29), ")")
IdeC para sigma^2 : ( 0.005794403 0.01650976 )



6. Intervalo para la diferencia de medias pareadas

En una planta de manufactura, se está evaluando el efecto de una recalibración sobre el tiempo que tarda una máquina en fabricar un producto. Se toma una muestra de 5 operaciones antes de la calibración y otras 5 después, en los mismos horarios y condiciones. Estime un intervalo de confianza del 95% para la diferencia promedio en tiempos de producción, suponiendo datos pareados.

\[IC_{d=\bar{x}_{1}-\bar{x}_{2}}: \bar{d} \pm t_{\alpha/2} \frac{s_{d}}{\sqrt{n}}\]

donde \(d_{i}=x_{1i}-x_{2i}\) y \(s_{d}\) es la desviación estándar de las diferencias \(d_{i}=x_{1i}-x_{2i}\)

set.seed(106)
antes <- c(21, 22, 20, 23, 21)
despues <- antes - c(1, 1, 1, 1, 1) + rnorm(5, 0, 0.2)  # Mejora tras calibración

d = antes-despues
cat("IdeC para mu (95%) : (", mean(d)+ qt(c(0.025,0.975),4)*sd(d)/sqrt(5),")", "¸\n")
IdeC para mu (95%) : ( 0.8935108 1.186083 ) ¸
t.test(antes, despues, 
       paired = TRUE, 
       var.equal = FALSE,
       conf.level = 0.95)$conf
[1] 0.8935108 1.1860830
attr(,"conf.level")
[1] 0.95



7. Intervalo para la diferencia de medias con muestras independientes (varianzas iguales)

Dos turnos de trabajo (mañana y tarde) operan la misma máquina ensambladora. Se quiere comparar el rendimiento entre los dos turnos, para lo cual se toma una muestra aleatoria de 5 días de producción para cada uno. Asumiendo que las varianzas son iguales, estime un intervalo de confianza del 95% para la diferencia de medias entre los dos turnos.

\[(\bar{x}_{1}-\bar{x}_{2})\pm t_{\alpha/2} \hspace{.2cm}s_{p} \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}\]

donde \(s_{p}^{2}\) es la varianza común

\[s_{p}^{2}=\frac{(n_{1}-1)s_{1}^{2}+(n_{2}-1)s_{2}^{2}}{n_{1}+n_{2}-2}\]

y \(t_{\alpha/2}\) se distribuye t-student con \(v=n_{1}+n_{2}-2\) grados de libertad

Supuestos: + \(X_{1}\) y \(X_{2}\) son variables aleatorias independientes con distribución normal + \(X_{1}\) y \(X_{2}\) tienen varianzas iguales pero desconocidas

set.seed(107)
turno1 <- rnorm(5, mean = 90, sd = 2)
turno2 <- rnorm(5, mean = 85, sd = 2)

var.test(turno1, turno2)$conf
[1] 0.01276461 1.17749704
attr(,"conf.level")
[1] 0.95
cat("\n")
t.test(turno1, turno2, 
       paired = TRUE, 
       var.equal = FALSE,
       conf.level = 0.95 )$conf
[1] 0.2792651 7.8718971
attr(,"conf.level")
[1] 0.95



8. Intervalo para la diferencia de medias con muestras independientes (varianzas diferentes)

Siguiendo el caso anterior, pero ahora sin asumir que las varianzas de los dos turnos son iguales, estime el intervalo de confianza del 95% para la diferencia de medias de producción diaria entre ambos turnos utilizando el procedimiento de Welch.

\[(\bar{x}_{1}-\bar{x}_{2})\pm t_{\alpha/2} \sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}\]

donde los grados de libertad de t se aproximan a

\[v=\frac{(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{\Big[(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)\Big]+\Big[(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)\Big]}\]

set.seed(107)
turno1 <- rnorm(5, mean = 90, sd = 2)
turno2 <- rnorm(5, mean = 85, sd = 5)

var.test(turno1, turno2)$conf
[1] 0.002042338 0.188399527
attr(,"conf.level")
[1] 0.95
cat("\n")
t.test(turno1, turno2, 
       paired = TRUE, 
       var.equal = FALSE,
       conf.level = 0.95 )$conf
[1] -4.409626 12.323995
attr(,"conf.level")
[1] 0.95



9. Intervalo para la razón de varianzas

Un ingeniero de producción sospecha que la variabilidad en la producción de la línea A es mayor que la de la línea B. Para comprobarlo, recoge datos sobre el rendimiento de ambas líneas durante una semana. Estime un intervalo de confianza del 95% para la razón entre las varianzas de ambas líneas de producción.

\[\Bigg(\dfrac{s^{2}_{1}}{s^{2}_{2}} \dfrac{1}{f_{1-\alpha/2}(v_{1}v_{2})}; \dfrac{s^{2}_{1}}{s^{2}_{2}} \dfrac{1}{f_{\alpha/2}(v_{1}v_{2})}\Bigg)\]

set.seed(107)
turno1 <- rnorm(5, mean = 90, sd = 2)
turno2 <- rnorm(5, mean = 85, sd = 2)

var.test(turno1, turno2)$conf
[1] 0.01276461 1.17749704
attr(,"conf.level")
[1] 0.95



10. Intervalo para la diferencia de proporciones

En dos líneas de ensamblaje de una fábrica de dispositivos médicos, se realiza una inspección sobre 200 productos de la línea A y 150 productos de la línea B. Se encuentran 18 defectuosos en la línea A y 10 en la línea B. Estime un intervalo de confianza del 95% para la diferencia de proporciones de defectuosos entre las dos líneas.

\[(\widehat{p_{1}}-\widehat{p_{2}}) \pm z_{\alpha/2} \sqrt{\frac{\widehat{p_{1}}(1-\widehat{p_{1}})}{n_{1}}+\frac{\widehat{p_{2}}(1-\widehat{p_{2}})}{n_{2}}}\]

defectuosos_A <- c(rep(1, 18), rep(0, 182))  # n = 200
defectuosos_B <- c(rep(1, 10), rep(0, 140))  # n = 150

prop.test(c(18,10), c(200, 150))$conf
[1] -0.03877230  0.08543896
attr(,"conf.level")
[1] 0.95



11. Cálculo del tamaño de muestra para estimar una media

Una empresa que fabrica ejes para motores desea estimar con precisión la longitud promedio de sus productos. Se sabe por estudios anteriores que la desviación estándar de la longitud es aproximadamente 0.5 mm. La gerencia desea que el error de estimación no supere los 0.1 mm con un nivel de confianza del 95%. ¿Cuál debe ser el tamaño mínimo de muestra requerido para lograr esta precisión?

\[n = \displaystyle\frac{z_{\alpha/2}^{2}\sigma^{2}}{e^{2}}\]

sigma = 0.5
e =0.1
z = qnorm(0.975)

cat(" n =", z^2*sigma^2/e^2, "\n")
 n = 96.03647 
paqueteDEG::sizemu(z,sigma^2, e)
[1] 96.03647



12. Cálculo del tamaño de muestra para estimar una proporción

En una planta de ensamblaje se desea estimar la proporción de productos defectuosos. En inspecciones pasadas, se ha observado que aproximadamente el 8% de los productos pueden presentar defectos. Se desea estimar esta proporción con un margen de error máximo de 3% y un nivel de confianza del 95%. ¿Cuántos productos deben ser inspeccionados para cumplir con estos criterios?

\[n=\dfrac{z_{\alpha/2}^{2}\hspace{.3cm} p(1-p)}{e^{2}}\]

library(dplyr)
z = qnorm(0.975)
pq = 0.08*(1-0.08)
e = 0.03

cat("n =", z^2*pq/e^2, "\n")
n = 314.146 
 paqueteDEG::sizep(z,0.08, 0.03) %>% 
           round(0)
[1] 314



13. Cálculo del tamaño de muestra para estimar una proporción (varianza máxima)

Un equipo de control de calidad desea diseñar un plan de muestreo para estimar la proporción de componentes defectuosos en una nueva línea de producción. Dado que no se dispone de información previa sobre la proporción de defectos, se desea asumir el escenario más conservador para garantizar un tamaño de muestra suficiente. Se quiere lograr una estimación con un margen de error no mayor al 4% y un nivel de confianza del 95%. ¿Cuál es el tamaño mínimo de muestra requerido bajo este criterio de máxima varianza?

\[n=\dfrac{z_{\alpha/2}^{2}\hspace{.3cm} 0.25}{e^{2}}\]

library(dplyr)
z = qnorm(0.975)
e = 0.03

cat("n =", z^2*0.25/e^2, "\n")
n = 1067.072 
 paqueteDEG::sizep(z,0.5, 0.03) %>% 
           round(0)
[1] 1067