Actividad 332

Cada estudiante tiene a si cargo dar solución a cuatro problemas empleando para ello simulación de modelos estadísticos.(ver tabla al final)



Problemas de simulación



Problema 1

Alejandra es la persona encargada de las compras para un gran laboratorio de investigaciones biológicas. Uno de los principales insumos utilizados en el laboratorio son reactivos especializados, los cuales se compran a dos fabricantes internacionales de gran renombre. Debido a problemas logísticos durante el transporte, se estima que cada unidad de reactivo tiene una probabilidad de \(0.03\) de estar contaminada o defectuosa en el caso del primer fabricante, y una probabilidad de \(0.05\) para el segundo fabricante. Usted recibe un envío de \(100\) reactivos.



  1. Sea \(X\) el número de unidades defectuosas en el envío del fabricante 1 y \(Y\) del número de unidades defectuosas provenientes del fabricante 2 . ¿Cuáles son las distribuciones de las variables \(X\) y \(Y\)?
  2. Genere muestras simuladas de tamaño \(1000\) a partir de las distribuciones de \(X\) y \(Y\).
  3. Utilice las muestras para estimar la probabilidad de que el número total de unidades defectuosas sea menor a diez.
  4. Utilice las muestras para estimar la probabilidad de que el envío del primer fabricante se presentaran más unidades defectuosas que el envío realizado por el segundo fabricante.
  5. Construya una gráfica de probabilidad normal para el número total de unidades defectuosas. ¿Sigue una distribución normal?





Problema 2

La edad de una antigua pieza de materia orgánica se puede estimar a partir de la tasa a la que emite partículas beta como resultado del decaimiento del carbono-14. Por ejemplo , si X es el número de partículas emitidas durante diez minutos por un fragmento óseo con 10000 años de antigüedad que contiene 1 g de carbono, entonces X tiene una distribución de Poisson con media \(\lambda=45.62\) . Un arqueólogo descubrió un pequeño fragmento óseo que contiene 1 g de carbono. Si t es la edad desconocida del hueso, en años, el arqueólogo contar{a el número X de partículas emitidas en diez minutos y calculará una edad estimada \(\widehat{t}\) con la fórmula:

\[\widehat{t}=\dfrac{\ln 15.3 - \ln (X/10)}{0.0001210} \]

El arqueólogo no lo sabe, pero el hueso tiene exactamente \(10000\) años de antigüedad, por lo que \(X\) tiene una distribución de Poisson con \(\lambda=45.62\).



  1. Genere una muestra simulada de 10000 valores de \(X\) y sus correspondientes valores de \(\widehat{t}\).
  2. Estime la media de \(\widehat{t}\).
  3. Estime la desviación estándar de \(\widehat{t}\).
  4. Estime la probabilidad de que \(\widehat{t}\) esté a 1000 años con una edad real de 10000 años.





Problema 3

Tres sistemas están compuestos por los componentes R1,R2, R3 y R4 conectados, como lo muestra las siguientes figuras. El tiempo de vida en meses de los componentes R1 y R3 sigue una distribución lognormal con \(\mu=2\) y \(\sigma=1\) y la distribución en meses de los componentes R2 y R4 una distribución lognormal con \(\mu=1\) y \(\sigma=0.1\). El sistema solo funciona si A y B lo hacen.



  1. Genere por simulación un gran número (al menos \(1000\)) de los tiempos de vida de los sistemas
  2. Estime la media del tiempo de vida para cada sistema.
  3. Estime la probabilidad de que los sistemas fallen en un tiempo inferior a dos meses.
  4. Estime el \(20^{o}\) percentil (\(P_{20}\)) de los tiempos de vida del primer sistema .
  5. Construya una gráfica de probabilidad normal de los tiempo de vida para cada sistema. ¿Los tiempos de vida de los sistemas tienen una distribución aproximadamente normal?
  6. Construya un histograma de los tiempos de vida de los sistemas. ¿Están sesgados a la izquierda, sesgados a la derecha, o son aproximadamente simétricos?





Problema 4

Estimación del valor de \(\pi\) . LA siguiente figura sugiere como estimar el valor de \(\pi\) con una simulación. En la figura, un círculo con área igual a \(\pi/4\), está inscrito en un cuadrado cuya área es igual a 1. Se elige de forma aleatoria 100 puntos dentro del cuadrado . La probabilidad de que un punto esté dentro del círculo es igual a la fracción del área del cuadrado que abarca a este, la cual es \(\pi/4\). Por tanto, se puede estimar el valor de \(\pi/4\) al contar el número de puntos dentro del círculo, que es 79 para obtener la estimación de \(\pi/4 \approx 0.76\) . De este último resultado se concluye que \(\pi \approx 4(0.79) =3.14\) . Este ejercicio presenta un experimento de simulación que fue diseñado para estimar el valor de \(\pi\) al generar 1000 puntos en el cuadrado.



  1. Genere 1000 coordenadas \(x\): \(X_{1}\), . . . , \(X_{1000}\). Utilice la distribución uniforme con valor mínimo de \(0\) y valor máximo de \(1\). La distribución uniforme genera variables aleatorias que tienen la misma probabilidad de venir de cualquier parte del intervalo \((0, 1)\).

  2. Genere \(1000\) coordenadas \(y\) : \(Y_{1}, . . . , Y_{1000}\), utilizando nuevamente la distribución uniforme con valor mínimo de \(0\) y valor máximo de \(1\).

  3. Cada punto \((X_{i},Y_{i})\) se encuentra dentro del círculo si su distancia desde el centro \((0.5, 0.5)\) es menor a \(0.5\). Para cada par \((X_{i},Y_{i})\) determine si la distancia desde el centro es menor a \(0.5\). Esto último se puede realizar al calcular el valor \((X_{i}-0.5)^{2}+(Y_{i}-0.5)^{2}\), que es el cuadrado de la distancia, y al determinar si es menor que \(0.25\).

  4. ¿Cuántos de los puntos están dentro del círculo? ¿Cuál es su estimación de \(\pi\)? (Nota: Con sólo 1000 puntos, es probable que su estimación sea inferior por 0.05 o más. Una simulación con 10000 y 100000 puntos tiene mayores probabilidades de dar como resultado una estimación muy cercana al valor verdadero


Ejercicios tomados de Navidi(2006)




Problema 5

Una planta de manufactura produce pistones para motores de combustión interna. El diámetro de los pistones debe ser de 10 cm, pero debido a variaciones en el proceso de producción, sigue una distribución normal con media \(\mu = 10\) cm y desviación estándar \(\sigma = 0.02\) cm. Un pistón es rechazado si su diámetro está fuera del rango de 9.97 cm a 10.03 cm.

  1. Genere una muestra simulada de 5000 pistones.
  2. Estime la proporción de pistones rechazados por no cumplir con las especificaciones.
  3. Si el costo de reprocesamiento de un pistón defectuoso es de $15 USD, estime el costo promedio de reprocesamiento por cada 5000 pistones fabricados.
  4. Genere un histograma del diámetro de los pistones y evalúe si se ajusta a la distribución normal.
  5. ¿Qué estrategias podrían implementarse para reducir el número de pistones rechazados?





Problema 6

Un servidor web recibe en promedio 30 solicitudes por minuto. Se ha determinado que el número de solicitudes sigue una distribución de Poisson. Un equipo de desarrolladores desea simular el comportamiento del servidor durante las horas pico.



  1. Simule 10000 minutos de solicitudes utilizando la distribución de Poisson con \(\lambda = 30\).
  2. Estime la probabilidad de que en un minuto lleguen más de 40 solicitudes.
  3. Si el servidor puede manejar hasta 35 solicitudes por minuto sin colapsar, estime la proporción de minutos en los que se sobrecarga el servidor.
  4. ¿Qué mejoras podría implementar el equipo de sistemas para disminuir el riesgo de sobrecarga?
  5. Construya un histograma con la distribución de solicitudes por minuto. ¿Qué tan dispersa es la demanda?





Problema 7

Una constructora está evaluando la resistencia a la compresión de cilindros de concreto a los 28 días de curado. La resistencia sigue una distribución normal con media \(\mu = 30\) MPa y desviación estándar \(\sigma = 5\) MPa. Se requiere que el 95% de los cilindros superen los 25 MPa.



  1. Genere una muestra simulada de 10000 cilindros de concreto.
  2. Estime el porcentaje de cilindros que cumplen con la resistencia mínima de 25 MPa.
  3. Estime el \(10^{o}\) percentil (\(P_{10}\)) de la resistencia a la compresión.
  4. Si un cilindro que no cumple cuesta $50 USD en reprocesamiento, estime el costo promedio asociado a los rechazos en 10000 cilindros.
  5. ¿Qué medidas de control de calidad sugerirías implementar para mejorar el desempeño de la mezcla de concreto?





Problema 8

Una turbina de gas tiene cuatro componentes críticos que fallan de manera independiente. Los tiempos de vida (en horas) de cada componente siguen distribuciones exponenciales:

Componente 1: \(\lambda = 1/5000\) Componente 2: \(\lambda = 1/4000\) Componente 3: \(\lambda = 1/6000\) Componente 4: \(\lambda = 1/5500\)

La turbina deja de funcionar cuando el primer componente falla.



  1. Genere 5000 simulaciones del tiempo de vida de la turbina.
  2. Estime la vida media de la turbina.
  3. Estime la probabilidad de que la turbina falle antes de 4000 horas.
  4. Construya el histograma del tiempo de vida de la turbina y comente sobre su forma.
  5. ¿Qué estrategias de mantenimiento preventivo se pueden considerar?





Problema 9

El caudal máximo diario de un río se modela como una distribución Gumbel con parámetros \(\mu = 500\) m³/s y \(\beta = 100\) m³/s. Un puente ha sido diseñado para resistir caudales de hasta 750 m³/s. Se desea estimar la probabilidad de que el puente sea superado en los próximos 10 años.



  1. Genere 3650 simulaciones (equivalente a 10 años) del caudal máximo diario.
  2. Estime la probabilidad de que en al menos un día en los próximos 10 años el caudal supere los 750 m³/s.
  3. Si se desea reducir el riesgo de superación al 1%, ¿qué caudal máximo debería resistir el nuevo diseño del puente?
  4. Construya el histograma de los caudales simulados y analice la distribución.
  5. ¿Qué medidas adicionales de mitigación podría implementar el ingeniero civil a cargo?




Asignación de problemas

set.seed(123)
library(dplyr)
library(kableExtra)

n <- 25 # Número de estudiantes
m <- 4  # Número de problemas asignados por estudiante

# Genera la matriz de problemas SIN repetidos en cada fila
# problema <- t(
#   replicate(n, sample(1:9, m, replace = FALSE))
# )
# 
# problemas =saveRDS(problema, "data/problemas.RDS")

# Lista de nombres (verifica que la cantidad de nombres sea igual a n)
nombres <- c(
  "Alban Alarcon Sofia", "Arango Gonzalez Enmanuel", "Ariza Rodriguez Juan Nicolas",
  "Bolivar Arroyave Juan Jose", "Casas Caicedo Alejandro", "Castañeda Gualguan Alejandro",
  "Correa Arenas Juan Andres", "Díaz Guevara Juan Carlos", "Florez Caceres Daniel Eduardo",
  "Franco Valencia Laura Camila", "Garcia Andrade Juan Fernando", "Gonzalez Valencia Juan Felipe",
  "Larrahondo Giron Juan Jose", "Lopez Romero Isabel Valentina", "Lopez Silva Nicolas",
  "Marinez Burbano Nicolas", "Morales Franky Omar Francisco", "Muñoz Avila Nicolas",
  "Ordoñez Liscano Juan Miguel", "Otero Marin Isabella", "Palau Restrepo Rafael David",
  "Piñeres Osorio Luis David", "Quiñones Certuche Christian Camilo", "Rios Aguirre Jhon David",
  "Vasco Velez Julian Andres"
)

problema <-readRDS("data/problemas.RDS")


# Crea el data.frame combinando nombres e ID con los problemas
datos <- data.frame(
  ID = 1:n,
  Nombre = nombres,
  Problema1 = problema[, 1],
  Problema2 = problema[, 2],
  Problema3 = problema[, 3],
  Problema4 = problema[, 4]
)

# Muestra la tabla en formato bonito
datos %>%
  kbl() %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))
ID Nombre Problema1 Problema2 Problema3 Problema4
1 Alban Alarcon Sofia 3 6 9 2
2 Arango Gonzalez Enmanuel 2 6 3 5
3 Ariza Rodriguez Juan Nicolas 4 6 8 1
4 Bolivar Arroyave Juan Jose 5 3 8 1
5 Casas Caicedo Alejandro 9 1 5 3
6 Castañeda Gualguan Alejandro 8 2 7 9
7 Correa Arenas Juan Andres 9 6 3 4
8 Díaz Guevara Juan Carlos 1 3 7 5
9 Florez Caceres Daniel Eduardo 7 1 8 2
10 Franco Valencia Laura Camila 7 3 4 5
11 Garcia Andrade Juan Fernando 7 5 3 6
12 Gonzalez Valencia Juan Felipe 9 2 5 7
13 Larrahondo Giron Juan Jose 8 4 7 5
14 Lopez Romero Isabel Valentina 2 1 8 3
15 Lopez Silva Nicolas 9 6 5 1
16 Marinez Burbano Nicolas 4 6 8 3
17 Morales Franky Omar Francisco 8 6 9 1
18 Muñoz Avila Nicolas 6 2 1 8
19 Ordoñez Liscano Juan Miguel 4 5 8 6
20 Otero Marin Isabella 3 1 4 6
21 Palau Restrepo Rafael David 9 8 6 1
22 Piñeres Osorio Luis David 7 3 6 4
23 Quiñones Certuche Christian Camilo 9 6 8 3
24 Rios Aguirre Jhon David 7 3 9 6
25 Vasco Velez Julian Andres 5 9 3 2