AndalucíaAndalucía
MadridMadrid
CataluñaCataluña
GaliciaGalicia
MurciaMurcia
ValenciaValencia
En construcciónAñadimos comunidades, materias, años y soluciones de forma progresiva y constante.
Muestreo estratificado y distribución de medias muestrales
Problema
2024 · Ordinaria · Titular
7
Examen
BLOQUE D
a) Se realizan dos muestreos aleatorios estratificados con afijación proporcional para una población dividida en cuatro estratos E1,E2,E3E_1, E_2, E_3 y E4E_4. En la primera muestra se han seleccionado 2525 individuos de E1E_1 y 3030 de E2E_2. En la segunda muestra se han seleccionado 8080 individuos de E3E_3 y 100100 de E4E_4. Sabiendo que el estrato E1E_1 tiene 500500 individuos y que el E3E_3 tiene 400400, determine el tamaño de cada estrato de la población y el tamaño de las muestras en cada estrato.b) Dada la población {3,1,2,5,7}\{-3, -1, 2, 5, 7\}, se consideran todas las muestras posibles de tamaño 22 obtenidas mediante muestreo aleatorio simple. Calcule la media y la varianza de la distribución de las medias muestrales.
Muestreo estratificadoMedia muestralVarianza
a) Para determinar el tamaño de cada estrato de la población (NiN_i) y el tamaño de las muestras en cada estrato (nin_i), utilizamos la propiedad de la afijación proporcional, que establece que la fracción de muestreo es constante para cada estrato dentro de un muestreo. Es decir, niNi=k\frac{n_i}{N_i} = k, donde kk es la fracción de muestreo.

El problema describe dos muestreos independientes, cada uno con su propia fracción de muestreo.

Primer muestreo (estratos $E_1$ y $E_2$)

Se nos da que N1=500N_1 = 500 individuos y se seleccionan n1=25n_1 = 25 individuos de E1E_1. La fracción de muestreo para este primer muestreo es:

k1=n1N1=25500=0.05k_1 = \frac{n_1}{N_1} = \frac{25}{500} = 0.05

También se nos dice que se seleccionan n2=30n_2 = 30 individuos de E2E_2. Como la afijación es proporcional, la fracción de muestreo k1k_1 debe ser la misma para E2E_2:

k1=n2N2    0.05=30N2k_1 = \frac{n_2}{N_2} \implies 0.05 = \frac{30}{N_2}

Despejando N2N_2:

N2=300.05=600N_2 = \frac{30}{0.05} = 600
Segundo muestreo (estratos $E_3$ y $E_4$)

Se nos da que N3=400N_3 = 400 individuos y se seleccionan n3=80n_3 = 80 individuos de E3E_3. La fracción de muestreo para este segundo muestreo es:

k2=n3N3=80400=0.2k_2 = \frac{n_3}{N_3} = \frac{80}{400} = 0.2

También se nos dice que se seleccionan n4=100n_4 = 100 individuos de E4E_4. Como la afijación es proporcional, la fracción de muestreo k2k_2 debe ser la misma para E4E_4:

k2=n4N4    0.2=100N4k_2 = \frac{n_4}{N_4} \implies 0.2 = \frac{100}{N_4}

Despejando N4N_4:

N4=1000.2=500N_4 = \frac{100}{0.2} = 500

Por lo tanto, los tamaños de cada estrato de la población son:N1=500N_1 = 500 N2=600N_2 = 600 N3=400N_3 = 400 N4=500N_4 = 500 Y los tamaños de las muestras en cada estrato, según los muestreos realizados, son:Para el primer muestreo: n1=25n_1 = 25, n2=30n_2 = 30.Para el segundo muestreo: n3=80n_3 = 80, n4=100n_4 = 100.

b) Dada la población {3,1,2,5,7}\{-3, -1, 2, 5, 7\} con un tamaño N=5N = 5, y muestras de tamaño n=2n = 2 obtenidas mediante muestreo aleatorio simple sin reemplazo.

Primero, calculamos la media (μ\mu) y la varianza poblacional (σ2\sigma^2).

μ=3+(1)+2+5+75=105=2\mu = \frac{-3 + (-1) + 2 + 5 + 7}{5} = \frac{10}{5} = 2
σ2=(xiμ)2N=(32)2+(12)2+(22)2+(52)2+(72)25\sigma^2 = \frac{\sum (x_i - \mu)^2}{N} = \frac{(-3-2)^2 + (-1-2)^2 + (2-2)^2 + (5-2)^2 + (7-2)^2}{5}
σ2=(5)2+(3)2+02+32+525=25+9+0+9+255=685=13.6\sigma^2 = \frac{(-5)^2 + (-3)^2 + 0^2 + 3^2 + 5^2}{5} = \frac{25 + 9 + 0 + 9 + 25}{5} = \frac{68}{5} = 13.6

A continuación, listamos todas las muestras posibles de tamaño n=2n=2 y calculamos sus medias muestrales. El número total de muestras posibles es (Nn)=(52)=5×42=10\binom{N}{n} = \binom{5}{2} = \frac{5 \times 4}{2} = 10.Las muestras y sus medias muestrales xˉi\bar{x}_i son:1. {3,1}    xˉ1=(31)/2=2\{-3, -1\} \implies \bar{x}_1 = (-3-1)/2 = -2 2. {3,2}    xˉ2=(3+2)/2=0.5\{-3, 2\} \implies \bar{x}_2 = (-3+2)/2 = -0.5 3. {3,5}    xˉ3=(3+5)/2=1\{-3, 5\} \implies \bar{x}_3 = (-3+5)/2 = 1 4. {3,7}    xˉ4=(3+7)/2=2\{-3, 7\} \implies \bar{x}_4 = (-3+7)/2 = 2 5. {1,2}    xˉ5=(1+2)/2=0.5\{-1, 2\} \implies \bar{x}_5 = (-1+2)/2 = 0.5 6. {1,5}    xˉ6=(1+5)/2=2\{-1, 5\} \implies \bar{x}_6 = (-1+5)/2 = 2 7. {1,7}    xˉ7=(1+7)/2=3\{-1, 7\} \implies \bar{x}_7 = (-1+7)/2 = 3 8. {2,5}    xˉ8=(2+5)/2=3.5\{2, 5\} \implies \bar{x}_8 = (2+5)/2 = 3.5 9. {2,7}    xˉ9=(2+7)/2=4.5\{2, 7\} \implies \bar{x}_9 = (2+7)/2 = 4.5 10. {5,7}    xˉ10=(5+7)/2=6\{5, 7\} \implies \bar{x}_{10} = (5+7)/2 = 6 La distribución de las medias muestrales es: {2,0.5,1,2,0.5,2,3,3.5,4.5,6}\{-2, -0.5, 1, 2, 0.5, 2, 3, 3.5, 4.5, 6\}.

Media de la distribución de las medias muestrales ($E[\bar{X}]$ o $\mu_{\bar{x}}$)
μxˉ=xˉi10=2+(0.5)+1+2+0.5+2+3+3.5+4.5+610\mu_{\bar{x}} = \frac{\sum \bar{x}_i}{10} = \frac{-2 + (-0.5) + 1 + 2 + 0.5 + 2 + 3 + 3.5 + 4.5 + 6}{10}
μxˉ=2010=2\mu_{\bar{x}} = \frac{20}{10} = 2

La media de la distribución de las medias muestrales es 22, que coincide con la media poblacional μ\mu.

Varianza de la distribución de las medias muestrales ($\sigma_{\bar{x}}^2$)

Calculamos la varianza de las medias muestrales directamente:

σxˉ2=(xˉiμxˉ)210\sigma_{\bar{x}}^2 = \frac{\sum (\bar{x}_i - \mu_{\bar{x}})^2}{10}
σxˉ2=(22)2+(0.52)2+(12)2+(22)2+(0.52)2+(22)2+(32)2+(3.52)2+(4.52)2+(62)210\sigma_{\bar{x}}^2 = \frac{(-2-2)^2 + (-0.5-2)^2 + (1-2)^2 + (2-2)^2 + (0.5-2)^2 + (2-2)^2 + (3-2)^2 + (3.5-2)^2 + (4.5-2)^2 + (6-2)^2}{10}
σxˉ2=(4)2+(2.5)2+(1)2+02+(1.5)2+02+12+(1.5)2+(2.5)2+4210\sigma_{\bar{x}}^2 = \frac{(-4)^2 + (-2.5)^2 + (-1)^2 + 0^2 + (-1.5)^2 + 0^2 + 1^2 + (1.5)^2 + (2.5)^2 + 4^2}{10}
σxˉ2=16+6.25+1+0+2.25+0+1+2.25+6.25+1610\sigma_{\bar{x}}^2 = \frac{16 + 6.25 + 1 + 0 + 2.25 + 0 + 1 + 2.25 + 6.25 + 16}{10}
σxˉ2=5110=5.1\sigma_{\bar{x}}^2 = \frac{51}{10} = 5.1

Alternativamente, podemos usar la fórmula para la varianza de la media muestral en muestreo aleatorio simple sin reemplazo:

σxˉ2=σ2n(NnN1)\sigma_{\bar{x}}^2 = \frac{\sigma^2}{n} \left(\frac{N-n}{N-1}\right)

Sustituyendo los valores: σ2=13.6\sigma^2 = 13.6, N=5N=5, n=2n=2:

σxˉ2=13.62(5251)=6.8(34)=6.8×0.75=5.1\sigma_{\bar{x}}^2 = \frac{13.6}{2} \left(\frac{5-2}{5-1}\right) = 6.8 \left(\frac{3}{4}\right) = 6.8 \times 0.75 = 5.1

Ambos métodos dan el mismo resultado para la varianza de la distribución de las medias muestrales: 5.15.1.