T6: Teoría de muestras · Muestreo estratificado y distribución de medias muestrales — MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES II PEvAU Andaluc%C3%ADa 2024

Muestreo estratificado y distribución de medias muestrales

Problema

2024 · Ordinaria · Titular

BLOQUE D

a) Se realizan dos muestreos aleatorios estratificados con afijación proporcional para una población dividida en cuatro estratos

E_1, E_2, E_3

E_4

. En la primera muestra se han seleccionado

25

individuos de

E_1

30

E_2

. En la segunda muestra se han seleccionado

80

individuos de

E_3

100

E_4

. Sabiendo que el estrato

E_1

tiene

500

individuos y que el

E_3

tiene

400

, determine el tamaño de cada estrato de la población y el tamaño de las muestras en cada estrato.b) Dada la población

\{-3, -1, 2, 5, 7\}

, se consideran todas las muestras posibles de tamaño

2

obtenidas mediante muestreo aleatorio simple. Calcule la media y la varianza de la distribución de las medias muestrales.

Muestreo estratificadoMedia muestralVarianza

a) Para determinar el tamaño de cada estrato de la población (

N_i

) y el tamaño de las muestras en cada estrato (

n_i

), utilizamos la propiedad de la afijación proporcional, que establece que la fracción de muestreo es constante para cada estrato dentro de un muestreo. Es decir,

\frac{n_i}{N_i} = k

, donde

k

es la fracción de muestreo.

El problema describe dos muestreos independientes, cada uno con su propia fracción de muestreo.

Primer muestreo (estratos $E_1$ y $E_2$)

Se nos da que $N_1 = 500$ individuos y se seleccionan $n_1 = 25$ individuos de $E_1$ . La fracción de muestreo para este primer muestreo es:

k_1 = \frac{n_1}{N_1} = \frac{25}{500} = 0.05

También se nos dice que se seleccionan $n_2 = 30$ individuos de $E_2$ . Como la afijación es proporcional, la fracción de muestreo $k_1$ debe ser la misma para $E_2$ :

k_1 = \frac{n_2}{N_2} \implies 0.05 = \frac{30}{N_2}

Despejando $N_2$ :

N_2 = \frac{30}{0.05} = 600

Segundo muestreo (estratos $E_3$ y $E_4$)

Se nos da que $N_3 = 400$ individuos y se seleccionan $n_3 = 80$ individuos de $E_3$ . La fracción de muestreo para este segundo muestreo es:

k_2 = \frac{n_3}{N_3} = \frac{80}{400} = 0.2

También se nos dice que se seleccionan $n_4 = 100$ individuos de $E_4$ . Como la afijación es proporcional, la fracción de muestreo $k_2$ debe ser la misma para $E_4$ :

k_2 = \frac{n_4}{N_4} \implies 0.2 = \frac{100}{N_4}

Despejando $N_4$ :

N_4 = \frac{100}{0.2} = 500

Por lo tanto, los tamaños de cada estrato de la población son: $N_1 = 500$ $N_2 = 600$ $N_3 = 400$ $N_4 = 500$ Y los tamaños de las muestras en cada estrato, según los muestreos realizados, son:Para el primer muestreo: $n_1 = 25$ , $n_2 = 30$ .Para el segundo muestreo: $n_3 = 80$ , $n_4 = 100$ .

b) Dada la población

\{-3, -1, 2, 5, 7\}

con un tamaño

N = 5

, y muestras de tamaño

n = 2

obtenidas mediante muestreo aleatorio simple sin reemplazo.

Primero, calculamos la media ( $\mu$ ) y la varianza poblacional ( $\sigma^2$ ).

\mu = \frac{-3 + (-1) + 2 + 5 + 7}{5} = \frac{10}{5} = 2

\sigma^2 = \frac{\sum (x_i - \mu)^2}{N} = \frac{(-3-2)^2 + (-1-2)^2 + (2-2)^2 + (5-2)^2 + (7-2)^2}{5}

\sigma^2 = \frac{(-5)^2 + (-3)^2 + 0^2 + 3^2 + 5^2}{5} = \frac{25 + 9 + 0 + 9 + 25}{5} = \frac{68}{5} = 13.6

A continuación, listamos todas las muestras posibles de tamaño $n=2$ y calculamos sus medias muestrales. El número total de muestras posibles es $\binom{N}{n} = \binom{5}{2} = \frac{5 \times 4}{2} = 10$ .Las muestras y sus medias muestrales $\bar{x}_i$ son:1. $\{-3, -1\} \implies \bar{x}_1 = (-3-1)/2 = -2$ 2. $\{-3, 2\} \implies \bar{x}_2 = (-3+2)/2 = -0.5$ 3. $\{-3, 5\} \implies \bar{x}_3 = (-3+5)/2 = 1$ 4. $\{-3, 7\} \implies \bar{x}_4 = (-3+7)/2 = 2$ 5. $\{-1, 2\} \implies \bar{x}_5 = (-1+2)/2 = 0.5$ 6. $\{-1, 5\} \implies \bar{x}_6 = (-1+5)/2 = 2$ 7. $\{-1, 7\} \implies \bar{x}_7 = (-1+7)/2 = 3$ 8. $\{2, 5\} \implies \bar{x}_8 = (2+5)/2 = 3.5$ 9. $\{2, 7\} \implies \bar{x}_9 = (2+7)/2 = 4.5$ 10. $\{5, 7\} \implies \bar{x}_{10} = (5+7)/2 = 6$ La distribución de las medias muestrales es: $\{-2, -0.5, 1, 2, 0.5, 2, 3, 3.5, 4.5, 6\}$ .

Media de la distribución de las medias muestrales ($E[\bar{X}]$ o $\mu_{\bar{x}}$)

\mu_{\bar{x}} = \frac{\sum \bar{x}_i}{10} = \frac{-2 + (-0.5) + 1 + 2 + 0.5 + 2 + 3 + 3.5 + 4.5 + 6}{10}

\mu_{\bar{x}} = \frac{20}{10} = 2

La media de la distribución de las medias muestrales es $2$ , que coincide con la media poblacional $\mu$ .

Varianza de la distribución de las medias muestrales ($\sigma_{\bar{x}}^2$)

Calculamos la varianza de las medias muestrales directamente:

\sigma_{\bar{x}}^2 = \frac{\sum (\bar{x}_i - \mu_{\bar{x}})^2}{10}

\sigma_{\bar{x}}^2 = \frac{(-2-2)^2 + (-0.5-2)^2 + (1-2)^2 + (2-2)^2 + (0.5-2)^2 + (2-2)^2 + (3-2)^2 + (3.5-2)^2 + (4.5-2)^2 + (6-2)^2}{10}

\sigma_{\bar{x}}^2 = \frac{(-4)^2 + (-2.5)^2 + (-1)^2 + 0^2 + (-1.5)^2 + 0^2 + 1^2 + (1.5)^2 + (2.5)^2 + 4^2}{10}

\sigma_{\bar{x}}^2 = \frac{16 + 6.25 + 1 + 0 + 2.25 + 0 + 1 + 2.25 + 6.25 + 16}{10}

\sigma_{\bar{x}}^2 = \frac{51}{10} = 5.1

Alternativamente, podemos usar la fórmula para la varianza de la media muestral en muestreo aleatorio simple sin reemplazo:

\sigma_{\bar{x}}^2 = \frac{\sigma^2}{n} \left(\frac{N-n}{N-1}\right)

Sustituyendo los valores: $\sigma^2 = 13.6$ , $N=5$ , $n=2$ :

\sigma_{\bar{x}}^2 = \frac{13.6}{2} \left(\frac{5-2}{5-1}\right) = 6.8 \left(\frac{3}{4}\right) = 6.8 \times 0.75 = 5.1

Ambos métodos dan el mismo resultado para la varianza de la distribución de las medias muestrales: $5.1$ .