AndalucíaAndalucía
MadridMadrid
CataluñaCataluña
GaliciaGalicia
MurciaMurcia
ValenciaValencia
En construcciónAñadimos comunidades, materias, años y soluciones de forma progresiva y constante.
Muestreo estratificado y distribuciones muestrales
Problema
2022 · Extraordinaria · Reserva
7
Examen
a) Se divide una población en cuatro estratos de tamaño 60000, 20000, 24000 y 16000 personas. En dicha población se realiza un muestreo estratificado por afijación proporcional, seleccionándose 144 personas del tercer estrato. Determine el tamaño total de la muestra y su composición.b) Dada la población {1,4,7}\{1, 4, 7\}, establezca todas las muestras posibles de tamaño 2 que se puedan formar mediante muestreo aleatorio simple y determinar la media y la desviación típica de las medias muestrales obtenidas con todas estas muestras.
Muestreo estratificadoAfijación proporcionalMedia muestral
a) Determinación del tamaño total de la muestra y su composición.

Primero, calculamos el tamaño total de la población NN sumando los tamaños de todos los estratos:

N=N1+N2+N3+N4=60000+20000+24000+16000=120000N = N_1 + N_2 + N_3 + N_4 = 60000 + 20000 + 24000 + 16000 = 120000

En un muestreo estratificado por afijación proporcional, la proporción de la muestra en cada estrato es igual a la proporción de la población en ese estrato. Es decir, niNi=nN\frac{n_i}{N_i} = \frac{n}{N}. Sabemos que se seleccionaron n3=144n_3 = 144 personas del tercer estrato, cuyo tamaño es N3=24000N_3 = 24000.

n3N3=nN    14424000=n120000\frac{n_3}{N_3} = \frac{n}{N} \implies \frac{144}{24000} = \frac{n}{120000}

Despejamos el tamaño total de la muestra nn:

n=14424000120000=14412000024000=1445=720n = \frac{144}{24000} \cdot 120000 = 144 \cdot \frac{120000}{24000} = 144 \cdot 5 = 720

El tamaño total de la muestra es n=720n = 720 personas. Ahora, determinamos la composición de la muestra (nin_i) para cada estrato utilizando la misma proporción:

n1=N1Nn=60000120000720=0.5720=360n_1 = \frac{N_1}{N} \cdot n = \frac{60000}{120000} \cdot 720 = 0.5 \cdot 720 = 360
n2=N2Nn=20000120000720=16720=120n_2 = \frac{N_2}{N} \cdot n = \frac{20000}{120000} \cdot 720 = \frac{1}{6} \cdot 720 = 120
n4=N4Nn=16000120000720=215720=96n_4 = \frac{N_4}{N} \cdot n = \frac{16000}{120000} \cdot 720 = \frac{2}{15} \cdot 720 = 96

La composición de la muestra es:Estrato 1: n1=360n_1 = 360 personas.Estrato 2: n2=120n_2 = 120 personas.Estrato 3: n3=144n_3 = 144 personas (dato inicial).Estrato 4: n4=96n_4 = 96 personas.

b) Establecimiento de muestras, media y desviación típica de las medias muestrales.

La población dada es P={1,4,7}P = \{1, 4, 7\}, con un tamaño N=3N=3. Se van a formar muestras de tamaño k=2k=2 mediante muestreo aleatorio simple (sin reemplazo).Las muestras posibles de tamaño 2 son:Muestra 1: {1,4}\{1, 4\} Muestra 2: {1,7}\{1, 7\} Muestra 3: {4,7}\{4, 7\} Calculamos la media de cada muestra:

xˉ1=1+42=2.5\bar{x}_1 = \frac{1+4}{2} = 2.5
xˉ2=1+72=4\bar{x}_2 = \frac{1+7}{2} = 4
xˉ3=4+72=5.5\bar{x}_3 = \frac{4+7}{2} = 5.5

Para determinar la media de las medias muestrales (μxˉ\mu_{\bar{x}}), calculamos el promedio de xˉ1,xˉ2,xˉ3\bar{x}_1, \bar{x}_2, \bar{x}_3:

μxˉ=2.5+4+5.53=123=4\mu_{\bar{x}} = \frac{2.5 + 4 + 5.5}{3} = \frac{12}{3} = 4

Para la desviación típica de las medias muestrales (error estándar, σxˉ\sigma_{\bar{x}}), primero calculamos la media (μ\mu) y la desviación típica (σ\sigma) de la población original.

μ=1+4+73=123=4\mu = \frac{1+4+7}{3} = \frac{12}{3} = 4
σ2=(14)2+(44)2+(74)23=(3)2+02+323=9+0+93=183=6\sigma^2 = \frac{(1-4)^2 + (4-4)^2 + (7-4)^2}{3} = \frac{(-3)^2 + 0^2 + 3^2}{3} = \frac{9+0+9}{3} = \frac{18}{3} = 6
σ=6\sigma = \sqrt{6}

La fórmula para la desviación típica de las medias muestrales en un muestreo sin reemplazo es:

σxˉ=σkNkN1\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{k}} \sqrt{\frac{N-k}{N-1}}

Sustituimos los valores N=3N=3, k=2k=2 y σ=6\sigma = \sqrt{6}:

σxˉ=623231=6212=312=32=1.5\sigma_{\bar{x}} = \frac{\sqrt{6}}{\sqrt{2}} \sqrt{\frac{3-2}{3-1}} = \sqrt{\frac{6}{2}} \sqrt{\frac{1}{2}} = \sqrt{3} \sqrt{\frac{1}{2}} = \sqrt{\frac{3}{2}} = \sqrt{1.5}

Alternativamente, podemos calcular la desviación típica de las medias muestrales directamente a partir de las medias obtenidas:

σxˉ2=(xˉ1μxˉ)2+(xˉ2μxˉ)2+(xˉ3μxˉ)23\sigma_{\bar{x}}^2 = \frac{(\bar{x}_1 - \mu_{\bar{x}})^2 + (\bar{x}_2 - \mu_{\bar{x}})^2 + (\bar{x}_3 - \mu_{\bar{x}})^2}{3}
σxˉ2=(2.54)2+(44)2+(5.54)23=(1.5)2+02+(1.5)23=2.25+0+2.253=4.53=1.5\sigma_{\bar{x}}^2 = \frac{(2.5-4)^2 + (4-4)^2 + (5.5-4)^2}{3} = \frac{(-1.5)^2 + 0^2 + (1.5)^2}{3} = \frac{2.25 + 0 + 2.25}{3} = \frac{4.5}{3} = 1.5
σxˉ=1.5\sigma_{\bar{x}} = \sqrt{1.5}

La media de las medias muestrales es μxˉ=4\mu_{\bar{x}} = 4 y la desviación típica de las medias muestrales es σxˉ=1.5\sigma_{\bar{x}} = \sqrt{1.5}.