TEMA 8. TEORÍA DE MUESTRAS: TIPOS DE MUESTREO, TEORÍA DE LA ESTIMACIÓN, TAMAÑO DE LA MUESTRA
TEMA 8.
TEORÍA DE MUESTRAS:
TIPOS DE MUESTREO, TEORÍA DE LA ESTIMACIÓN, TAMAÑO DE LA
MUESTRA
1. ESTIMACIÓN E INFERENCIA ESTADÍSTICA
En la mayoría de las investigaciones no se trabaja con
toda la población de estudio, ya que suele ser un número elevado de sujetos,
sino que tomamos una muestra de esta población. Por lo tanto, hay que
asumir cierto error.
Si la muestra se elige por un procedimiento de azar,
el muestreo es probabilístico o aleatorio y
el error asociado
a esa muestra elegida al azar
se llama error aleatorio. Sin embargo, en los muestreos no probabilísticos (no se eligen al azar), no es posible evaluar
el error.
-
PROCESO DE INFERENCIA ESTADÍSTICA:
Quiero medir un parámetro en la población pero no puedo medirlo en todos los sujetos.
Para ello, preselecciono una muestra (preferiblemente
de forma aleatoria) y a través de ella obtengo el estimador, que me permite
realizar la inferencia
(generalización).
Para que los resultados obtenidos
puedan inferirse o generalizarse a la población de donde se ha tomado, la
muestra debe ser:
◦
Representativa de la población diana de la
que procede: está, en parte, condicionada con la técnica de muestreo
utilizada, como se explica más adelante.
◦
De un tamaño adecuado: Debe ser lo
suficientemente grande para garantizar que la muestra representa a la
población diana, y lo suficientemente pequeña para facilitar el análisis.
◦
Comparable: Ambos grupos a comparar deben
ser similares al inicio del estudio. De esta manera, se podrá concluir que las
diferencias encontradas son solo consecuencia de la exposición.
2.
PROCEDIMIENTO MUESTRAL
El muestreo se define
como el proceso de selección de la muestra.
Es un método que nos
permite tener un grado de probabilidad de que el grupo pequeño que hemos
seleccionado posee las características de la población que estamos estudiando.
Las unidades de
muestreo: son las unidades sobre
las que se aplican los métodos de selección de la muestra.
Las
unidades de análisis: son aquellas
sobre las que se realiza el estudio.
Por ejemplo, si
queremos medir la prevalencia de enfermedades de transmisión sexual en
adolescentes:
· La unidad de muestreo podrían ser los
institutos. Por tanto, sería en estos centros en los que recogeríamos los
datos.
· La unidad de análisis serían los
adolescentes. Por lo tanto, estos serían los sujetos que proporcionan los datos
para el estudio.
3.
TIPOS DE MUESTREO
Los tipos de muestreo
son las técnicas utilizadas por los investigadores para seleccionar la muestra.
En una primera clasificación distinguimos dos tipos de muestreo:
◦
No
probabilísticos: Las
unidades que componen la población tienen diferente probabilidad de ser
elegidas ya que no solo interviene el azar sino también otras condiciones. No
se puede calcular la probabilidad de antemano y no todos los elementos tienen
alguna posibilidad de ser incluidos.
◦ Probabilístico: Todas
las unidades que componen la población tienen una probabilidad de ser elegidas
y se puede calcular de antemano. Interviene el azar.
3.1.
MUESTREO NO PROBABILÍSTICO
A. Muestreo
consecutivo
Es el muestreo no probabilístico más
utilizado. Si se realiza de manera adecuada, la representatividad de la muestra
que se obtiene puede ser semejante a la obtenida con un muestreo
probabilístico.
Consiste en reclutar a todos los
individuos de la población que cumplan con los criterios de selección durante
el periodo de reclutamiento fijado para el estudio.
Ejemplo: Queremos conocer el peso de los
recién nacidos. Para ello, podríamos realizar un muestreo consecutivo tomando
como sujeto a los recién nacidos que acudan al centro de salud durante 6 meses
(periodo de reclutamiento).
B. Muestreo de
conveniencia o accidental
El investigador selecciona a aquellos
sujetos más fácilmente accesibles o que se presenten voluntariamente.
Es una de las técnicas menos sólidas que,
además, genera sesgos importantes. Sin embargo, se utiliza con frecuencia ya
que es el menos costoso y más fácil.
Ejemplo 1: el
investigador realiza un estudio sobre el abuso de alcohol en estudiantes de
Enfermería, tomando a los alumnos de cuarto año de la universidad de Sevilla
como muestra representativa de todos los estudiantes de Enfermería.
C. Muestreo
intencional o a criterio
El investigador selecciona a aquellos
sujetos que considere más apropiados para formar la muestra.
Este muestreo se utiliza cuando se quiere
contar con una muestra de expertos o en estudios cualitativos.
Este tipo de diseño de muestreo no
ofrece ningún método externo y objetivo para valorar la idoneidad de los
sujetos seleccionados.
Ejemplo 1: Queremos
conocer cuáles son los medios de comunicación social que utilizan las empresas
consultoras globales de TI con sede en los Estados Unidos. En lugar de aplicar
el muestreo aleatorio y elegir sujetos que pueden no estar disponibles, utilizamos
el muestreo intencional para elegir empresas de TI cuya disponibilidad y
actitud sean compatibles con el estudio.
D. Muestreo de
bola de nieve, de avalancha o muestreo en cadena
El investigador elige
a un participante que cumpla los criterios
de inclusión. Posteriormente, le pide a este que identifique a otros
sujetos que también cumpla los criterios. De esta manera, los sujetos van a ir
localizando a otros individuos y estos a otros, y así sucesivamente hasta que se alcanza la muestra
suficiente.
Es muy utilizada en
estudios cualitativos.
Ejemplo 1:
Queremos conocer la sintomatología de una enfermedad rara, como por ejemplo, el
Síndrome de Guilles de la Tourette. Para ello, contactamos con una persona que
padezca esta enfermedad, quien posteriormente nos dirige a otra persona que
también la padece y así sucesivamente hasta que obtenemos el tamaño de la
muestra deseado.
E. Muestreo
teórico
Los participantes se seleccionan
de forma gradual, bien porque el propósito del estudio es la generación de
teoría o porque la integración de la muestra se va decidiendo sobre la marcha
con el fin de que los datos recogidos permitan capturar la máxima variación
posible de significados.
Por tanto, en este tipo
de muestreo los participantes deben cubrir todas la características, perfiles o
patrones.
Ejemplo 1: Se
quiere conocer el impacto del Brexit en
el bienestar emocional de los consumidores de Birmingham. Para ello, se
utilizan entrevistas semiestructuradas y un muestreo teórico que implicará los
siguientes 4 pasos:
◦ Paso
1: Tomar
decisiones iniciales con respecto a individuos o grupos específicos de personas
que tienen conocimiento sobre el área de investigación: Es necesario realizar entrevistas semiestructuradas, con al menos 15 consumidores
de Birmingham, para evaluar el impacto emocional que ha tenido el Brexit en
ellos.
◦ Paso
2: Analizar
los datos iniciales hasta que las ideas teóricas empiecen a emerger y surjan
conceptos particulares: El análisis
de los resultados de las entrevistas puede revelar que los entrevistados
disfrutan de un sentido de independencia como resultado de Brexit, sin embargo,
están preocupados por su futuro al mismo tiempo.
◦ Paso
3: Elegir
otros participantes, eventos o situaciones sobre la base de ideas y conceptos
teóricos revelados en la etapa anterior: En este caso, mediante entrevistas semiestructuradas se seleccionan a
más participantes para identificar la naturaleza exacta de las preocupaciones
relacionadas con Brexit.
◦ Paso
4: Se
continua con los pasos 2 y 3 hasta alcanzar la saturación teórica: Esta indica que la teorización de los
hechos investigados ha llegado a un final suficientemente amplio”.
3.2. MUESTREO PROBABILÍSTICO
Todos y cada uno de los elementos de la
población tienen una probabilidad calculable y, por lo tanto, conocida, de ser elegidos para la muestra
Consiste en seleccionar una parte de una
población de tal forma que todas las muestras posibles de tamaño fijo, tengan
la misma posibilidad de ser seleccionada.
A. Muestreo
aleatorio simple
Consiste en seleccionar al azar (mediante
una tabla de números aleatorios o el uso de un programa informático) un número
n (el tamaño muestral) de elementos de una población.
Es el método más sencillo y
representativo, sin embargo, es el menos utilizado debido a que:
◦
Es necesario contar
con un listado enumerado de todas las unidades de población.
◦
Los sujetos pueden
estar muy dispersos por lo que contactar con todos ellos puede resultar costoso
en tiempo y dinero.
◦
Algunos subgrupos
de población, especialmente los minoritarios, pueden no estar representados si
la nuestra es pequeña.
Ejemplo 1: Queremos conocer el nivel de
satisfacción que tienen los pacientes ingresados en un hospital determinado.
Para ello, necesitamos un listado de todos los pacientes que permanecen en ese
hospital y los enumeramos consecutivamente (N=250).
Posteriormente, el programa informático
nos proporciona los sujetos que necesitemos en función del tamaño de nuestra
muestra. En concreto, nos selecciona 75 números aleatorios entre el 1 y el 250
y seleccionaremos a los pacientes que ocupen los números seleccionados
B. Muestreo aleatorio
sistemático
Consiste en seleccionar individuos
según una regla o proceso periódico.
La ventaja de este tipo de muestreo es
que no necesitamos tener antes la lista de toda la población, sino que se
pueden seleccionar los individuos según se vaya formando el listado.
Para realizar este tipo de muestreo,
debemos realizar los siguientes pasos:
1.
Calculamos la
constante de muestreo (K = N / n = población candidata / muestra).
2.
Elegimos un número
al azar entre 1 y K, y esa será la primera unidad (r) de la muestra.
3.
Sumamos la
constante K al número r hasta conseguir el tamaño muestral, siendo el primer
individuo quien ocupe la posición r, el segundo (r+K), el tercero (r+2K), el
cuarto (r+3K)... y así sucesivamente.
Ejemplo 1: Queremos conocer la tensión de
los ancianos que acuden a urgencias de un determinado hospital. Para ello,
tomamos N=800, que es el número de ancianos que acudieron a urgencias el año
pasado. Nuestra muestra va a ser n=100, de manera que:
1.
K = N / n = 800 /
100 = 8
2.
Elegimos un nº
entre 1-8 à r = 3
3.
Calculamos los
individuos:
◦ Primer individuo: 3er anciano que acuda a urgencias
◦ Segundo individuo: r + K = 3 + 8 = 11º anciano que acuda a urgencias
◦ Tercer individuo: r + 2K = 3 + (2x8) = 19º anciano que acuda a urgencias
◦ Cuarto individuo: r + 3K = 3 + (3x8) = 27º anciano que acuda a urgencias
◦ …
◦ Individuo nº 100: r + 3K = 3 + (99x8) = 795º anciano que acuda a urgencias
C. Muestreo estratificado
Se utiliza cuando la característica
objeto de estudio no se distribuye de forma homogénea en toda la población y
puede afectar a los resultados del estudio. Sin embargo, existen grupos o
estratos donde se sí se presenta de manera homogénea. Por lo tanto, estos
grupos tienen alguna característica en común pero son mutuamente excluyentes.
Ventaja: Nos permite conocer cómo se
comporta una variable en cada subgrupo de la población con precisión.
Desventaja: necesita más información y un
listado de cada individuo de la población.
Ejemplo 1: Queremos conocer la tasa de
obesidad en una población de 500 individuos (N=500), tomando una muestra de 150
(n=150). Para ello, dividimos la población en tres estratos, según la edad. El
primero comprende de los 0-15 años y tenemos a 100 individuos. El segundo va
desde los 16-65 años y obtenemos 325 individuos. Finalmente, en el tercer
estrato tenemos a los mayores de 65 y nos encontramos con 75 sujetos obesos.
A continuación, necesitamos el listado de los 100 individuos entre los 0-15 años que
padecen de obesidad, los 325 individuos que están entre 16-65 y los 75
individuos mayores de 65 años. A raíz de este listado, utilizamos una tabla de números
aleatorios y tomamos la muestra, al igual que hacemos en el muestreo aleatorio
simple.
D. Muestreo
por conglomerados
Aprovecha la existencia de
grupos o conglomerados que representan toda la variabilidad de la población. De
esta manera, podemos conocer la información del total de la población
seleccionando únicamente algunos de estos conglomerados
Las unidades de muestreo son
grupos de unidades a estudiar (grupos de individuos), aunque es habitual
obtener una menor precisión al usar esta técnica, causada por falta de
heterogeneidad dentro de los conglomerados.
Ventaja: seleccionar un
conglomerado a estudiar suele ser más fácil y económico que hacer una muestra
aleatoria o sistemática.
Desventaja: corremos el riesgo de que los conglomerados no
sean realmente homogéneos entre ellos.
-
El proceso de muestreo
1. Hay que definir los
conglomerados, es decir, una característica que permita dividir la población en
grupos disjuntos (sin solapamiento) y de forma exhaustiva (todos
los individuos deben estar en un grupo).
2. Una vez hemos definido estos
conglomerados, seleccionaremos al azar algunos de ellos para estudiarlos.
3. Por último, podemos investigar
a todos los sujetos que forman parte de los conglomerados seleccionados (muestreo unietápico), o bien aplicar un nuevo
proceso de muestreo dentro del conglomerado, obteniendo una muestra más pequeña mediante muestreo aleatorio simple o
sistemático (muestreo
bietápico = 2 etapas).
Ejemplo 1: quiero conocer el nivel cultural de los alumnos
de un colegio. Para ello, selecciono un colegio al azar (muestreo aleatorio
simple) y después un curso (muestreo por conglomerados).
4.
TAMAÑO DE LA MUESTRA
Calcular
el tamaño de la muestra permite determinar un número aproximado de sujetos que
es necesario incluir en la muestra para que esta pueda ser representativa. Si
no realizásemos este cálculo, podría darse dos situaciones diferentes:
◦
Que realicemos el estudio sin el número suficiente de
pacientes. Esta situación conlleva que no podremos ser precisos al estimar los
parámetros y además, que no encontremos diferencias significativas cuando en
la realidad sí existen (error tipo II).
◦
Que estudiemos a un número innecesario de pacientes. Esta
situación conlleva una pérdida de tiempo y un aumento de recursos innecesarios.
Además, si el muestreo no ha sido probabilístico, un tamaño muestral grande
no tiene por qué garantizar que la muestra sea representativa, puesto que, como
hemos visto, puede haber parte de la población que no esté representada en la
muestra.
-
El tamaño de la muestra a tomar va a depender de:
◦
La variabilidad del parámetro que se quiere medir: es decir, cuan frecuente sea
lo que deseamos medir. Si el fenómeno es muy frecuente,
necesitaremos muestras más pequeñas que si se da con menor frecuencia.
◦
La precisión con la que queramos dar los datos, es decir, la amplitud del
intervalo de confianza. Si ampliamos el intervalo de
confianza con el que queremos dar los datos, el rango de valores también se
amplía.
◦
El poder estadístico: es la capacidad que tiene el estudio para encontrar
diferencias si es que realmente las hay.
◦
El efecto esperado: Cuanto mayor sea el efecto esperado menor será el tamaño
muestral.
-
Cálculo del
tamaño de una muestra para estimar la media de una población
Fórmula:
◦
Z es un valor que depende
del nivel de confianza que se quiera dar a los intervalos calculados a partir de estimadores de esa muestra (Para
confianza de 95% à z=1,96 y
para nivel de confianza de 99% à z=2,58)
◦
S2: es la varianza
poblacional
◦
E: es el error máximo aceptado por los
investigadores en las diferencias entre los grupos de comparación de la
variable a estudiar
Si tras esta
operación se cumple el resultado: N > n (n - 1) à el cálculo del tamaño muestral termina aquí (N mayor que n).
Si no se cumple, obtendremos el tamaño de la muestra
con esta fórmula:
- Cálculo del tamaño de una muestra para estimar una proporción:
◦ P: es la proporción de una categoría de la variable (por ejemplo, la
presencia de la enfermedad, si o no)
◦ 1-p: es la proporción de la otra categoría
◦ Zα: es el valor de la confianza:
§ Para un nivel de confianza del 95%, α = 0.05, el valor de
Zα = 1.96
§ Para un nivel de confianza del 99%, α = 0.01, el valor de
Zα = 2.57
◦ N: es el tamaño de la población.
◦
E: es el error máximo aceptado por los
investigadores en las diferencias entre los grupos de comparación de la
variable a estudiar.
Comentarios
Publicar un comentario