TEMA 8. TEORÍA DE MUESTRAS: TIPOS DE MUESTREO, TEORÍA DE LA ESTIMACIÓN, TAMAÑO DE LA MUESTRA


TEMA 8.
TEORÍA DE MUESTRAS:
TIPOS DE MUESTREO, TEORÍA DE LA ESTIMACIÓN, TAMAÑO DE LA MUESTRA





1.     ESTIMACIÓN E INFERENCIA ESTADÍSTICA
En la mayoría de las investigaciones no se trabaja con toda la población de estudio, ya que suele ser un número elevado de sujetos, sino que tomamos una muestra de esta población. Por lo tanto, hay que asumir cierto error.
Si la muestra se elige por un procedimiento de azar, el muestreo es probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio. Sin embargo, en los muestreos no probabilísticos (no se eligen al azar), no es posible evaluar el error.

-          PROCESO DE INFERENCIA ESTADÍSTICA:
Quiero medir un parámetro en la población pero no puedo medirlo en todos los sujetos. Para ello, preselecciono una muestra (preferiblemente de forma aleatoria) y a través de ella obtengo el estimador, que me permite realizar la inferencia (generalización).

Para que los resultados obtenidos puedan inferirse o generalizarse a la población de donde se ha tomado, la muestra debe ser:

   Representativa de la población diana de la que procede: está, en parte, condicionada con la técnica de muestreo utilizada, como se explica más adelante.

   De un tamaño adecuado: Debe ser lo suficientemente grande para garantizar que la muestra representa a la población diana, y lo suficientemente pequeña para facilitar el análisis.

   Comparable: Ambos grupos a comparar deben ser similares al inicio del estudio. De esta manera, se podrá concluir que las diferencias encontradas son solo consecuencia de la exposición.


2.     PROCEDIMIENTO MUESTRAL
El muestreo se define como el proceso de selección de la muestra.
Es un método que nos permite tener un grado de probabilidad de que el grupo pequeño que hemos seleccionado posee las características de la población que estamos estudiando.

Las unidades de muestreo: son las unidades sobre las que se aplican los métodos de selección de la muestra.
 Las unidades de análisis: son aquellas sobre las que se realiza el estudio.

Por ejemplo, si queremos medir la prevalencia de enfermedades de transmisión sexual en adolescentes:
    · La unidad de muestreo podrían ser los institutos. Por tanto, sería en estos centros en los que recogeríamos los datos.

  · La unidad de análisis serían los adolescentes. Por lo tanto, estos serían los sujetos que proporcionan los datos para el estudio.



3.     TIPOS DE MUESTREO
Los tipos de muestreo son las técnicas utilizadas por los investigadores para seleccionar la muestra. En una primera clasificación distinguimos dos tipos de muestreo:

   No probabilísticos: Las unidades que componen la población tienen diferente probabilidad de ser elegidas ya que no solo interviene el azar sino también otras condiciones. No se puede calcular la probabilidad de antemano y no todos los elementos tienen alguna posibilidad de ser incluidos.


   Probabilístico:  Todas las unidades que componen la población tienen una probabilidad de ser elegidas y se puede calcular de antemano. Interviene el azar. 


3.1.  MUESTREO NO PROBABILÍSTICO

A.     Muestreo consecutivo
Es el muestreo no probabilístico más utilizado. Si se realiza de manera adecuada, la representatividad de la muestra que se obtiene puede ser semejante a la obtenida con un muestreo probabilístico.
Consiste en reclutar a todos los individuos de la población que cumplan con los criterios de selección durante el periodo de reclutamiento fijado para el estudio.
Ejemplo: Queremos conocer el peso de los recién nacidos. Para ello, podríamos realizar un muestreo consecutivo tomando como sujeto a los recién nacidos que acudan al centro de salud durante 6 meses (periodo de reclutamiento).


B.     Muestreo de conveniencia o accidental
El investigador selecciona a aquellos sujetos más fácilmente accesibles o que se presenten voluntariamente.
Es una de las técnicas menos sólidas que, además, genera sesgos importantes. Sin embargo, se utiliza con frecuencia ya que es el menos costoso y más fácil.
Ejemplo 1: el investigador realiza un estudio sobre el abuso de alcohol en estudiantes de Enfermería, tomando a los alumnos de cuarto año de la universidad de Sevilla como muestra representativa de todos los estudiantes de Enfermería.


C.     Muestreo intencional o a criterio
El investigador selecciona a aquellos sujetos que considere más apropiados para formar la muestra.
Este muestreo se utiliza cuando se quiere contar con una muestra de expertos o en estudios cualitativos.
Este tipo de diseño de muestreo no ofrece ningún método externo y objetivo para valorar la idoneidad de los sujetos seleccionados.
Ejemplo 1: Queremos conocer cuáles son los medios de comunicación social que utilizan las empresas consultoras globales de TI con sede en los Estados Unidos. En lugar de aplicar el muestreo aleatorio y elegir sujetos que pueden no estar disponibles, utilizamos el muestreo intencional para elegir empresas de TI cuya disponibilidad y actitud sean compatibles con el estudio.


D.    Muestreo de bola de nieve, de avalancha o muestreo en cadena
El investigador elige a un participante que cumpla los criterios  de inclusión. Posteriormente, le pide a este que identifique a otros sujetos que también cumpla los criterios. De esta manera, los sujetos van a ir localizando a otros individuos y estos a otros, y así  sucesivamente hasta que se alcanza la muestra suficiente.
Es muy utilizada en estudios cualitativos.
Ejemplo 1: Queremos conocer la sintomatología de una enfermedad rara, como por ejemplo, el Síndrome de Guilles de la Tourette. Para ello, contactamos con una persona que padezca esta enfermedad, quien posteriormente nos dirige a otra persona que también la padece y así sucesivamente hasta que obtenemos el tamaño de la muestra deseado.


E.      Muestreo teórico
Los participantes se seleccionan de forma gradual, bien porque el propósito del estudio es la generación de teoría o porque la integración de la muestra se va decidiendo sobre la marcha con el fin de que los datos recogidos permitan capturar la máxima variación posible de significados.
Por tanto, en este tipo de muestreo los participantes deben cubrir todas la características, perfiles o patrones.
Ejemplo 1: Se quiere conocer el impacto del Brexit en el bienestar emocional de los consumidores de Birmingham. Para ello, se utilizan entrevistas semiestructuradas y un muestreo teórico que implicará los siguientes 4 pasos:
   Paso 1: Tomar decisiones iniciales con respecto a individuos o grupos específicos de personas que tienen conocimiento sobre el área de investigación: Es necesario realizar entrevistas semiestructuradas, con al menos 15 consumidores de Birmingham, para evaluar el impacto emocional que ha tenido el Brexit en ellos.

   Paso 2: Analizar los datos iniciales hasta que las ideas teóricas empiecen a emerger y surjan conceptos particulares: El análisis de los resultados de las entrevistas puede revelar que los entrevistados disfrutan de un sentido de independencia como resultado de Brexit, sin embargo, están preocupados por su futuro al mismo tiempo.

   Paso 3: Elegir otros participantes, eventos o situaciones sobre la base de ideas y conceptos teóricos revelados en la etapa anterior: En este caso, mediante entrevistas semiestructuradas se seleccionan a más participantes para identificar la naturaleza exacta de las preocupaciones relacionadas con Brexit.

   Paso 4: Se continua con los pasos 2 y 3 hasta alcanzar la saturación teórica: Esta indica que la teorización de los hechos investigados ha llegado a un final suficientemente amplio”.


3.2. MUESTREO PROBABILÍSTICO

Todos y cada uno de los elementos de la población tienen una probabilidad calculable y, por lo tanto, conocida, de ser elegidos para la muestra
Consiste en seleccionar una parte de una población de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionada.


A.     Muestreo aleatorio simple
Consiste en seleccionar al azar (mediante una tabla de números aleatorios o el uso de un programa informático) un número n (el tamaño muestral) de elementos de una población.
Es el método más sencillo y representativo, sin embargo, es el menos utilizado debido a que:

   Es necesario contar con un listado enumerado de todas las unidades de población.
   Los sujetos pueden estar muy dispersos por lo que contactar con todos ellos puede resultar costoso en tiempo y dinero.
   Algunos subgrupos de población, especialmente los minoritarios, pueden no estar representados si la nuestra es pequeña.
Ejemplo 1: Queremos conocer el nivel de satisfacción que tienen los pacientes ingresados en un hospital determinado. Para ello, necesitamos un listado de todos los pacientes que permanecen en ese hospital y los enumeramos consecutivamente (N=250).
Posteriormente, el programa informático nos proporciona los sujetos que necesitemos en función del tamaño de nuestra muestra. En concreto, nos selecciona 75 números aleatorios entre el 1 y el 250 y seleccionaremos a los pacientes que ocupen los números seleccionados


B.     Muestreo aleatorio sistemático
Consiste en seleccionar individuos según una regla o proceso periódico.
La ventaja de este tipo de muestreo es que no necesitamos tener antes la lista de toda la población, sino que se pueden seleccionar los individuos según se vaya formando el listado.
Para realizar este tipo de muestreo, debemos realizar los siguientes pasos:
1.       Calculamos la constante de muestreo (K = N / n = población candidata / muestra).

2.       Elegimos un número al azar entre 1 y K, y esa será la primera unidad (r) de la muestra.

3.       Sumamos la constante K al número r hasta conseguir el tamaño muestral, siendo el primer individuo quien ocupe la posición r, el segundo (r+K), el tercero (r+2K), el cuarto (r+3K)... y así sucesivamente.

Ejemplo 1: Queremos conocer la tensión de los ancianos que acuden a urgencias de un determinado hospital. Para ello, tomamos N=800, que es el número de ancianos que acudieron a urgencias el año pasado. Nuestra muestra va a ser n=100, de manera que:
1.       K = N / n = 800 / 100 = 8
2.       Elegimos un nº entre 1-8 à r = 3
3.       Calculamos los individuos:
   Primer individuo: 3er anciano que acuda a urgencias
   Segundo individuo: r + K = 3 + 8 = 11º anciano que acuda a urgencias
   Tercer individuo: r + 2K = 3 + (2x8) = 19º anciano que acuda a urgencias
   Cuarto individuo: r + 3K = 3 + (3x8) = 27º anciano que acuda a urgencias
  
   Individuo nº 100: r + 3K = 3 + (99x8) = 795º anciano que acuda a urgencias


C.     Muestreo estratificado
Se utiliza cuando la característica objeto de estudio no se distribuye de forma homogénea en toda la población y puede afectar a los resultados del estudio. Sin embargo, existen grupos o estratos donde se sí se presenta de manera homogénea. Por lo tanto, estos grupos tienen alguna característica en común pero son mutuamente excluyentes.

Ventaja: Nos permite conocer cómo se comporta una variable en cada subgrupo de la población con precisión.
Desventaja: necesita más información y un listado de cada individuo de la población.

Ejemplo 1: Queremos conocer la tasa de obesidad en una población de 500 individuos (N=500), tomando una muestra de 150 (n=150). Para ello, dividimos la población en tres estratos, según la edad. El primero comprende de los 0-15 años y tenemos a 100 individuos. El segundo va desde los 16-65 años y obtenemos 325 individuos. Finalmente, en el tercer estrato tenemos a los mayores de 65 y nos encontramos con 75 sujetos obesos.
A continuación, necesitamos el listado de los 100 individuos entre los 0-15 años que padecen de obesidad, los 325 individuos que están entre 16-65 y los 75 individuos mayores de 65 años. A raíz de este listado, utilizamos una tabla de números aleatorios y tomamos la muestra, al igual que hacemos en el muestreo aleatorio simple.


D.    Muestreo por conglomerados
Aprovecha la existencia de grupos o conglomerados que representan toda la variabilidad de la población. De esta manera, podemos conocer la información del total de la población seleccionando únicamente algunos de estos conglomerados
Las unidades de muestreo son grupos de unidades a estudiar (grupos de individuos), aunque es habitual obtener una menor precisión al usar esta técnica, causada por falta de heterogeneidad dentro de los conglomerados.
Ventaja: seleccionar un conglomerado a estudiar suele ser más fácil y económico que hacer una muestra aleatoria o sistemática.
Desventaja: corremos el riesgo de que los conglomerados no sean realmente homogéneos entre ellos.

-          El proceso de muestreo

1.  Hay que definir los conglomerados, es decir, una característica que permita dividir la población en grupos disjuntos (sin solapamiento) y de forma exhaustiva (todos los individuos deben estar en un grupo).
2.   Una vez hemos definido estos conglomerados, seleccionaremos al azar algunos de ellos para estudiarlos.
3.     Por último, podemos investigar a todos los sujetos que forman parte de los conglomerados seleccionados (muestreo unietápico), o bien aplicar un nuevo proceso de muestreo dentro del conglomerado, obteniendo una muestra más pequeña mediante muestreo aleatorio simple o sistemático (muestreo bietápico = 2 etapas).

Ejemplo 1: quiero conocer el nivel cultural de los alumnos de un colegio. Para ello, selecciono un colegio al azar (muestreo aleatorio simple) y después un curso (muestreo por conglomerados).


4.     TAMAÑO DE LA MUESTRA
Calcular el tamaño de la muestra permite determinar un número aproximado de sujetos que es necesario incluir en la muestra para que esta pueda ser representativa. Si no realizásemos este cálculo, podría darse dos situaciones diferentes:

   Que realicemos el estudio sin el número suficiente de pacientes. Esta situación conlleva que no podremos ser precisos al estimar los parámetros y además, que no encontremos diferencias significativas cuando en la realidad sí existen (error tipo II).
   Que estudiemos a un número innecesario de pacientes. Esta situación conlleva una pérdida de tiempo y un aumento de recursos innecesarios. Además, si el muestreo no ha sido probabilístico, un tamaño muestral grande no tiene por qué garantizar que la muestra sea representativa, puesto que, como hemos visto, puede haber parte de la población que no esté representada en la muestra. 

-          El tamaño de la muestra a tomar va a depender de:

   La variabilidad del parámetro que se quiere medir: es decir, cuan frecuente sea lo que deseamos medir. Si el fenómeno es muy frecuente, necesitaremos muestras más pequeñas que si se da con menor frecuencia.

   La precisión con la que queramos dar los datos, es decir, la amplitud del intervalo de confianza. Si ampliamos el intervalo de confianza con el que queremos dar los datos, el rango de valores también se amplía.

   El poder estadístico: es la capacidad que tiene el estudio para encontrar diferencias si es que realmente las hay.

   El efecto esperado: Cuanto mayor sea el efecto esperado menor será el tamaño muestral. 

-          Cálculo del tamaño de una muestra para estimar la media de una población
Fórmula:

   Z es un valor que depende del nivel de confianza que se quiera dar a los intervalos calculados a partir de estimadores de esa muestra (Para confianza de 95% à z=1,96 y para nivel de confianza de 99% à  z=2,58)

   S2: es la varianza poblacional

   E: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar


Si tras esta operación se cumple el resultado: N > n (n - 1) à  el cálculo del tamaño muestral termina aquí (N mayor que n).
Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula: 


- Cálculo del tamaño de una muestra para estimar una proporción: 


   P: es la proporción de una categoría de la variable (por ejemplo, la presencia de la enfermedad, si o no)

  1-p: es la proporción de la otra categoría

   Zα: es el valor de la confianza:

§  Para un nivel de confianza del 95%, α = 0.05, el valor de Zα = 1.96
§  Para un nivel de confianza del 99%, α = 0.01, el valor de Zα = 2.57

   N: es el tamaño de la población.
   E: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.




































Comentarios

Entradas populares de este blog

TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS