TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS

TEMA 9:

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS


1.     INFERENCIA ESTADÍSTICA.

 

La inferencia estadística es el conjunto de procedimientos estadísticos que permiten pasar de lo particular (la muestra) a lo general (la población). De esta manera, los datos se generalizan a un colectivo mayor, asumiendo la probabilidad de cometer un error.

 

En aquellos casos en los que la muestra se selecciona mediante un muestreo no probabilístico, no se deben realizar cálculos de estadística inferencial, ya que no podemos asegurar que la muestra represente a la población. Por tanto, solo se utilizará una estadística descriptiva (no generaliza los datos).






 

-          CONCEPTOS FUNDAMENTALES EN LA INFERENCIA ESTADÍSTICA

 

   Población: Es el conjunto de personas, sujetos o unidades que presentan una característica común. Puede ser finita o infinita.

   Muestra: Subconjunto extraído y seleccionado de una población a la que representa.

   Muestra independiente: Está formada por datos independientes, o sea, aquellos obtenidos tras una única observación. Ejemplo: Estudio para conocer el patrón de conductas sexuales de riesgo en una población adolescente.

   Muestra apareada o dependiente: Está constituida por datos apareados. Comparan grupos muy relacionados entre sí o el mismo grupo de sujetos en dos tiempos diferentes (por ejemplo antes y después de una intervención), o bien son grupos muy relacionados entre sí.  Ejemplo: Estudio para conocer el cambio en el patrón de conductas sexuales de riesgo en una población adolescente antes y después de una intervención de educación sexual.


2.     TIPOS DE INFERENCIA ESTADÍSTICA

 

2.1.      ESTIMACIÓN:  Se utiliza información de una muestra (estimador) para extraer conclusiones sobre toda la población (parámetro).

 

   Estadístico / Estimador: Es un índice que representa una información de la muestra estudiada. Suelen expresarse mediante letras del alfabeto latino Ejemplo: Media aritmética (Ẋ).

Las propiedades deseables de un estimador son las siguientes:

§  Insesgadez: Un estimador es insesgado la diferencia entre el parámetro a estimar y la esperanza de nuestro estimador tendría que ser 0.

§  Eficiente: Un estimador es más eficiente cuando su varianza es reducida (la menor varianza posible).

§  Consistencia: Un estimador consistente es aquel que se aproxima cada vez más al valor real del parámetro cuando la muestra crece.

 

   Parámetro: Cada uno de los estadísticos que tras inferirse, nos proporcionan información sobre la población. Se representan mediante letras del alfabeto griego. Ejemplo: media aritmética de la población (µ).

 

La estimación de un parámetro poblacional a su vez puede ser:

A.      Puntual: Se utiliza un valor concreto de la muestra para estimar el valor deseado. Ejemplo: Queremos conocer el nivel de leucocitos en sangre de los ciudadanos de Sevilla. Para ello seleccionamos una muestra de 200 pacientes. Estimar la media de leucocitos de forma puntual sería sumar los 200 resultados y dividirlos entre el total de la muestra (n=200). La media calculada = 8.000 u/mm3

 

 

B.      Por intervalos: Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar.

Para calcularlo:

1.       Sumamos el margen de error a la media obtenida, teniendo así un valor del intervalo de confianza.

 

2.       Restamos a la media el margen de error, teniendo así el otro valor del intervalo de confianza.

Ejemplo: a partir de los datos de la muestra anterior, hemos calculado que hay un 95% de probabilidad de que el nivel medio de leucocitos en sangre de toda la población sevillana esté entre 6.000 – 10.000 u/mm3 de sangre (6.000 y 10.000 son los límites de intervalo de confianza).

 

2.2.      CONTRASTE DE HIPÓTESIS: a partir de valores de la  muestra, se concluye si hay diferencias entre ellos en la población. Ejemplo: Relacionar si déficit de vitamina D está relacionada con la obesidad.

 

El contraste de hipótesis, a su vez, puede utilizar:

   Métodos paramétricos: se basan en las leyes de distribución normal para analizar los elementos de una muestra. Generalmente, solo se aplican a variables numéricas y para su análisis debe mantener una población grande, ya que permite que el cálculo sea más exacto.

   Por intervalos: Se encargan de analizar datos que no tienen una distribución particular y se basan una hipótesis, pero los datos no están organizados de forma normal.

 

RESUMEN



3.     DIFERENCIAS ENTRE PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS


Vídeo explicativo: https://www.youtube.com/watch?v=IhmxyV8tfwg



 

4.     ERROR ESTÁNDAR

El error estándar de la media (EEM) mide la dispersión hipotética que tendrían las medias de infinitas muestras tomadas de una población determinada, es decir, la diferencia que habría entre las medias obtenidas de una misma población pero con diferentes muestras.

Cuanto más pequeño es el error estándar, más pequeña será la variación de los estadísticos (media, porcentaje, etc.). Como consecuencia, el estudio será más preciso.

Por lo tanto, aumentar el tamaño muestral (n), disminuye el error estándar (EE).

 

5.     CÁLCULO DEL ERROR ESTÁNDAR

Depende de cada estimador:

 

1)      Error estándar para una media

-          Fórmula


-          Ejemplo: selecciono una muestra de 25 enfermeros, cuya media de horas laborales de medio mes es = 100. Utilizando la fórmula de la desviación típica la calculamos y sale = 10. Por lo tanto, el error estándar será de dos horas.


 

2)      Error estándar para una proporción: Se aplica cuando las variables del estudio son cualitativas o atributos, de manera que no podemos cuantificarlos para obtener su media aritmética.

-         Fórmula


La proporción = muestra específica / muestra total. Ejemplo: selecciono una muestra de 500 enfermeros, de los cuales 175 son mujeres. Para conocer la proporción de mujeres:



 

6.     TEOREMA CENTRAL DEL LÍMITE

El teorema central del límite (TCL) es una teoría estadística que establece que las medias de una muestra suficientemente grande (más de 30) seguirán una distribución normal. Además, a medida que aumenta el tamaño de la muestra, la media muestral se acercará a la media de la población.

Por lo tanto, este teorema permite hacer inferencia sobre la media poblacional a través de la media muestral


-         Principales propiedades del teorema central del límite:

 

   La media poblacional y la media muestral serán iguales, es decir, la media de la distribución de todas las medias muestrales será igual a la media del total de la población.

   La varianza de la distribución de las medias muestrales = σ ²/n (varianza de la población dividido entre el tamaño de la muestra).


Si las medias siguen una distribución normal, seguirán los principios básicos de ésta:




 

7.     INTERVALOS DE CONFIANZA

El cálculo de los límites de confianza se basa en el concepto de error estándar de la media (EEM) y en los principios relacionados con la distribución normal o de Gauss.

Los investigadores en ciencias de la salud utilizan convencionalmente un intervalo de confianza que oscila entre 95% y el 99%, es decir, asumen un nivel de error de entre 5% y el 1% respectivamente (0.05 y 0.01 expresado como probabilidad, en tanto por uno).

 

-          Fórmula



 

-         Ejemplo

Estudio: Conocer si el ejercicio físico reduce los valores medios de glucemia de las mujeres embarazadas de una determinada zona. Se debe construir un intervalo de confianza del 95%

Datos:

   Colesterol medio de la muestra = 180.48 mg/dL

   Error estándar de la media = 4

   Z = 1,96








Comentarios

Entradas populares de este blog

TEMA 3. DE LOS CONCEPTOS A LAS VARIABLES. POBLACIÓN, MUESTRA, PARÁMETROS Y ESTADÍSTICOS. VARIABLES Y ESCALAS DE MEDIDA.