TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS
TEMA 9:
INTRODUCCIÓN A LA
INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS
1.
INFERENCIA ESTADÍSTICA.
La inferencia
estadística es el conjunto de procedimientos estadísticos que permiten pasar de
lo particular (la muestra) a lo general (la población). De esta manera, los
datos se generalizan a un colectivo mayor, asumiendo la probabilidad de cometer
un error.
En aquellos
casos en los que la muestra se selecciona mediante un muestreo no
probabilístico, no se deben realizar cálculos de estadística inferencial, ya
que no podemos asegurar que la muestra represente a la población. Por tanto,
solo se utilizará una estadística descriptiva (no generaliza los datos).
-
CONCEPTOS
FUNDAMENTALES EN LA INFERENCIA ESTADÍSTICA
◦
Población: Es el conjunto de personas, sujetos o unidades que
presentan una característica común. Puede ser finita o infinita.
◦
Muestra: Subconjunto extraído y seleccionado de una población
a la que representa.
◦
Muestra independiente: Está formada por datos independientes,
o sea, aquellos obtenidos tras una única observación. Ejemplo: Estudio para
conocer el patrón de conductas sexuales de riesgo en una población adolescente.
◦
Muestra apareada o dependiente: Está constituida por datos
apareados. Comparan grupos muy relacionados entre sí o el mismo grupo de
sujetos en dos tiempos diferentes (por ejemplo antes y después de una
intervención), o bien son grupos muy relacionados entre sí. Ejemplo: Estudio para conocer el cambio en
el patrón de conductas sexuales de riesgo en una población adolescente antes y
después de una intervención de educación sexual.
2.
TIPOS DE INFERENCIA ESTADÍSTICA
2.1.
ESTIMACIÓN: Se utiliza información de una muestra (estimador) para extraer
conclusiones sobre toda la población (parámetro).
◦ Estadístico / Estimador: Es un índice que representa una información de la muestra estudiada. Suelen expresarse mediante letras del alfabeto latino Ejemplo: Media aritmética (Ẋ).
Las propiedades deseables de un estimador son las siguientes:
§ Insesgadez: Un estimador es insesgado la diferencia entre el parámetro a estimar y la esperanza de nuestro estimador tendría que ser 0.
§ Eficiente: Un estimador es más eficiente cuando su varianza es reducida (la menor varianza posible).
§
Consistencia: Un estimador consistente es
aquel que se aproxima cada vez más al valor real del parámetro cuando la
muestra crece.
◦
Parámetro: Cada uno de
los estadísticos que tras inferirse, nos proporcionan información sobre la
población. Se representan mediante letras del alfabeto griego. Ejemplo: media
aritmética de la población (µ).
La estimación de un parámetro poblacional a su vez puede ser:
A. Puntual: Se utiliza un valor concreto de la muestra para estimar el
valor deseado. Ejemplo: Queremos conocer el nivel de leucocitos en sangre de
los ciudadanos de Sevilla. Para ello seleccionamos una muestra de 200
pacientes. Estimar la media de leucocitos de forma puntual sería sumar los 200
resultados y dividirlos entre el total de la muestra (n=200). La media
calculada = 8.000 u/mm3
B. Por intervalos: Consiste en calcular dos valores entre los cuales se encuentra el
parámetro poblacional que queremos estimar.
Para calcularlo:
1. Sumamos el
margen de error a la media obtenida, teniendo así un valor del intervalo de
confianza.
2. Restamos a la media el margen de error, teniendo así el otro valor del intervalo de confianza.
Ejemplo: a partir de los datos de la muestra anterior, hemos calculado que
hay un 95% de probabilidad de que el nivel medio de leucocitos en sangre de toda
la población sevillana esté entre 6.000 – 10.000 u/mm3 de sangre (6.000
y 10.000 son los límites de intervalo de confianza).
2.2.
CONTRASTE DE
HIPÓTESIS:
a partir de valores de la muestra, se
concluye si hay diferencias entre ellos en la población. Ejemplo: Relacionar si
déficit de vitamina D está relacionada con la obesidad.
El contraste de hipótesis, a su vez, puede utilizar:
◦ Métodos paramétricos: se basan en las leyes de distribución normal para analizar los elementos de una muestra. Generalmente, solo se aplican a variables numéricas y para su análisis debe mantener una población grande, ya que permite que el cálculo sea más exacto.
◦ Por intervalos: Se encargan de analizar datos que no tienen una distribución
particular y se basan una hipótesis, pero los datos no están organizados de
forma normal.
RESUMEN
3. DIFERENCIAS ENTRE PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS
Vídeo explicativo: https://www.youtube.com/watch?v=IhmxyV8tfwg
4. ERROR ESTÁNDAR
El error estándar de la media (EEM) mide la dispersión hipotética que tendrían las medias de infinitas muestras tomadas de una población determinada, es decir, la diferencia que habría entre las medias obtenidas de una misma población pero con diferentes muestras.
Cuanto más pequeño es el error estándar, más pequeña será la variación de los estadísticos (media, porcentaje, etc.). Como consecuencia, el estudio será más preciso.
Por
lo tanto, aumentar el tamaño muestral (n), disminuye el error estándar (EE).
5. CÁLCULO DEL ERROR ESTÁNDAR
Depende de cada estimador:
1) Error estándar para una media
-
Fórmula
- Ejemplo: selecciono una muestra de 25 enfermeros, cuya media de horas laborales de medio mes es = 100. Utilizando la fórmula de la desviación típica la calculamos y sale = 10. Por lo tanto, el error estándar será de dos horas.
2) Error estándar para una proporción: Se aplica cuando las variables del estudio son cualitativas o atributos, de manera que no podemos cuantificarlos para obtener su media aritmética.
- Fórmula
La
proporción = muestra específica / muestra total. Ejemplo: selecciono
una muestra de 500 enfermeros, de los cuales 175 son mujeres. Para conocer la
proporción de mujeres:
6. TEOREMA CENTRAL DEL LÍMITE
El teorema central del límite (TCL) es una teoría estadística que establece que las medias de una muestra suficientemente grande (más de 30) seguirán una distribución normal. Además, a medida que aumenta el tamaño de la muestra, la media muestral se acercará a la media de la población.
Por lo tanto, este teorema permite hacer inferencia sobre la media poblacional a través de la media muestral
-
Principales
propiedades del teorema central del límite:
◦ La media poblacional y la media muestral serán iguales, es decir, la media de la distribución de todas las medias muestrales será igual a la media del total de la población.
◦ La varianza de la distribución de las medias muestrales = σ ²/n (varianza de la población dividido entre el tamaño de la muestra).
Si las medias siguen una distribución normal, seguirán los principios básicos de ésta:
7.
INTERVALOS DE CONFIANZA
El cálculo de los límites de confianza se basa en el concepto de
error estándar de la media (EEM) y en los principios relacionados con la distribución
normal o de Gauss.
Los investigadores en ciencias de la salud utilizan
convencionalmente un intervalo de confianza que oscila entre 95% y el 99%, es
decir, asumen un nivel de error de entre 5% y el 1% respectivamente (0.05 y
0.01 expresado como probabilidad, en tanto por uno).
-
Fórmula
-
Ejemplo
Estudio: Conocer si
el ejercicio físico reduce los valores medios de glucemia de las mujeres
embarazadas de una determinada zona. Se debe construir un intervalo de
confianza del 95%
Datos:
◦ Colesterol
medio de la muestra = 180.48 mg/dL
◦
Error estándar de la media = 4
◦ Z = 1,96
Comentarios
Publicar un comentario