TEMA 4. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA: Medidas de variables cualitativas. Medidas de frecuencia. Proporciones, razones y tasas. Construcción de tablas de frecuencia.


1.     ESTADÍSTICA DESCRIPTIVA
Es la que normalmente vemos en los medios de comunicación.

Sirve para describir y resumir datos de una determinada población o muestra sin pretender sacar conclusiones de tipo general.

Ej: Se quiere realizar un estudio sobre cuántos casos y tipos de meningitis hubo en España en 2016. Para ello, se tiene que consultar los datos y frecuencias del número de personas que contrajeron la meningitis en ese año. Una vez obtenidos los datos, la estadística descriptiva se encarga de estructurar y clasificar la información para representarla mediante un gráfico o tabla.

2.     ESTADÍSTICA INFERENCIAL

Es la que normalmente vemos en los artículos sobre investigación científica.

Utiliza muestras de datos para sacar conclusiones y leyes de comportamiento sobre poblaciones más grandes.
Ej: Se quiere analizar cuántas personas poseen estudios universitarios completos en Sevilla. Para ello, se coge a una muestra del total de la población y se analiza. Posteriormente, utilizando la estadística inferencial se sacan hipótesis y conclusiones a partir de los resultados obtenidos.


3.     VARIABLES
La manera más básica de presentar los datos es mediante:
   Tablas de frecuencia:
Están formadas por columnas y filas. En las columnas se colocan los datos que muestran frecuencias y en las filas se colocan las categorías de las variables.
Representan información repetitiva de forma visible y comprensible.
-          Requisitos:

§  Son autoexplicativas.
§  Son sencillas y fáciles de comprender.
§  Tienen un título breve y claro.
§  Indican fecha, lugar y fuente de información.
§  Incluyen las unidades de medida en cada cabecera.
§  Indican frecuencias absolutas y relativas.

-          Tipos de tablas de frecuencia:


3.1.  TABLA DE FRECUENCIA CUALITATIVA DICOTÓMICA
En estas tablas tenemos que establecer:
1.       Variable cualitativa: no se puede medir, por ejemplo, el sexo, nacionalidad, etc.

2.       Número de datos: es la muestra total escogida, el número de sujetos

3.       Frecuencia absoluta (fi): Es el número de sujetos que pertenecen a cada intervalo de la variable, por ejemplo, el número de sujetos que son hombres y que son mujeres, el número de sujetos que son españoles y que son holandeses.

4.       Frecuencia relativa (hi): Es la frecuencia absoluta :  número de datos. Su suma tiene que dar 1. Representa una proporción de individuos referidos al total que presentan una modalidad o que están incluidos en un intervalo.


Ej: Queremos el número de sujetos, distribuidos por sexo, que han participado en una práctica sobre primeros auxilios, . Los resultados son:
§  Hombres: 110.
§  Mujeres: 493

1.       Variable cualitativa: Sexo.
2.       Número de datos: suma de los datos de la muestra à 110 + 493 = 603 à n=603
3.       Frecuencia absoluta (fi): número de personas que pertenecen a cada sexo
4.      Frecuencia relativa (hi): fi : n.




3.2.  TABLA DE FRECUENCIA CUALITATIVA POLICOTÓMICA
Ej: Queremos estudiar el lugar de procedencia de los turistas que acuden al hospital macarena de Sevilla en Enero 2020. Los resultados son:
§  Argentina: 20.
§  Bolivia: 10
§  Brasil: 5
§  Venezuela: 15

1.       Variable cualitativa: Nacionalidad.

2.       Número de datos: suma de los datos de la muestra à 20+10+5+12 = 50 à n=50

3.       Frecuencia absoluta (fi): número de turistas que pertenecen a cada nacionalidad


4.      Frecuencia relativa (hi): fi : n.




3.3.  TABLA DE FRECUENCIA CUALITATIVA ORDINAL
Ej: Queremos estudiar el grado de satisfacción de los pacientes con la comida del hospital. Los resultados son:
𛲡  Muy insatisfechos: 1.
𛲡 Insatisfechos: 5
𛲡Aceptable: 6
𛲠Satisfechos: 7
𛲡Muy satisfechos: 3

1.       Variable cualitativa: Nacionalidad.

2.       Número de datos: suma de los datos de la muestra à 1+5+6+7+3 = 50 à n=22

3.       Frecuencia absoluta (fi): número de sujetos que seleccionaron cada una de los intervalos de la variable, es decir, cuántos pacientes estaban más o menos satisfechos con la comida del hospital.

4.       Frecuencia relativa (hi): fi : n.


5.       Frecuencia relativa acumulada: Se realiza sumando las frecuencias relativas de una en una, de forma acumulable. 



3.4. TABLA DE FRECUENCIA CUANTITATIVA DISCRETA
En estas tablas se estudian valores cuantitativos, es decir, que se pueden medir con números como, por ejemplo, el número de pacientes con diabetes, el número de pacientes que toman determinado medicamento, etc.
Ej: Queremos estudiar el número de días que han los estudiantes de enfermería han realizado deporte en la última semana.
1.       Variable cualitativa: Cuántos días se ha realizado deporte en la última semana.

2.       Número de datos: suma de los datos de la muestra à 310+203+58+25+5+3+1+2 = 607 à n=607

3.       Frecuencia absoluta (fi): número de sujetos que seleccionaron cada uno de los intervalos de la variable, en este caso, cuántas personas han realizado deporte entre 1-7 días en la última semana.

4.       Frecuencia relativa (hi): fi : n.


5.       Frecuencia relativa acumulada: Se realiza sumando las frecuencias relativas de una en una, de forma acumulable.





3.5  TABLA DE FRECUENCIA CON VARIABLES CONTINUAS:

1.       Se obtienen los datos desagrupados.

2.       Se ordenan los datos, por ejemplo, de menor a mayor.

3.       Calculamos el RECORRIDO: Se resta el dato mayor menos el dato menor.

4.       Si no conocemos el INTERVALO, lo calculamos haciéndole la raíz cuadrada al número de la muestra total, es decir, a n y aproximamos.

5.       Para conocer LA AMPLITUD DEL INTERVALO, dividimos el recorrido entre el intervalo.

6.       Se realiza la frecuencia absoluta y la frecuencia absoluta acumulada.

7.       Se realiza la frecuencia relativa y la frecuencia relativa acumulada.


DATOS ORDENADOS:



Ej: Queremos conocer el peso en Kg de los niños atendidos en la consulta de niños sanos.
1.       Variable cualitativa: Peso en Kg.

2.       Número de datos: suma de los datos de la muestra à 3+8+14+6+4+5= 40 à n=40

3.       Frecuencia absoluta (fi): Peso de cada uno de sujetos, agrupados en intervalos.

4.       Frecuencia relativa (hi): fi : n.

5.       Frecuencia relativa acumulada: Se realiza sumando las frecuencias relativas de una en una, de forma acumulable.

6.       Recorrido: 6,1 – 3,3 = 2,8

7.       Intervalo: raíz cuadrada de 40 = 6,32 à intervalos = 6.

8.       Amplitud de los intervalos: 2,8 : 6 = 0,46 à redondeamos a 0,5



4. INDICADORES
La frecuencia absoluta no es un indicador, ya que le falta un denominador que la relacione con el tamaño de la muestra y/o con el periodo en el que se presentaron los eventos.
Un indicador es la medida de la frecuencia de un determinado suceso en una población (forma de medir la frecuencia con la que ocurre un suceso). Se expresan con un número, que puede ser:

   Una proporción / prevalencia

   Una tasa

   Una razón

   Odds

Los indicadores siempre están formados por un numerador y un denominador, es decir, un cociente entre dos magnitudes.
Existen muchos indicadores elaborados en:
   Instituto Nacional de Estadística (INE)
   Instituto de Estadística de Andalucía (IEA)
   Centro de Investigaciones Sociológicas (CIS)

4.1.  PROPORCIONES / PREVALENCIA
Consiste en comparar, mediante una división, el subconjunto y el conjunto al que pertenece. Sirve para medir variables cualitativas.  
El numerador siempre está incluido en el denominador.
Adopta valores reales entre 0 – 1, expresando la frecuencia relativa del suceso que medimos.
Se suele multiplicar por 100 para representarlo en porcentajes (más fácil de comprender).

Ejemplo: Proporción de personas que presentan una enfermedad





4.2.  TASAS
Es una medida que expresa el riesgo de que ocurra un evento estudiado (enfermedad).
Consiste en comparar, mediante una división, el número de veces que ocurre un determinado suceso y la población en la que puede ocurrir dicho suceso en un tiempo determinado.
Normalmente, el resultado de la división es menor a 1, por lo que suele multiplicarse por 100, 1000 (más fácil de comprender). 
Realmente es una proporción con la diferencia de que el denominador incluye un unidad de tiempo. Por lo tanto, tiene relación espacial y temporal.

4.3.  RAZONES O “RATIOS”
Sirve para medir variables cualitativas.
Consiste en comparar, mediante una división, dos conjuntos. Por lo tanto, el numerador no está incluido en el denominador.

Ejemplo: En una empresa trabajan 1.200 hombres y 345 mujeres.



4.4.  ODDS O VENTAJA
Es la división entre la probabilidad de que ocurra un evento y la probabilidad de que no ocurra. 


Sus valores van desde 0 (eventos que nunca ocurren) hasta infinito (eventos que ocurren siempre).

5.     RELACIÓN ENTRE PROPORCIÓN, RAZONES Y ODDS (PAG 46)
Las medidas de asociación sirven para relacionar proporciones, tasas y Odds. En función del tipo de estudio, se utilizarán una u otra.
Las medidas de asociación más importantes son:

5.1.  Razón de prevalencias:

Realiza una razón entre dos prevalencias (proporciones). Se utiliza en estudios descriptivos de corte transversal.
Fórmula:


Ejemplo: Razón entre la proporción de enfermos pertenecientes al grupos de los expuestos y la proporción de enfermos pertenecientes al grupo de los no expuestos.
Por lo tanto, estima una asociación entre el factor de exposición y la enfermedad.
Si el valor se aproxima a 1, la enfermedad se distribuye por igual entre los expuestos y los no expuestos.




5.2.  Razón de riesgos:

Realiza una razón entre dos incidencias acumuladas (proporciones) o dos densidades de incidencias (tasas). Se utiliza en estudios experimentales o en estudios de observación de seguimiento.
Fórmula:





Ejemplo: Razón entre el riesgo en los expuestos y el riesgo en los no expuestos.
Por lo tanto, cuantifica el incremento en el riesgo debido a la exposición.

Si el valor se aproxima a 1, la enfermedad se distribuye de forma similar entre los expuestos y los no expuestos.




5.3.  Odds ratio:
Realiza una razón entre dos medidas Odds o ventajas. Se utiliza en estudios de casos y controles.
Los valores oscilan entre 0 - 1.
Fórmula:



6.     MEDIDAS MÁS EMPLEADAS EN ESTADÍSTICA SANITARIA

6.1.  PREVALENCIA:
Describe qué proporción de la población tienen la enfermedad en un momento específico de tiempo. Depende de la incidencia de la enfermedad (aparición) y de su duración.
Fórmula:


Ej: ¿Cuál es la prevalencia de fumadores en hombres y mujeres



6.2.           INCIDENCIA:
Describe la frecuencia con la que aparecen nuevos casos durante un periodo de tiempo (paso de sano à enfermo).
Ej: Año en el que la persona desarrolló diabetes. La observación se hace desde 2004-2015, cogiendo una muestra de 10 pacientes.
¿Cuál es la incidencia de los casos en el 2009?
La persona 1 y 8 no se cuentan como en riesgo, debido a que ya padecen la enfermedad. Por lo tanto, nuestro total será = 8.


«  Incidencia acumulada o proporción de incidencia.
Es la población de sujetos que desarrollan una enfermedad en un período de tiempo, respecto del total de la población que tenía riesgo al principio del período. Por lo tanto, mide el riesgo promedio (probabilidad) de padecer la enfermedad.
Se calcula utilizando un periodo de tiempo en el que consideramos que todos los individuos de una población tienen riesgo de padecer la enfermedad.
No tiene unidades, se expresa en %.
Fórmula:

Ej: ¿Cuál es la incidencia acumulada de personas que tienen diabetes de 2009-2010 ?    
En el denominador incluimos al sujeto 3, 5,7 y 9 que no padecieron diabetes antes del 2010. Excluimos a los sujetos en rojo puesto que ya padecen la diabetes antes del 2010.
En el numerador incluimos solo al sujeto 3, quien es el único que padece diabetes en el 2010.




«  Tasa de incidencia o densidad de incidencia.
Es la velocidad con la que aparecen nuevos casos en relación al tamaño de la población. Se utiliza para conocer el tiempo que estuvo cada persona con una enfermedad
Normalmente, no se siguen al mismo tiempo a todos los individuos en riesgo (denominador). Por lo tanto, existen diferentes tiempos de observación (“tiempos en riesgo”).
Es necesario especificar la unidad de tiempo a la que se refiere la tasa como, por ejemplo, personas-año, personas-mes, personas-semanas, etc.
Se mide en unidades de tiempo ^ -1.
No son proporciones, es una tasa instantánea.
Fórmula:



Ej: Año en el que la persona desarrolló diabetes. La observación se hace desde 2004-2015, cogiendo una muestra de 10 pacientes.



¿Cuál es la tasa incidencia de los casos en el 2009?
En el denominador se tienen que sumar los años que cada sujeto lleva participando sin desarrollar diabetes, hasta el 2009.

§  Sujeto 1: 1 año
§  Sujeto 2: 5 años.
§  Sujeto 3: 5 años
§  Sujeto 4: 5 años
§  Sujeto 5: 5 años.
§  Sujeto 6: 5 años
§  Sujeto 7: 5 años
§  Sujeto 8: 2 años.
§  Sujeto 9: 5 años.
§ Sujeto 10: 5 años




-          ¿Cómo se relacionan la prevalencia y la incidencia?

Prevalencia: Casos que hay en la población.
Puede verse modificada por:
1.       Casos de mortalidad o curaciónà disminuye la prevalencia puesto que dejan de formar parte de esa población enferma.

2.       Recurrencia à aumentan la prevalencia puesto que vuelven a enfermar tras ser curados.
Incidencia: casos que se van añadiendo.














Comentarios

Entradas populares de este blog

PRESENTACIÓN

TEMA 3. DE LOS CONCEPTOS A LAS VARIABLES. POBLACIÓN, MUESTRA, PARÁMETROS Y ESTADÍSTICOS. VARIABLES Y ESCALAS DE MEDIDA.

TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS