TEMA 4. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA: Medidas de variables cualitativas. Medidas de frecuencia. Proporciones, razones y tasas. Construcción de tablas de frecuencia.
1.
ESTADÍSTICA DESCRIPTIVA
Es la que normalmente
vemos en los medios de comunicación.
Sirve para describir y
resumir datos de una determinada población o muestra sin pretender sacar
conclusiones de tipo general.
Ej: Se quiere
realizar un estudio sobre cuántos casos y tipos de meningitis hubo en España en
2016. Para ello, se tiene que consultar los datos y frecuencias del número de
personas que contrajeron la meningitis en ese año. Una vez obtenidos los datos,
la estadística descriptiva se encarga de estructurar y clasificar la
información para representarla mediante un gráfico o tabla.
2.
ESTADÍSTICA INFERENCIAL
Es la que normalmente
vemos en los artículos sobre investigación científica.
Utiliza muestras de
datos para sacar conclusiones y leyes de comportamiento sobre poblaciones más
grandes.
Ej: Se quiere analizar
cuántas personas poseen estudios universitarios completos en Sevilla. Para
ello, se coge a una muestra del total de la población y se analiza.
Posteriormente, utilizando la estadística inferencial se sacan hipótesis y
conclusiones a partir de los resultados obtenidos.
3.
VARIABLES
La manera más
básica de presentar los datos es mediante:
◦
Tablas de frecuencia:
Están formadas por columnas y filas. En las columnas se
colocan los datos que muestran frecuencias y en las filas se colocan las
categorías de las variables.
Representan información repetitiva de forma visible y
comprensible.
-
Requisitos:
§ Son autoexplicativas.
§ Son sencillas y fáciles de comprender.
§ Tienen un título breve y claro.
§ Indican fecha, lugar y fuente de
información.
§ Incluyen las unidades de medida en
cada cabecera.
§ Indican frecuencias absolutas y
relativas.
-
Tipos de tablas de frecuencia:
3.1. TABLA DE FRECUENCIA CUALITATIVA DICOTÓMICA
En estas
tablas tenemos que establecer:
1.
Variable cualitativa: no se puede medir, por ejemplo, el
sexo, nacionalidad, etc.
2.
Número de datos: es la muestra total escogida, el
número de sujetos
3.
Frecuencia absoluta (fi): Es el número de sujetos que pertenecen
a cada intervalo de la variable, por ejemplo, el número de sujetos que son hombres
y que son mujeres, el número de sujetos que son españoles y que son holandeses.
4.
Frecuencia relativa (hi): Es la frecuencia absoluta : número de datos. Su suma tiene que dar 1.
Representa una proporción de individuos referidos al total que presentan una
modalidad o que están incluidos en un intervalo.
Ej: Queremos el número de sujetos, distribuidos por sexo,
que han participado en una práctica sobre primeros auxilios, . Los resultados
son:
§ Hombres: 110.
§ Mujeres: 493
1.
Variable cualitativa: Sexo.
2.
Número de datos:
suma de los datos de la muestra à 110 + 493 = 603 à n=603
3.
Frecuencia absoluta (fi): número de personas que pertenecen a cada sexo
4.
Frecuencia relativa (hi): fi : n.
3.2. TABLA DE FRECUENCIA CUALITATIVA POLICOTÓMICA
Ej: Queremos estudiar el
lugar de procedencia de los turistas que acuden al hospital macarena de Sevilla
en Enero 2020. Los resultados son:
§ Argentina: 20.
§ Bolivia: 10
§ Brasil: 5
§ Venezuela: 15
1.
Variable cualitativa: Nacionalidad.
2.
Número de datos:
suma de los datos de la muestra à 20+10+5+12 = 50 à n=50
3.
Frecuencia absoluta (fi): número de turistas que pertenecen a cada nacionalidad
4.
Frecuencia relativa (hi): fi : n.
3.3. TABLA DE FRECUENCIA CUALITATIVA ORDINAL
Ej: Queremos estudiar el
grado de satisfacción de los pacientes con la comida del hospital. Los
resultados son:
Muy insatisfechos: 1.
Insatisfechos: 5
Aceptable: 6
Satisfechos: 7
Muy satisfechos: 3
1.
Variable cualitativa: Nacionalidad.
2.
Número de datos:
suma de los datos de la muestra à 1+5+6+7+3 = 50 à n=22
3.
Frecuencia absoluta (fi): número de sujetos que seleccionaron cada una de los intervalos de la
variable, es decir, cuántos pacientes estaban más o menos satisfechos con la
comida del hospital.
4.
Frecuencia relativa (hi): fi : n.
5.
Frecuencia relativa acumulada: Se realiza sumando las frecuencias relativas de una en
una, de forma acumulable.
3.4. TABLA DE FRECUENCIA CUANTITATIVA DISCRETA
En estas tablas se estudian valores cuantitativos, es
decir, que se pueden medir con números como, por ejemplo, el número de
pacientes con diabetes, el número de pacientes que toman determinado
medicamento, etc.
Ej: Queremos estudiar el
número de días que han los estudiantes de enfermería han realizado deporte en
la última semana.
1.
Variable cualitativa: Cuántos días se ha realizado deporte en la última semana.
2.
Número de datos:
suma de los datos de la muestra à 310+203+58+25+5+3+1+2 = 607 à n=607
3.
Frecuencia absoluta (fi): número de sujetos que seleccionaron cada uno de los intervalos de la
variable, en este caso, cuántas personas han realizado deporte entre 1-7 días
en la última semana.
4.
Frecuencia relativa (hi): fi : n.
5.
Frecuencia relativa acumulada: Se realiza sumando las frecuencias relativas de una en
una, de forma acumulable.
3.5 TABLA DE FRECUENCIA CON VARIABLES CONTINUAS:
1.
Se
obtienen los datos desagrupados.
2.
Se
ordenan los datos, por ejemplo, de menor a mayor.
3.
Calculamos
el RECORRIDO: Se resta el dato mayor menos el dato menor.
4.
Si
no conocemos el INTERVALO, lo calculamos haciéndole la raíz cuadrada al número de
la muestra total, es decir, a n y aproximamos.
5.
Para
conocer LA AMPLITUD DEL INTERVALO, dividimos el recorrido entre el
intervalo.
6.
Se
realiza la frecuencia absoluta y la frecuencia absoluta acumulada.
7.
Se
realiza la frecuencia relativa y la frecuencia relativa acumulada.
DATOS ORDENADOS:
Ej: Queremos conocer el peso
en Kg de los niños atendidos en la consulta de niños sanos.
1.
Variable cualitativa: Peso en Kg.
2.
Número de datos:
suma de los datos de la muestra à 3+8+14+6+4+5= 40 à n=40
3.
Frecuencia absoluta (fi): Peso de cada uno de sujetos, agrupados en intervalos.
4.
Frecuencia relativa (hi): fi : n.
5.
Frecuencia relativa acumulada: Se realiza sumando las frecuencias relativas de una en
una, de forma acumulable.
6.
Recorrido: 6,1
– 3,3 = 2,8
7.
Intervalo:
raíz cuadrada de 40 = 6,32 à intervalos = 6.
8.
Amplitud de los intervalos: 2,8 : 6 = 0,46 à redondeamos a 0,5
4. INDICADORES
La frecuencia absoluta no es un indicador, ya que le
falta un denominador que la relacione con el tamaño de la muestra y/o con el
periodo en el que se presentaron los eventos.
Un indicador es la
medida de la frecuencia de un determinado suceso en una población (forma de
medir la frecuencia con la que ocurre un suceso). Se expresan con un número,
que puede ser:
◦
Una proporción / prevalencia
◦
Una tasa
◦
Una razón
◦
Odds
Los indicadores siempre están formados por un numerador y
un denominador, es decir, un cociente entre dos magnitudes.
Existen muchos indicadores elaborados en:
◦
Instituto Nacional de Estadística (INE)
◦
Instituto de Estadística de Andalucía (IEA)
◦
Centro de Investigaciones Sociológicas (CIS)
4.1. PROPORCIONES
/ PREVALENCIA
Consiste en comparar, mediante una división, el
subconjunto y el conjunto al que pertenece. Sirve para medir variables
cualitativas.
El numerador siempre está incluido en el denominador.
Adopta valores reales entre 0 – 1, expresando la frecuencia
relativa del suceso que medimos.
Se suele multiplicar por 100 para representarlo en
porcentajes (más fácil de comprender).
Ejemplo: Proporción de
personas que presentan una enfermedad
4.2. TASAS
Es una medida que expresa el riesgo de que ocurra un
evento estudiado (enfermedad).
Consiste en comparar, mediante una división, el número de
veces que ocurre un determinado suceso y la población en la que puede ocurrir
dicho suceso en un tiempo determinado.
Normalmente, el resultado de la división es menor a 1,
por lo que suele multiplicarse por 100, 1000 (más fácil de comprender).
Realmente es una proporción con la diferencia de que el
denominador incluye un unidad de tiempo. Por lo tanto, tiene relación espacial
y temporal.
4.3. RAZONES
O “RATIOS”
Sirve para medir variables cualitativas.
Consiste en comparar, mediante una división, dos
conjuntos. Por lo tanto, el numerador no está incluido en el denominador.
Ejemplo: En una empresa
trabajan 1.200 hombres y 345 mujeres.
4.4. ODDS
O VENTAJA
Es la división entre la probabilidad de que ocurra un
evento y la probabilidad de que no ocurra.
Sus valores van desde 0 (eventos que nunca ocurren) hasta
infinito (eventos que ocurren siempre).
5.
RELACIÓN ENTRE PROPORCIÓN, RAZONES Y
ODDS (PAG 46)
Las medidas de asociación sirven para relacionar
proporciones, tasas y Odds. En función del tipo de estudio, se utilizarán una u
otra.
Las medidas de asociación más importantes son:
5.1. Razón
de prevalencias:
Realiza una razón entre dos prevalencias (proporciones).
Se utiliza en estudios descriptivos de corte transversal.
Fórmula:
Ejemplo: Razón entre la proporción de
enfermos pertenecientes al grupos de los expuestos y la proporción de enfermos
pertenecientes al grupo de los no expuestos.
Por lo tanto, estima una asociación entre el
factor de exposición y la enfermedad.
Si el valor se aproxima a 1, la enfermedad se
distribuye por igual entre los expuestos y los no expuestos.
5.2. Razón
de riesgos:
Realiza una razón entre dos incidencias acumuladas
(proporciones) o dos densidades de incidencias (tasas). Se utiliza en estudios
experimentales o en estudios de observación de seguimiento.
Fórmula:
Ejemplo: Razón entre el riesgo en los expuestos
y el riesgo en los no expuestos.
Por lo tanto, cuantifica el incremento en el
riesgo debido a la exposición.
Si el valor se aproxima a 1, la enfermedad se
distribuye de forma similar entre los expuestos y los no expuestos.
5.3. Odds
ratio:
Realiza una razón entre dos medidas Odds o ventajas. Se
utiliza en estudios de casos y controles.
Los valores oscilan entre 0 - 1.
Fórmula:
6.
MEDIDAS MÁS EMPLEADAS EN ESTADÍSTICA
SANITARIA
6.1. PREVALENCIA:
Describe qué proporción de la población tienen la
enfermedad en un momento específico de tiempo. Depende de la incidencia de la
enfermedad (aparición) y de su duración.
Fórmula:
Ej: ¿Cuál es la prevalencia
de fumadores en hombres y mujeres
6.2.
INCIDENCIA:
Describe la frecuencia con la que aparecen nuevos casos
durante un periodo de tiempo (paso de sano à enfermo).
Ej: Año en el que la persona
desarrolló diabetes. La observación se hace desde 2004-2015, cogiendo una
muestra de 10 pacientes.
¿Cuál es la incidencia de
los casos en el 2009?
La persona 1 y 8 no se
cuentan como en riesgo, debido a que ya padecen la enfermedad. Por lo tanto,
nuestro total será = 8.
« Incidencia acumulada o proporción de
incidencia.
Es la población de sujetos que desarrollan una enfermedad
en un período de tiempo, respecto del total de la población que tenía riesgo al
principio del período. Por lo tanto, mide el riesgo promedio (probabilidad) de
padecer la enfermedad.
Se calcula utilizando un periodo de tiempo en el que
consideramos que todos los individuos de una población tienen riesgo de padecer
la enfermedad.
No tiene unidades, se expresa en %.
Fórmula:
Ej: ¿Cuál es la incidencia acumulada
de personas que tienen diabetes de 2009-2010 ?
En el denominador incluimos
al sujeto 3, 5,7 y 9 que no padecieron diabetes antes del 2010. Excluimos a los
sujetos en rojo puesto que ya padecen la diabetes antes del 2010.
En el numerador incluimos
solo al sujeto 3, quien es el único que padece diabetes en el 2010.
« Tasa de incidencia o densidad de incidencia.
Es la velocidad con la que aparecen nuevos casos en
relación al tamaño de la población. Se utiliza para conocer el tiempo que
estuvo cada persona con una enfermedad
Normalmente, no se siguen al mismo tiempo a todos los
individuos en riesgo (denominador). Por lo tanto, existen diferentes tiempos de
observación (“tiempos en riesgo”).
Es necesario especificar la unidad de tiempo a la que se
refiere la tasa como, por ejemplo, personas-año, personas-mes, personas-semanas,
etc.
Se mide en unidades de tiempo ^ -1.
No son proporciones, es una tasa instantánea.
Fórmula:
Ej: Año en el que la persona
desarrolló diabetes. La observación se hace desde 2004-2015, cogiendo una
muestra de 10 pacientes.
¿Cuál es la tasa incidencia
de los casos en el 2009?
En el denominador se tienen
que sumar los años que cada sujeto lleva participando sin desarrollar diabetes,
hasta el 2009.
§ Sujeto
1: 1 año
§ Sujeto
2: 5 años.
§ Sujeto
3: 5 años
§ Sujeto
4: 5 años
§ Sujeto
5: 5 años.
§ Sujeto
6: 5 años
§ Sujeto
7: 5 años
§ Sujeto
8: 2 años.
§ Sujeto
9: 5 años.
§ Sujeto 10: 5 años
-
¿Cómo se relacionan la prevalencia y la
incidencia?
Prevalencia: Casos que hay en la población.
Puede verse
modificada por:
1.
Casos
de mortalidad o curaciónà disminuye la prevalencia puesto que dejan de formar
parte de esa población enferma.
2.
Recurrencia
à aumentan la prevalencia puesto que
vuelven a enfermar tras ser curados.
Incidencia: casos que se van añadiendo.
Comentarios
Publicar un comentario