domingo, 8 de abril de 2018

TEMA 5: "MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS"

Además de las tablas podemos resumir una serie de observaciones mediante “estadísticos”. Tenemos tres tipos de medidas estadísticas:

MEDIDAS DE TENDENCIA CENTRAL:
Dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Dentro de este grupo tenemos:

  • Media aritmética: Se calcula para variables cuantitativas y se trata del centro geométrico de nuestros datos. Tenemos dos fórmulas. Cuando los datos están desagrupados, utilizamos esta fórmula:
                                                         
        Cuando los datos están agrupados utilizamos esta fórmula, siendo mc la marca de clase que se            calcula en la tabla de frecuencia sumando los extremos del intervalo y dividiéndolo entre 2.

                                                         

  • Mediana: Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor. Si el número de observaciones es impar el valor de la observación será justamente la observación que ocupa la posición (n/2)+1 – Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1
  • Moda: Es el valor con mayor frecuencia (que más veces se repite) – Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos)

MEDIDAS DE POSICIÓN:
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. 
Los cuantiles más usuales son:
  • Percentiles: Valor del elemento que divide una serie de datos en cien grupos de igual valor o en intervalos iguales. El P50 corresponde con el valor de la mediana puesto que la mediana, como hemos dicho, es justo el 50%.
  • Deciles: Dividen la muestra ordenada en 10 partes. El D5 corresponde con el P50 y con la mediana.
  • Cuartiles: Dividen la muestra ordenada en 4 partes:
    • El Q1 , primer cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores. 
    • El Q2 , segundo cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con al valor de la mediana P50 
    • El Q3 , tercer cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores. 
    • El Q4 , cuarto cuartil indica el valor mayor que se alcanza en la seria numérica

MEDIDAS DE DISPERSIÓN:
Dan información acerca de la heterogeneidad de nuestras observaciones. 

  • Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra |xn -x1|
  • Desviación media: media aritmética de las distancias de cada observación con respecto a la media de la muestra: 
                                                    

  • Desviación típica: cuantifica el error que cometemos si representamos una muestra únicamente por su media
                                                      
  • Varianza: expresa la misma información en valores cuadráticos.
                                                     

  • Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil

                                                           

  • Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas:
                                                            



DISTRIBUCIONES NORMALES:

Es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. La gráfica de su función tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones)


                              

Asimetrías:
Grado de asimetría de la distribución de sus datos en torno a su media. Puede tener estos resultados:

           Resultado de imaxes para asimetrias campana de gauss


  • Si g1=0, tenemos una distribución simétrica
  • Si g1>0, tenemos una asimetría positiva
  • Si g<0, tenemos una asimetría negativa
Curtosis:
Grado de concentración de valores que se encuentran en torno a la media, adopta valores entre -1 y 1. Puede tomar estos valores:
  • g2 = 0 (distribución mesocúrtica)
  • g2 > 0 (distribución leptocúrtica).
  • g2 < 0 (distribución platicúrtica)
                            

No hay comentarios:

Publicar un comentario