0% encontró este documento útil (0 votos)
117 vistas12 páginas

5

Este documento explica cómo calcular y utilizar diferentes medidas estadísticas descriptivas como el coeficiente de variación. Define el coeficiente de variación como la desviación estándar dividida por la media, lo que permite comparar la dispersión de conjuntos de datos con diferentes escalas. También resume fórmulas para calcular la media, mediana, moda, varianza, desviación estándar y otras medidas comúnmente utilizadas.
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
117 vistas12 páginas

5

Este documento explica cómo calcular y utilizar diferentes medidas estadísticas descriptivas como el coeficiente de variación. Define el coeficiente de variación como la desviación estándar dividida por la media, lo que permite comparar la dispersión de conjuntos de datos con diferentes escalas. También resume fórmulas para calcular la media, mediana, moda, varianza, desviación estándar y otras medidas comúnmente utilizadas.
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 12

5.4.

2 Calculo del coeficiente de variación en Excel

Para calcular el coeficiente de variación con ayuda de Excel, debemos calcular primero
la media aritmética y la desviación estándar. Por ejemplo, calculemos el coeficiente de
variación para los siguientes datos:

Empleando las fórmulas vistas en Excel, se halla la media y desviación (tomando los
valores como muestrales):

El coeficiente de variación es el resulta de la división entre la desviación (C7) y la


media (C6):

Medidas descriptivas
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que
nos resumen la información contenida en ella.

Medidas de Posición: Cuantiles


Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en
intervalos, que comprenden el mismo número de valores. Los más usados son los
cuartiles, los deciles y los percentiles.

PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de


datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%


CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales, son un caso particular de los percentiles:

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los
datos
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez
partes iguales, son también un caso particular de los percentiles.

Ejemplo:
Dada la siguiente distribución en el número de hijos (Xi) de cien familias, calcular sus
cuartiles.

xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n=100

Solución:
1.
Primer cuartil:

2.
Segundo cuartil:

3.
Tercer cuartil:

Medidas de Centralización
Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar
como representativo de todos los datos. Hay diferentes modos para definir el "centro" de
las observaciones en un conjunto de datos. Por orden de importancia, son:

MEDIA : (media aritmética o simplemente media). es el promedio aritmético de las


observaciones, es decir, el cociente entre la suma de todos los datos y el numero de
ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos están agrupados utilizamos las marcas de clase, es decir ci en vez de xi.

MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de
menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro
50% son mayores. Si el número de datos es impar la mediana será el valor central, si es
par tomaremos como mediana la media aritmética de los dos valores centrales.
MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya
frecuencia absoluta es mayor. No tiene porque ser única.

Medidas de Dispersión
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre medidas de dispersión
absolutas, que no son comparables entre diferentes muestras y las relativas que nos
permitirán comparar varias muestras.

MEDIDAS DE DISPERSIÓN ABSOLUTAS

VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada


observación y la media aritmética del conjunto de observaciones.

Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la


varianza:

Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi.

DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la
variable pero al cuadrado, para evitar este problema podemos usar como medida de
dispersión la desviación típica que se define como la raíz cuadrada positiva de la
varianza
Para estimar la desviación típica de una población a partir de los datos de una muestra
se utiliza la fórmula (cuasi desviación típica):

RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las


observaciones mayor y el menor. Re = xmax - xmin

MEDIDAS DE DISPERSIÓN RELATIVAS

COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de


dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las
medias no son iguales se utiliza el coeficiente de variación de Pearson que se define
como el cociente entre la desviación típica y el valor absoluto de la media aritmética

CV representa el número de veces que la desviación típica contiene a la media aritmética


y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad
de la media.

Medidas de Forma
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el
diagrama de barras de la distribución, con la distribución normal.

MEDIDA DE ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media


aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o


relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha
diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas


es el Coeficiente de Asimetría de Pearson:
Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a
la derecha y negativo cuando existe asimetría a la izquierda.

MEDIDA DE APUNTAMIENTO O CURTOSIS

Se
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda.

definen 3 tipos de distribuciones según su


grado de curtosis:
Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los
valores centrales de la variable (el mismo que presenta una distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los
valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable.
EJEMPLO 1

El número de diás necesarios por 10 equipos de


trabajadores para terminar 10 instalaciones de
iguales características han sido: 21, 32, 15, 59, 60,
61, 64, 60, 71, y 80 días. Calcular la media, mediana,
moda, varianza y desviación típica.
SOLUCIÓN:

suma de todos los valores de una


La media:

variable dividida entre el número total de


datos de los que se dispone:

La mediana: es el valor que deja a la


mitad de los datos por encima de dicho
valor y a la otra mitad por debajo. Si
ordenamos los datos de mayor a menor
observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el
número de observaciones es par (10
individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si
realizamos el cálculo de la media de estos
dos valores nos dará a su vez 60, que es el
valor de la mediana.
La moda: el valor de la variable que
presenta una mayor frecuencia es 60
La varianza S2: Es la media de los
cuadrados de las diferencias entre cada
valor de la variable y la media aritmética
de la distribución.

Sx2=

La desviación típica S: es la raíz


cuadrada de la varianza.
S = √ 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 días
El coeficiente de variación: cociente entre la desviación
típica y el valor absoluto de la media aritmética

CV = 20,67/52,3 = 0,39

EJEMPLO 2

El precio de un interruptor magentotérmico en 10 comercios de electricidad de una


ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana,
(abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de caja.

SOLUCIÓN:

(Utilizar la calculadora de debajo)


[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido]

Abrir Calculadora Estadística

Ir a Calculadora Estadística
Resumen de Fórmulas

Coeficiente de variación
De Wikipedia, la enciclopedia libre
Saltar a navegación, búsqueda

En estadística el coeficiente de variación (de Pearson), es una medida de dispersión


útil para comparar dispersiones a escalas distintas pues es una medida invariante ante
cambios de escala. Sirve para comparar variables que están a distintas escalas pero que
están correlacionadas estadísticamente y sustantivamente con un factor en común. Es
decir, ambas variables tienen una relación causal con ese factor. Su fórmula expresa la
desviación estándar como porcentaje de la media aritmética, mostrando una mejor
interpretación porcentual del grado de variabilidad que la desviación típica o estándar.
Por otro lado presenta problemas ya que a diferencia de la desviación típica este
coeficiente es variable ante cambios de origen. Por ello es importante que todos los
valores sean positivos y su media de por tanto un valor positivo. A mayor valor de C.V.
mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor
homogeneidad en los valores de la variable. Suele representarse por medio de las siglas
C.V..

Exigimos que:

Se calcula:

Donde σ es la desviación típica. Se puede dar en tanto por ciento calculando:

[editar] Propiedades y aplicaciones

• El coeficiente de variación es típicamente menor que uno.

• Para su mejor interpretación se lo expresa como porcentaje.

• Depende de la desviación típica y en mayor medida de la media aritmética, dado


que cuando ésta es 0 o muy próxima a este valor C.V. pierde significado, ya que
puede dar valores muy grandes, que no necesariamente implican dispersión de
datos.

• El coeficiente de variación es común en varios campos de la probabilidad


aplicada, como teoría de renovación y teoría de colas. En estos campos la
distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su
media, por lo que su coeficiente de variación es 1. La distribuciones con un C.V.
menor que uno, como la distribución de Erlang se consideran de "baja varianza",
mientras que aquellas con un C.V. mayor que uno, como la distribución
hiperexponencial se consideran de "alta varianza". Algunas fórmulas en estos
campos se expresan usando el cuadrado del coeficiente de variación,
abreviado como S.C.V. (por su siglas en inglés).

También podría gustarte