Mediana
De OCHA Colombia Wiki
En el ámbito de la estadística, la mediana, representa el valor de la variable de posición central en un conjunto de datos ordenados. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su cálculo no se ve afectado por valores extremos.
Cálculo
Es el valor medio en un conjunto de valores ordenados. Corresponde al percentil 50 o segundo cuartil (P50 o Q2). Los pasos son: 1) Arregla los valores en orden del menor al mayor 2) Cuenta de derecha a izquierda o al revés hasta encontrar el valor o valores medios. Ejemplo: tenemos el siguiente conjunto de números 8,3,7,4,11,2,9,4,10,11,4 ordenamos: 2,3,4,4,4,7,8,9,10,11,11 En esta secuencia la mediana es 7, que es el número central. Y si tuviésemos: 8,3,7,4,11,9,4,10,11,4, entonces ordenamos: 3,4,4,4,7,8,9,10,11,11 y la mediana (Md) está en: los números centrales son 7 y 8, lo que haces es sumar 7 + 8 y divides entre 2 y Md= 7.5.
Existen dos métodos para el cálculo de la mediana:
- Considerando los datos en forma individual, sin agruparlos.
- Utilizando los datos agrupados en intervalos de clase.
A continuación veamos cada una de ellas.
Datos sin agrupar
Sean <math>x_1,x_2,x_3,\ldots,x_n</math> los datos de una muestra ordenada en orden creciente y designando la mediana como <math>M_e</math>, distinguimos dos casos:
a) Si n es impar, la mediana es el valor que ocupa la posición <math>(n+1)/2</math> una vez que los datos han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. Es decir: <math>M_e=x_{(n+1)/2}</math>.
Por ejemplo, si tenemos 5 datos, que ordenados son: <math>x_1 = 3</math>, <math>x_2 = 6</math>, <math>x_3 = 7</math>, <math>x_4 = 8</math>, <math>x_5 = 9</math> => El valor central es el tercero: <math>x_{(5+1)/2} = x_3 = 7</math>. Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (<math>x_1</math>, <math>x_2</math>) y otros dos por encima de él (<math>x_4</math>, <math>x_5</math>).
b) Si n es par, la mediana es la media aritmética de los dos valores centrales. Cuando <math>n</math> es par, los dos datos que están en el centro de la muestra ocupan las posiciones <math>n/2</math> y <math>n/2+1</math>. Es decir:
<math>M_e = (x_{\frac{n}{2}} + x_{{\frac{n}{2}}+1})/2</math>.
Por ejemplo, si tenemos 6 datos, que ordenados son: <math>x_1 = 3</math>, <math>x_2 = 6</math>, <math>x_3 = 7</math>, <math>x_4 = 8</math>, <math>x_5 = 9</math>, <math>x_6 = 10</math> => Hay dos valores que están por debajo del <math>x_{\frac {6} {2}} = x_3 = 7</math> y otros dos que quedan por encima del siguiente dato <math>x_{{\frac {6} {2}}+1} = x_4 = 8</math>. Por tanto, la mediana de este grupo de datos es la media aritmética de estos dos datos: <math>M_e = \frac {x_3 + x_4}{2} = \frac {7 + 8} {2}=7,5</math>.
Datos agrupados
Al tratar con datos agrupados, si <math> {{\frac {n} {2}}} </math> coincide con el valor de una frecuencia acumulada, el valor de la mediana coincidirá con la abscisa correspondiente. Si no coincide con el valor de ninguna abcisa, se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas, utilizando la siguiente equivalencia:
- <math>\frac{N_i-N_{i-1} }{a_i-a_{i-1} }=\frac{\frac{n}{2}-N_{i-1} }{p}\Rightarrow p=\frac{\frac{n}{2}-N_{i-1} }{N_i-N_{i-1} }(a_i-a_{i-1})</math>
Donde <math>N_{i}</math> y <math>N_{i-1}</math> son las frecuencias absolutas acumuladas tales que <math>N_{i-1} < {{\frac {n} {2}}} < N_{i}</math>, <math>a_{i-1}</math> y <math>a_{i}</math> son los extremos, interior y exterior, del intervalo donde se alcanza la mediana y <math>M_e=a_{i-1}</math> es la abscisa a calcular, la moda. Se observa que <math>a_{i} - a_{i-1}</math> es la amplitud de los intervalos seleccionados para el diagrama.
Ejemplos para datos sin agrupar
Ejemplo 1: Cantidad (N) impar de datos
xi | fi | Ni |
---|---|---|
1 | 2 | 2 |
2 | 2 | 4 |
3 | 4 | 8 |
4 | 5 | 13 |
5 | 8 | 21 > 19.5 |
6 | 9 | 30 |
7 | 3 | 33 |
8 | 4 | 37 |
9 | 2 | 39 |
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla:
Calificaciones | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
Número de alumnos | 2 | 2 | 4 | 5 | 8 | 9 | 3 | 4 | 2 |
Primero se hallan las frecuencias absolutas acumuladas <math>N_i</math>. Así, aplicando la formula asociada a la mediana para n impar, se obtiene <math>X (39+1) / 2 = X 20 </math>.
- Ni-1< n/2 < Ni = N19 < 19.5 < N20
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar.En este ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.
Ejemplo 2 : Cantidad (N) par de datos
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo):
Calificaciones | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
Número de alumnos | 2 | 2 | 4 | 5 | 6 | 9 | 4 | 4 | 2 |
xi | fi | Ni+w |
---|---|---|
1 | 2 | 2 |
2 | 2 | 4 |
3 | 4 | 8 |
4 | 5 | 13 |
5 | 6 | 19 = 19 |
6 | 9 | 28 |
7 | 4 | 32 |
8 | 4 | 36 |
9 | 2 | 38 |
Primero se hallan las frecuencias absolutas acumuladas <math>N_i</math>. <math>N_i</math>. Así, aplicando la fórmula asociada a la mediana para n par, se obtiene Formula: <math> X = n/2 ==> X =(38 / 2) => X =19 </math> (Donde n= 38 alumnos divididos entre dos).
- Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. En el ejemplo el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6 con lo que Me = (5+6)/2 = 5,5 puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más.
Ejemplo para datos agrupados
Entre 1.70 y 1.80 hay 3 estudiantes.
Entre 1.60 y 1.70 hay 5 estudiantes.
Entre 1.50 y 1.60 hay 2 estudiantes.
- <math>Mediana= 1.60 + \left( \frac{(10/2)-2}{5} \right)0.1=1.66</math>
Método de cálculo general
xi | fi | Ni |
---|---|---|
[x11-x12] | ||
[x(i-1)1-x(i-1)2] | ||
[xi1-xi2] | ||
[x(i+1)1-x(i+2)2] | ||
[xM1-xM2] |
Consideramos:
- x11 valor mínimo< Entonces:
- <math>Mediana= x_{i1} + \left( \cfrac{(N_M/2)-N_{i-1}}{f_i} \right).(x_{i2}-x_{i1})</math>
Método proyectivo
Con base en el método proyectivo, se puede obtener la mediana para datos agrupados de la siguiente forma:
1. Tomar el número total de frecuencias y dividirlo entre dos.
2. Restar a ese número el total de frecuencias de las clases anteriores a la clase mediana.
3. Usar el número obtenido para hacer un cambio del doble superior de escala entre las frecuencias de la clase mediana y sus rangos para obtener la distancia parcial
4. Sumamos la distancia parcial obtenida a el límite inferior de la clase.
Usando el ejemplo anterior:
1. El número total de frecuencias es de; (3+5+2)/2 = 10/2 = 5
2. El total de frecuencias anteriores es 2; (5 - 2) = 3
3. Hacemos el cambio de escalas:
- <math>\ 3:5::x:0.10 </math>
Resolviendo:
- <math>\ x= \frac{(0.10)(3)}{5}=0.06 </math> la mediana es la suma de todos los datos dividido entre el número de datos
4. Se suma la distancia parcial al límite inferior:
- <math>\ Mediana = 0.06 + 1.60 = 1.66 </math>
Véase también
- Desviación estándar
- Frecuencia
- Moda (estadística)
- Media aritmética
- Parámetro estadístico
- Promedio
- Valor esperado
Enlaces externos
- [1] Simulación de la mediana de una variable discreta con R (lenguaje de programación)