Media, Mediana Y mODA

Quiero estudiar estadísticas desde cero y ver como se usaria con Python Pandas y graficarlo.

Voy a empezar por los conceptos básicos son la media, la mediana y la moda.

Media (Promedio)

La media nos ayuda a encontrar una tendencia central en un conjunto de datos proporcionando un solo valor que resume el valor típico del conjunto de datos. También puede ayudar a comparar dos conjuntos de datos (por ejemplo, comparando el ingreso promedio de dos países).


Problemas con la Media

Uno de los principales problemas es que si un término en nuestro conjunto de datos es muy diferente del resto, puede darnos una idea equivocada.


Ejemplo:

Digamos que estamos revisando el número de episodios en anime. Obtenemos el siguiente conjunto de datos de 10 anime aleatorios:

12, 12, 13, 12, 12, 12, 13, 13, 12, 12

El promedio es de 12 episodios por anime.

Sin embargo, si agregamos un dato más a la lista:

12, 12, 13, 12, 12, 12, 13, 13, 12, 12, 1049

El promedio se convierte en 106 episodios por anime.

Con un punto de datos atípico, podemos tener una idea equivocada del conjunto de datos.

Mediana

La mediana es el valor central de un conjunto de datos, pero hay dos casos a considerar:

Si hay una cantidad impar de términos, la mediana es el valor central de una lista ordenada de números.

Si hay una cantidad par de términos, encontramos los dos valores centrales y obtenemos el promedio de esos dos valores.

Ejemplo

Cantidad impar de términos:

12, 12, 13, 12, 12, 12, 13, 13, 12, 12, 1049. En este caso, la mediana es 12.

Cantidad par de términos:

12, 12, 13, 12, 12, 12, 13, 13, 12, 12. En este caso, tenemos dos números en el medio, 12 y 12.

Por lo tanto, la mediana es 12.

Moda

La moda es el valor que más se repite en la lista.

Ejemplo:

12, 12,13,12,12,12,13,13,12,12,1049

si hacemos una tabla de frecuencias:

12 se repite 7 veces, por lo que esa es nuestra moda.

Estos son los primeros 3 conceptos, en el siguiente post revisaré Python y Pandas para explorar un conjunto de datos.