Distribución de Frecuencias

Cuando la información que se tiene es un gran volumen, resulta muy conveniente ordenar y agrupar los datos para manejarlos de acuerdo a la distribución de frecuencias la cual consiste en agrupar los datos en clases o categorías que estarán definidas por un límite mínimo y uno máximo de variación, mostrando en cada clase el número de elementos que contiene o sea la frecuencia.

Reglas para formar las clases

  • Determinación del rango: El rango es la diferencia del valor máximo menos el valor mínimo de todo el bloque de datos.
  • Determinación del intervalo de clase: Es el cociente del rango entre el número de clases. El número de clases queda a criterio del investigador y se aconseja que este sea entre 8 y 12.
  • Determinación de los límites de clases: Arrancando de un valor cercano al mínimo se establece el primer límite de clase, a este se le suma el intervalo para obtener la segunda clase y así sucesivamente.
  • Determinación de la frecuencia: Consiste en contar cuantos datos caen dentro de cada clase.

Ejemplo :

Peso de racimos por palma producidos en un lote comercial

Rango:
74-32=42

Intérvalo:
42/8 = 5.25
= 5

Límites de clase
30-35
32 42 47 52 60 35-40
35 43 47 53 60 40-45
36 43 48 53 62 45-50
37 44 49 54 66 50-55
40 45 49 55 67 55-60
40 45 50 56 68 60-65
41 46 51 57 70 65-70
41 46 51 59 74 70-75

Las clases así construidas tienden a crear cierta ambigüedad ya que no haber la posibilidad de que ningún dato se quede sin incluir ni que se incluya mas de una vez. Por lo consiguiente, se hace necesario a definir los límites reales de las clases. Estos se obtienen fraccionando las unidades.

Distribución.
29.5 - 34.5 / 1
34.5 - 39.5 /// 3
39.5 - 44.5 //////// 8
44.5 - 49.5 ///////// 9
49.5 - 54.5 /////// 7
54.5 - 59.5 //// 4
59.5 - 64.5 /// 3
64.5 - 69.5 /// 3
69.5 - 74.5 // 2

Para establecer los límites reales de las clases es necesario conocer el método de redondeo empleado ya que de éste dependerán los límites.

Hay tres formas de redondeo a saber:

Método dígito siguiente último dígito ejemplo

usual

menor que 5 no cambia 48.3 = 48
mayor que 5 aumenta 48.6 = 49
igual a 5 aumenta si es impar 47.5 = 48
no cambia si es par 48.5 = 48
hacia arriba   siempre sube 48.1 = 49
hacia abajo   siempre baja 48.8 = 48

De esta manera, se puede ejemplificar con los datos presentados anteriormente, tres diferentes clasificaciones según el redondeo empleado.

Clase Método usual Hacia arriba Hacia abajo
29.5 - 34.5 30 - 34 Más de 29 a 34 30 a menos de 35
34.5 - 39.5 34 - 40 Más de 34 a 39 35 a menos de 40
39.5 - 44.5 40 - 44 Más de 39 a 44 40 a menos de 45
44.5 - 49.5 44 - 50 Más de 44 a 49 45 a menos de 50
49.5 - 54.5 50 - 54 Más de 49 a 54 50 a menos de 55
54.5 - 59.5 54 - 60 Más de 54 a 59 55 a menos de 60
59.5 - 64.5 60 - 64 Más de 59 a 64 60 a menos de 65
64.5 - 69.5 64 - 70 Más de 64 a 69 65 a menos de 70
69.5 - 74.5 70 - 74 Más de 69 a 74 70 a menos de 75

Las frecuencias pueden ser absolutas o relativas, simples o acumuladas.

Absoluta: Es el número de elementos u observaciones de una misma clase.
Relativa: Es el porcentaje de frecuencia observado en una clase con respecto al total.
Frecuencia acumulada: Es la suma de las frecuencias que se hayan en cada límite. O sea, el acumulado de la segunda clase es la suma de la primera más la segunda, el acumulado de la tercera clase es la suma de la primera, más la segunda, más la tercera, y así sucesivamente.

Punto medio de la clase :

Es el promedio de los límites reales.

Clase Frecuencia
absoluta
Punto
medio
Frec. Acumulada Frec. Acumumulada Porcentual
Menos de Más de Ascendentes Descendentes
29.5-34.5 1 32 1 40 2.5 100
34.5-39.5 3 37 4 39 10.0 97.5
39.5-44.5 8 42 12 36 30.0 90.0
44.5-49.5 9 47 21 28 52.5 70.0
49.5-54.5 7 52 28 19 70.0 47.5
54.5-59.5 4 57 32 12 80.0 30.0
59.5-64.5 3 62 35 8 87.5 20.0
64.5-69.5 3 67 38 5 95.0 12.5
69.5-74.5 2 72 40 2 100 5.0

Representación Gráfica

El patrón de variación de los datos puede apreciarse mejor representando gráficamente la información contenida en el cuadro.

Generalmente los gráficos empleados para representar distribuciones de frecuencias son : los polígonos de frecuencias, gráficos de barras, histogramas, ojivas y gráficos de bastones

Histograma

Slide1.JPG (10801 bytes)Son gráficos construidos de barras verticales sin separaciones entre sí.

Para construir un histograma, se define una escala horizontal apropiada y en ella se marcan los límites reales de todas las clases de la distribución que se quiere representar. La escala no necesita comenzar en cero, pero si un intervalo de clase antes del límite inferior de la clase más baja.

Las frecuencias se representan en la escala vertical, la cual si debe comenzar en cero, no tener cortes o interrupciones y ser lo suficientemente amplia para incluir la mayor de las frecuencias.

Definidas las escalas, se procede a trazar el gráfico como en el ejemplo.

Slide2.JPG (11588 bytes)Polígono de frecuencias

El polígono consiste en marcar sobre cada clase un punto, tomando como occisa el punto medio de la clase y como ordenada la frecuencia. Esos puntos se unen luego con secciones de rectas y la figura resultante es el polígono.

Las Ojivas

Slide3.JPG (12140 bytes)Estas son en realidad polígonos que utilizan las frecuencias acumuladas con la salvedad de que las ordenadas no se levanten sobre el punto medio de la clase, sino sobre el límite inferior o superior según se haya acumulado (ascendente o descendente). Esto se hace porque debido al procedimiento de acumulación, la frecuencia "menos", para un cierta clase, incluye todas las frecuencias menores que el límite superior de esa clase; y la acumulada "mas de", todas las frecuencias mayores que el límite inferior de la clase.

Slide4.JPG (11110 bytes)Gráficos de bastones

El gráfico de bastones son simples líneas gruesas verticales separadas, de altura proporcional a la frecuencia de la clase.

Gráficos de barras

Es similar al histograma, excepto que se usa para escalas cualitativas. Las categorías que aparecen en el eje horizontal no tienen que llevar un orden específico, sino colocadas en orden alfabético. se exceptúan de esto las escalas ordinales, por ejemplo la posición de los equipos. Es preferible que haya separación de las barras y éstas deben ser del mismo ancho.