jueves, 20 de agosto de 2009

Tablas de frecuencia para datos agrupados

Distribución de frecuencia para datos agrupados
Cuando la muestra es grande es frecuente encontrar muchos valores de la variable y resulta poco práctico numerarlas todos, en estos casos resulta conveniente agrupar los valores en intervalos consecutivos llamados clases. Estos intervalos son de la forma [Li, Ls], cuyo extremo Li es el limite inferior de la clase y el extremo Ls es el limite superior de la clase.

No existe alguna ley que defina cómo obtener el número de clases; pero la experiencia recomienda que sean entre 5 y 20 clases.

Para construir una distribución de frecuencias en clases seguimos el siguiente procedimiento aplicado al ejemplo: los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

Paso 1. Determinamos el rango (R) de variación de los datos que se define como
R = Xmax – Xmin, donde Xmax es el dato máximo y Xmin es el dato mínimo.

Para el ejemplo Xmax = 140 y Xmin = 90 entonces
R = 140 – 90 = 50

Paso 2. Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n) ; donde n es el numero de datos (se recomienda que sean más de 10).
Para el ejemplo se tiene n = 40 datos, sustituyendo
k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28 , la cual se redondea al entero siguiente, en este caso k = 7.
Otra alternativa es usando la raiz cuadrada del total de datos n para este ejemplo nos queda asi:
k = raiz (n) = raiz (40) = 6.32 que tambien se redondea al entero siguiente quedando k= 7.

Paso 3. Calculamos la amplitud de clase (A), que corresponde a la cantidad de datos que van en casa clase, dividiendo el rango R entre el numero de clases k:
sustituyendo se redondea a 8.

Paso 4. Construimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma [Li, Ls].

Para formar las clases comenzaremos con los limites inferiores:
· En la primer clase tomamos Li1 = Xmin ( el dato mas pequeño)
· Para las demás clases el limite inferior se obtiene sumando la Xmin con la amplitud, es decir

Li n = Li n –1 + A. Para nuestro ejemplo Xmin = 90 y A = 8, entonces las 7 clases quedan:


Para obtener los limites superiores se toma el valor anterior al limite inferior de la clase siguiente, y se va sumando la amplitud A = 8


Finalmente ya podemos elaborar las clases con sus respectivas frecuencias, recordando que cada clase abarca todos los valores que van desde el limite inferior hasta el superior. Los puntajes de los 40 alumnos son:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

Marca de clase (Mi): corresponde al punto medio del intervalo, es una característica importante de cada clase ya que no cambia sin importar si la variable es discreta o continua, se calcula usando la formula:

, se suman los limites de clase y el resultado se divide entre dos.

Para nuestro ejemplo obtendríamos las siguientes marcas de clase:




Clases para Variables Continuas

Si analizamos la tabla anterior veremos que de una clase a la siguiente hay un salto por ejemplo la primer clase acaba en 97 y la segunda comienza en 98, esto se debe a que como la variable es discreta no existen ningún dato entre estos valores, pero si la variable fuera continua y tomara valores decimales como 97.6 tendríamos una perdida de información, para evitar esto en el caso continuo se fijan otros limites en cada clase.

Limites reales de clase: se usan cuando la variable es del tipo cuantitativa continua, se fijan tomando media unidad antes y después de cada uno de los limites de clase.
Para nuestro ejemplo los limites reales quedarían así:









Si observamos ya no hay saltos entre las clases, pero el valor 97.5 aparece en la primera y segunda clase, para no contarlo dos veces se toman los limites reales como semiabiertos es decir de la forma [ Li, Ls ), esto significa que el valor superior Ls 97.5, no se considera dentro de la primer clase, sino solo en la segunda. Analogamente con los demas limites superiores.

Actividad: construye una distribución de frecuencia para datos agrupados que incluya clases, limites reales, marca de clase, frecuencia absoluta, frecuencia relativa, frecuencia porcentual y las acumuladas.

1. El gerente de una compañía de ventas al mayoreo de diferentes tipos de mercancías desea conocer el comportamiento de las llamadas telefónicas durante los meses de marzo y abril del año en curso; por lo que le encomienda a su secretaria que realice esa investigación. La secretaria obtuvo los siguientes datos, en número de llamadas por día: 30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30, 27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52, 56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48.

2. Preguntando el peso a 50 estudiantes de primer año de la secundaria Heroes de la Independencia, se obtuvieron los siguientes datos: 44; 47.2; 45.5; 40; 41.8; 38; 47.6; 40.4; 51; 49.5; 43.5; 54; 39.4; 44.2; 39; 53.6, 40.2; 41.3; 40.2; 55; 40.7; 53; 43.5; 44; 49; 46.4; 41.2; 45; 44.8; 47.1; 49.5; 50.8; 52.3; 39.7; 49; 36; 42.4; 43; 46; 41.5; 40; 48.5; 45.1; 47.2; 49.8; 43; 41.5; 44.9; 40.2; 47.

31 comentarios :

  1. Excelente me ayudo mucho, gracias

    ResponderEliminar
    Respuestas
    1. Si es muy buena Me Hizo Todo El Trabajo, Gracias

      Eliminar
  2. super, me ayudo mucho.. gracias...

    ResponderEliminar
  3. MUY BUENO.. ME AYUDO MUCHO.. GRACIAS.

    ResponderEliminar
  4. super, me ayudo mucho.. gracias...

    ResponderEliminar
  5. excelente, lo que no entendi en clase, lo logre enterder con este post! un 20 !

    ResponderEliminar
  6. exelente me ayudo mucho

    ResponderEliminar
  7. por qué no redondear el valor 6,28 a 6?

    ResponderEliminar
    Respuestas
    1. Si lo redondeas a 6 puede que te quedes corto y al construir la tabla no alcanzes a cubrir todos los datos, por eso se toma preferentemente el valor siguiente.

      Eliminar
  8. Cordial saludo profe. Tengo una duda. Tengo entendido que la naturaleza de la variable que uno está tratando, es la que determina si la variable es cuantitativa, discreta o contínua. Por ejemplo si me hablan de costos (en la unidad monetaria que sea), creo que esa variable es contínua.
    ¿Qué sucede si esa variable me la dan de la siguiente forma (en números enteros) 230 245 324 211 199 421 ?
    ¿Así los números sean enteros la variable sigue siendo contínua?
    Muchas gracias.

    ResponderEliminar
    Respuestas
    1. En el caso que mencionas se requiere saber de que se esta hablando para obtener los valores que mencionas, podriamos asumir que son discretos por ejemplo si hablaramos de clientes de un banco ya que efectivamente solo tendriamos valores enteros, pero si esos datos corresponden a costos o salarios en ese caso tendriamos que considerar la variable como continua ya que existe la posibilidad de que tomen un valor decimal.

      Espero haberte ayudado. Saludos.

      Eliminar
  9. hola sera que me puede ayudar esque no le entiendo a lo de estadistica porfavor me urge

    ResponderEliminar
    Respuestas
    1. depende a lo que te refieras con ayudar, explicarte algunas dudas o darte informacion sobre algunos temas si, resolverte tu tarea no.
      en que temas necesitas ayuda??

      Eliminar
  10. Hola buena explicación , tengo una duda si la amplitud de intervalo es 5 , esto es valido, 50-55,51-60,61-65, ya que es un ejemplo que me dieron y me que da la duda, de si es correcto ya lo entiendo asi 50,51,52,53,54,55 la amplitud seria 6 y entonces 51,52,53,54,55, la amplitud seria de 5 , cabe mencionar que los datos del problema son números enteros, espero me puedas ayudar de antemano gracias.

    ResponderEliminar
    Respuestas
    1. La amplitud se refiere al número de datos que abarca el intervalo si tomamos el intervalo de 50 - 55 , la amplitud seria 6 ya que como mencionas tendriamos los valores de 50, 51, 52, 53, 54, 55, que son seis.
      Si la amplitud es 5 los intervalos tendrian que ser 51- 55, 56- 60, 61-65
      Espero te sirva.

      Eliminar
    2. Muchas gracias por tu respuesta

      Eliminar
  11. Muchas gracias por el artículo. Saludos de un orgulloso alumno tanto de ESIME Ticomán (IPN) como de Facultad de Ingeniería.

    ResponderEliminar
  12. hola, que buena pagina, sera que me pueden ayudar con una duda, siempre que encuentro teoría sobre los cuadros de frecuencia para datos agrupados dice que los use si tengo mas de 30 datos o para variable continua, mi pregunta es ¿ puedo hacer la tabla de frecuencia cuando tengo mas de 30 datos de una variable cualitativa nominal u ordinal ? si me pueden dar un ejemplo por favor. gracias

    ResponderEliminar
    Respuestas
    1. Hola Julian.
      Efectivamente para los datos cualitativos o nominales se recomienda que las tablas sean menores de 30 datos (recordando que sean 30 datos o categorias distintas con muy poca frecuencia en cada valor). Si es posible realiarla por ejemplo tomar las edades de 50 habitantes de una colonia, podriamos encontrar valores como: 22, 26, 36, 87, 24, 19, 21, 13, 8, 3, 35, 42, 54, 18, 32, 30, 21, 11, 90, 83, 55, 39, 75, 62, 8.........
      la tabla te quedaria asi
      x f
      3 1
      8 2
      11 1
      13 1
      18 1
      19 1
      21 2
      22 1
      24 1
      26 1
      ........
      como puedes ver la tabla que resulta es muy extensa y no se cumpliria el proposito de resumir la informacion. Por eso es que en estos casos se recomienda utiliar tablas agrupadas.





      Eliminar
  13. esta super bueno. me sirvio de mucho

    ResponderEliminar
  14. MUY BUENO. FELICITACIONES. SIGUE ADELANTE.

    ResponderEliminar
  15. esta genial, muchas gracias :)

    ResponderEliminar
  16. gracias, objetivos y claros ejemplos

    ResponderEliminar
  17. muy practica, entendible y dinamica
    Tu trabajo es excelente

    ResponderEliminar
  18. HOLA profe mire por donde le voy a mandar los ejercicios por aqui por los comentarios

    ResponderEliminar
  19. muy buenos estos articulos me aclararon muchas dudas y me dejaron una enseñanza notoria exelente atentamente JUAN CAMILO CERPA DIAZ

    ResponderEliminar
  20. Gracias me has dado la solución

    ResponderEliminar