jueves, 20 de agosto de 2009

Tablas de frecuencia para datos agrupados

Distribución de frecuencia para datos agrupados
Cuando la muestra es grande es frecuente encontrar muchos valores de la variable y resulta poco práctico numerarlas todos, en estos casos resulta conveniente agrupar los valores en intervalos consecutivos llamados clases. Estos intervalos son de la forma [Li, Ls], cuyo extremo Li es el limite inferior de la clase y el extremo Ls es el limite superior de la clase.

No existe alguna ley que defina cómo obtener el número de clases; pero la experiencia recomienda que sean entre 5 y 20 clases.

Para construir una distribución de frecuencias en clases seguimos el siguiente procedimiento aplicado al ejemplo: los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

Paso 1. Determinamos el rango (R) de variación de los datos que se define como
R = Xmax – Xmin, donde Xmax es el dato máximo y Xmin es el dato mínimo.

Para el ejemplo Xmax = 140 y Xmin = 90 entonces
R = 140 – 90 = 50

Paso 2. Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n) ; donde n es el numero de datos (se recomienda que sean más de 10).
Para el ejemplo se tiene n = 40 datos, sustituyendo
k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28 , la cual se redondea al entero siguiente, en este caso k = 7.
Otra alternativa es usando la raiz cuadrada del total de datos n para este ejemplo nos queda asi:
k = raiz (n) = raiz (40) = 6.32 que tambien se redondea al entero siguiente quedando k= 7.

Paso 3. Calculamos la amplitud de clase (A), que corresponde a la cantidad de datos que van en casa clase, dividiendo el rango R entre el numero de clases k:
sustituyendo se redondea a 8.

Paso 4. Construimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma [Li, Ls].

Para formar las clases comenzaremos con los limites inferiores:
· En la primer clase tomamos Li1 = Xmin ( el dato mas pequeño)
· Para las demás clases el limite inferior se obtiene sumando la Xmin con la amplitud, es decir

Li n = Li n –1 + A. Para nuestro ejemplo Xmin = 90 y A = 8, entonces las 7 clases quedan:


Para obtener los limites superiores se toma el valor anterior al limite inferior de la clase siguiente, y se va sumando la amplitud A = 8


Finalmente ya podemos elaborar las clases con sus respectivas frecuencias, recordando que cada clase abarca todos los valores que van desde el limite inferior hasta el superior. Los puntajes de los 40 alumnos son:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

Marca de clase (Mi): corresponde al punto medio del intervalo, es una característica importante de cada clase ya que no cambia sin importar si la variable es discreta o continua, se calcula usando la formula:

, se suman los limites de clase y el resultado se divide entre dos.

Para nuestro ejemplo obtendríamos las siguientes marcas de clase:




Clases para Variables Continuas

Si analizamos la tabla anterior veremos que de una clase a la siguiente hay un salto por ejemplo la primer clase acaba en 97 y la segunda comienza en 98, esto se debe a que como la variable es discreta no existen ningún dato entre estos valores, pero si la variable fuera continua y tomara valores decimales como 97.6 tendríamos una perdida de información, para evitar esto en el caso continuo se fijan otros limites en cada clase.

Limites reales de clase: se usan cuando la variable es del tipo cuantitativa continua, se fijan tomando media unidad antes y después de cada uno de los limites de clase.
Para nuestro ejemplo los limites reales quedarían así:









Si observamos ya no hay saltos entre las clases, pero el valor 97.5 aparece en la primera y segunda clase, para no contarlo dos veces se toman los limites reales como semiabiertos es decir de la forma [ Li, Ls ), esto significa que el valor superior Ls 97.5, no se considera dentro de la primer clase, sino solo en la segunda. Analogamente con los demas limites superiores.

Actividad: construye una distribución de frecuencia para datos agrupados que incluya clases, limites reales, marca de clase, frecuencia absoluta, frecuencia relativa, frecuencia porcentual y las acumuladas.

1. El gerente de una compañía de ventas al mayoreo de diferentes tipos de mercancías desea conocer el comportamiento de las llamadas telefónicas durante los meses de marzo y abril del año en curso; por lo que le encomienda a su secretaria que realice esa investigación. La secretaria obtuvo los siguientes datos, en número de llamadas por día: 30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30, 27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52, 56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48.

2. Preguntando el peso a 50 estudiantes de primer año de la secundaria Heroes de la Independencia, se obtuvieron los siguientes datos: 44; 47.2; 45.5; 40; 41.8; 38; 47.6; 40.4; 51; 49.5; 43.5; 54; 39.4; 44.2; 39; 53.6, 40.2; 41.3; 40.2; 55; 40.7; 53; 43.5; 44; 49; 46.4; 41.2; 45; 44.8; 47.1; 49.5; 50.8; 52.3; 39.7; 49; 36; 42.4; 43; 46; 41.5; 40; 48.5; 45.1; 47.2; 49.8; 43; 41.5; 44.9; 40.2; 47.

sábado, 8 de agosto de 2009

Tablas frecuencias sin agrupar

Distribución de frecuencia datos sin agrupar

Son cuadros que facilitan la comprensión y posterior análisis y utilización de los datos. En ella se colocan los posibles valores de la variable y su frecuencia.

Frecuencia (absoluta): es el numero de veces que se repite un mismo dato u observación, se simboliza con f.

Frecuencia relativa: se obtiene dividiendo la frecuencia (f) de cada dato entre el total de datos (n), se representa como f r .

Esta frecuencia también se puede expresar como un porcentaje llamado frecuencia porcentual f p

Ejemplo 1: A un grupo de sexto semestre de preparatoria se le aplico una encuesta sobre la carrera de su preferencia entre Medicina (M), Derecho (D), Contaduría (C), Ingeniería (I) y Administración (A) obteniendo los siguientes datos: I, A, M, D, D, M, A, I, M, C, A, C, I, C, M, C, C, M, C, C, I, C, D, I, I, D, C, M, A, I, M, A, A, C, I, D, C, D, A, M, A, D, C, A, C, A, I, D, C, A.



Ejemplo 2: Al mismo grupo de sexto semestre se le pregunto su calificación en el primer examen parcial de estadística obteniendo los siguientes datos: 7, 8, 6, 9, 10, 10, 6, 7, 8, 7, 8, 8, 8, 7, 6, 9, 7, 8, 8, 10, 9, 7, 7, 9, 9, 7, 8, 8, 7, 7, 8, 8, 8, 9, 6, 10, 8, 7, 9, 8, 7, 6, 10, 7, 7, 8, 7, 8, 9, 8.



Frecuencia acumulada (F): se obtiene sumando las frecuencias de los datos iguales o anteriores al deseado. La ultima frecuencia acumulada debe ser igual al total de datos.

F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
Fn = f1 + f2 +f3+……+ fn = n

Frecuencia relativa acumulada (Fr): se obtiene sumando las frecuencias relativas (o porcentuales) de los datos iguales o anteriores al deseado. La ultima frecuencia relativa acumulada debe ser igual a uno (o cien).

Fr1 = fr1
Fr2 = fr1 + fr2
Fr3 = fr1 + fr2 + fr3
Fn = fr1 + fr2 +fr3+……+ Frn = 1

Para los ejemplos anteriores tendríamos:





Actividad: Construye una distribución que incluya frecuencia absoluta, frecuencia relativa, frecuencia porcentual y las frecuencias acumuladas correspondientes.

1. El director de una escuela está interesado en hacer una promoción de inscripción y necesita saber el número de hermanos que tiene cada uno de los alumnos. Para ello, escoge una muestra al azar de 50 estudiantes, obteniéndose los siguientes datos:1; 2; 0; 3; 0; 1; 1; 2; 3; 4; 0; 1; 3; 2; 1; 1; 1; 0; 2; 1; 3; 5; 6; 1; 1; 2; 4; 2; 1; 1; 1; 2; 0; 3; 1; 2; 1; 2; 4; 5; 3; 3; 5; 6; 0; 0; 3; 2; 2; 3.

2. En una colonia se realizo una encuesta a 35 personas acerca del nivel de inseguridad, entre las opciones de respuesta estaban alta (A), regular (R) y baja (B); obteniendo los siguientes resultados: R, R, B, A, A, R, A, B, R, A, B, R, A, A, B, R, R, R, A, A, A, B, R, R, R, A, A, R, R, R, A, R, R, A, A.

viernes, 7 de agosto de 2009

Diagrama de tallo y hoja

Una vez que se han obtenido los datos, la primera tarea de la Estadística es la de ordenar y resumir los datos de forma que sea mas fácil su análisis e interpretación. Una forma de hacerlo es mediante tablas o distribuciones de diferentes tipos.

Diagrama de tallo y hojas

El diagrama de tallo y hojas es un método de obtener información de manera rápida y visual de los datos obtenidos. Para construirlo basta separar en cada dato el último dígito de la derecha (es la hoja) del bloque de cifras restantes (que forma el tallo). Por ejemplo en el dato 452 la hoja es 2 y el tallo 45.

Ejemplo: los siguientes datos representan la edad de 20 personas encuestadas, representarlas mediante un diagrama de tallos y hojas: 36, 25, 37, 24, 39, 20, 36, 45, 31, 31, 39, 24, 29, 23, 41, 40, 33, 24, 34, 40.

Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas (se anotan verticalmente una vez sin repetirlos), es decir 3, 2, 4 y las reordenamos 2, 3 y 4.

A continuación vamos añadiendo de forma ordenada cada hoja es decir las unidades a su tallo (se anotan horizontalmente tantas veces como aparezcan).

Quedando el diagrama así:

Tallos          Hojas
2               0 3 4 4 4 5 9
3              1 1 3 4 6 6 7 9 9
4               0 0 1 5


Actividad:

1. Realiza un diagrama de tallo y hoja para las siguientes distribuciones de datos:

a) Se realiza un estudio sobre el precio de una bolsa de sopa en veinte tiendas distintas, obteniendo los siguientes datos: 2.50 2.95 2.65 3.10 3.15 3.05 3.05 2.60 2.70 2.75 2.80 2.80 2.85 2.80 3.00 3.00 2.90 2.90 2.85 2.85

b) Las llamadas salientes de un numero de teléfono particular a lo largo de una semana aparecen registradas a continuación:

Lunes 9:02, 11:07, 13:32, 15:07, 16:50, 18:32, 20:07;
Martes 9:37, 12:07, 14:07, 15:50, 17:32, 19:07, 20:50;
Miercoles 10:02, 12:32, 14:20, 16:02, 17:37, 19:20, 20:32;
Jueves 10:07, 12:37, 14:32, 16:07, 17:50, 19:32, 20:20;
Viernes 9:07, 10:32, 13:02, 14:37, 16:20, 18:02, 19:37;
Sabado 10:37, 13:07, 14:50, 16:32, 18:07, 19:50, 21:32;
Domingo 9:24, 11:02, 13:20, 15:02, 16:37, 18:20, 20:02;

jueves, 6 de agosto de 2009

Variables Estadísticas

La variable: es un propiedad, característica o rasgo de los individuos, objetos o grupos de la población que interesa para un determinado estudio científico (es aquello que deseamos estudiar). Por ejemplo:
· Peso y estatura de los alumnos
· Nivel educativo de los trabajadores de una empresa
· Sexo de los asistentes a una conferencia
· Cantidad de enfermos durante una epidemia
· Duración de una pila
· Numero de hijos
· Marca de automóvil mas vendida durante el año

Dato: es el valor que toma la variable en un elemento de la población.

Las variables pueden ser de dos tipos: cualitativa y cuantitativa.

Variable cualitativa:es aquella que busca clasificar o describir mediante una cualidad o un atributo a los miembros de la población (no se pueden medir.) Por ejemplo: color de ojos, sexo, nivel educativo, estado civil, mes de nacimiento.

Variable cualitativa nominal es cuando los datos se agrupan en categorías que no tienen un orden determinado. Por ejemplo: sexo, estado civil, color de ojos.

Variable cualitativa ordinal es cuando los datos se agrupan en categorías que pueden ser ordenadas. Por ejemplo: nivel escolar, mes de nacimiento.

Variable cuantitativa: es aquella cuantifica a los elementos de la población al asociarles un número. Por ejemplo: peso, estatura, numero de hijos, habitantes de una colonia, temperatura.

Variable cuantitativa discreta es cuando el dato solo toma valores enteros (se pueden contar). Por ejemplo: numero de hijos, edad, computadoras vendidas en un año.

Variable cuantitativa continua es cuando el dato puede tomar cualquier valor en un intervalo de números reales (se pueden medir). Por ejemplo: peso, estatura, temperatura.

Actividad: Clasifica las siguientes variables según corresponda en cualitativa (nominal u Ordinal) o en cuantitativa (discreta o continua):

Nacionalidad
Profesión de los padres
Diámetro de un tubo
Carrera que deseas estudiar
Goles anotados en el fútbol
Numero de granos en un elote
Litros de gasolina en el tanque de un auto
Color del cabello
Fecha
Salario de un trabajador
Puesto en una empresa
Pacientes de un hospital
Especialidad del hospital

miércoles, 5 de agosto de 2009

Población y Muestra

Conceptos Preliminares

Población: es un conjunto de personas, objetos o eventos del cual nos interesa conocer alguna propiedad, rasgo, característica o cualidad, para tomar una decisión.

Población finita: es aquella cuando es posible enumerar de forma física a todos los elementos que la componen.

Población infinita: es aquella cuyos elementos son una cantidad ilimitada de manera que no se puede disponer de todos para su estudio.

En la mayoría de los casos las poblaciones son muy grandes por lo que resulta muy costoso estudiarlas, por esta razón se suele recurrir al estudio por medio de muestras.

Muestra: es un subconjunto o parte de la población seleccionada de manera representativa para estudiar la característica deseada de la población.

Existen diversas maneras de seleccionar la muestra:

Muestra Aleatoria: es aquella en la que cada elemento de la población tiene la misma probabilidad de ser escogido. La muestra aleatoria puede ser:

· Sin reposición: cada elemento seleccionado se descarta para la siguiente selección.
· Con reposición: cada elemento seleccionado puede volver a ser escogido.

Muestra Sistemática: es aquella en que el primer elemento se selecciona al azar y a partir de ahí los demás elementos se eligen cada cierto numero k.

Muestra Estratificada: es aquella en que se divide a la población en grupos homogéneos llamados estratos con base a una característica por ejemplo sexo, edad, estado civil, profesión. Se recomienda que la muestra sea proporcional al tamaño de cada estrato respecto a la población.

Muestra Conglomerada: es aquella en la cual se divide a la población en grupos heterogéneos que forman una unidad llamada conglomerado. Dentro de cada grupo se selecciona una muestra aleatoria. Cuando los conglomerados son zonas geográficas se llama muestra por áreas.

Muestra por conveniencia: es aquella en la que el investigador selecciona a los elementos que tienen la característica deseada.

 
Parámetro:  es el valor numérico que resume los datos de la población, este es un valor fijo.

Estadístico: es el valor numérico que resume los datos de la muestra, este es un valor variable.

Ejemplo: Una aseguradora desea conocer el valor promedio de los automoviles de los empleados de una compañia, para lo cual mandan al ajustador al estacionamiento para calcular el valor de los autos que ahi se encuentren y hacer una estimación.

Población: son todos los autos de los empleados de la compañia (finita).
Muestra: los autos que se encuentran en el estacionamiento, es aleatoria.
Variable: valor en pesos de cada auto.
Dato: el valor de un auto en particular por ejemplo $60 0000 pesos
Parámetro: es el promedio del valor de todos los autos de los empleados.
Estadístico: es el valor promedio de todos los autos en la muestra del estacionamiento.

martes, 4 de agosto de 2009

Usos y Abusos de la Estadística

La Estadística es una de las ramas de la matemática con mayor aplicación en nuestra vida cotidiana, ya mencionamos sus múltiples usos en varias ciencias, además comúnmente vemos en periódicos o en televisión tablas y gráficas que hablan de estadísticas, pero alguna vez te has preguntado: ¿cómo se obtuvo esa información? ¿qué tan validas son las cifras que presentan esas tablas y gráficas?


Desafortunadamente la estadística también puede emplearse de forma equivocada, como solía decir Benjamin Disraeli:
 "Hay tres tipos de mentiras: mentiras pequeñas, mentiras grandes y estadísticas"
 
Esto puede ser porque se cometió algún descuido o error al manejar la información o bien por la intención de manipular la información y engañar a las personas. Si bien es difícil saber cuál de ambas situaciones se presenta, a continuación revisaremos algunos de los principales abusos al realizar un estudio estadístico:
 

  • Selección de muestras erróneas: son muestras donde los elementos seleccionados no representan al total de la población y por lo tanto las conclusiones no corresponden a la realidad. Ejemplo de esto son las encuestas telefónicas o por internet.

En un programa de televisión un conductor leyó una encuesta que afirmaba que el 99% de los mexicanos tenían televisión después de leer la cifra el conductor exclamo “esto no puede ser posible ya que hay miles que ni luz eléctrica tienen mucho menos una tele” (la encuesta fue realizada por teléfono).

  • Muestras pequeñas: imagina que quieres saber la opinión de los demás sobre ti, y para ello entrevistas a tus amigos, seguramente los resultados serán favorables pero no necesariamente completos. Tal vez deberías preguntarle también a tus familiares, vecinos, compañeros y maestros para tener mejor información. Lo mismo pasa en las muestras entre más grandes mejor será la información.

  • Gráficas engañosas: las gráficas (principalmente de barras y circulares) pueden modificarse para resaltar ciertos datos y/o ocultar otros. Al ser un medio visual se genera una impresión engañosa, por ello es importante analizar la información numérica y ver que corresponda con la imagen.


  • Preguntas orientadas: en ocasiones las preguntas están redactadas para generar una cierta respuesta en el entrevistado. Compara las siguientes dos preguntas:
- ¿Estás de acuerdo con aumentar la tarifa del metro a 5 pesos?

- Si el gobierno se compromete a poner más trenes en servicio, a que se reduzcan las aglomeraciones, los tiempos de espera y se pueda viajar con ventilación y seguridad, ¿estaría dispuesto a pagar 5 pesos?

Verdad que todo depende de cómo se escriba.
 
  • Correlación y Causa: en muchas investigaciones se busca estudiar la relación entre dos variables pero algunos tratan de hacer parecer que una de ellas es la causa de la otra. Hace unos días un estudio en una revista de medicina establecía que los países que consumen más chocolate tienen más premios nobel” entonces podríamos concluir que el chocolate hace más inteligente a las personas (sinceramente lo dudo, pero por si acaso antes de hacer un examen no te olvides de llevar tu caja de chocolates).

Con lo que hasta ahora has estudiado podrás analizar ciertos aspectos a fin de establecer que tan válido o confiable es un estudio o noticia que presente estadísticas. Para finalizar disfruta del siguiente video que muestra de forma muy divertida algunos de estos usos y abusos.


lunes, 3 de agosto de 2009

Ramas de la estadistica y aplicaciones

Estadística

Es una parte de la Matemática aplicada que nos proporciona instrumentos para recopilar, organizar, presentar, analizar, interpretar datos y hacer predicciones para tomar decisiones sobre determinados hechos, fenómenos o problemas.

Para el estudio de un hecho o problema se consideran tres etapas fundamentales:

• Planear la búsqueda y la obtención de la información.
• Organizar y presentar la información de tal forma que se pueda analizar con facilidad.
• Efectuar inferencias y tomar decisiones sobre la realidad a partir de la información obtenida.

La estadística se divide en:

Estadística Descriptiva: es la parte de la estadística que se encarga de recolectar, clasificar, organizar, resumir, presentar y analizar en forma descriptiva sin sacar conclusiones de tipo general.

Estadística Inferencial: es la parte de la estadística, cuyo propósito es inferir o deducir conclusiones y predicciones con respecto a una población en estudio a partir de la información de una muestra. Para asegurar la validez de las inferencias utiliza las probabilidades.

Estas dos partes de la estadística no son excluyentes ya que para utilizar los métodos de la estadística inferencial, se requiere conocer los métodos de la estadística descriptiva.


Aplicaciones de la Estadística

La importancia de la Estadística radica en sus aplicaciones en varios campos de la ciencia, la tecnología y la sociedad. Algunos ejemplos son:

En Política
· Conocer la preferencia de los electores por un candidato.
· Diseñar una campaña política.

El Gobierno
· Planear programas sociales de salud, educación, servicios.

La Economía
· Dar a conocer los índices económicos relativos a la producción, a la mano de obra, índices de precios para el consumidor.
· Predecir las fluctuaciones del mercado bursátil, las tasas de interés, el índice de inflación, el costo de la vida.
· Determinación de las variaciones de precios y salarios.
· Determinar el poder adquisitivo de la población.

El Comercio
· Lanzamiento de un producto comercial nuevo.
· Diseño de campañas publicitarias.

La Demografía
· Registro de nacimientos , muertes, matrimonios, divorcios, inmigración, emigración.

La Sicología
· Estudios de comportamiento.
· Pruebas de aptitud e inteligencia.

La Biología
· Evolución de las poblaciones.
· Estudios genéticos.

Los Deportes
· Conocer el rendimiento de un equipo o de los jugadores.

La Medicina
· Probar la eficiencia de un medicamento o producto medico.
· Realizar el diagnóstico de enfermedades.
· Planificar los programas de salud pública.

La Contabilidad
· Realizar auditorias por métodos de muestreo, para examinar el estado contable de una determinada institución o dependencia de Estado.

La Sociología
· Estudiar y comparar distintos grupos sociales.

La Industria
· Planeación de la producción.
· Control de calidad.
· Manejo de almacén.

La Educación
· Mejorar los métodos de enseñanza y evaluación.
· Conocer las características de los alumnos.
· Asignación de presupuestos a las escuelas.
· Apertura de escuelas, contratación de maestros, actualización de carreras.

La Lingüística
· Estudiar la evolución del idioma.
· Agregar nuevas palabras y desaparecer otras en desuso.

En el siguiente video podemos ver otros campos en los que la estadística se aplica, ya sea en la ciencia o en la vida cotidiana.



Actividad: Escribe en que áreas o actividades cotidianas has empleado la estadística.

domingo, 2 de agosto de 2009

Introducción

Introducción

Contesta las siguientes preguntas:

¿Qué es la estadística?

¿Que estudia la estadística?

¿Para que sirve la estadística?

¿Cuáles son las ventajas y desventajas de usar la estadística?

Menciona 4 ejemplos del uso de la estadística en la vida cotidiana

¿En nuestro país que organismo de gobierno se encarga de realizar estudios estadísticos?

Actividades:

1. Recorta en un periódico o revista 3 artículos donde se use la estadística.
2. Investigar ¿que es el INEGI?, ¿cuales son sus funciones?, ¿cuál es su misión y visión? ¿qué estudios estadísticos realiza?

Inegi