domingo, 19 de enero de 2014

Simuladores Estadística y Probabilidad


Hola alumnos paseando por la red, me encontré con unos excelentes simuladores que les serán muy útiles para resolver sus tareas.

El primero es para elaborar tablas y gráficas estadísticas: Tablas y Gráficas
El segundo es para medidas centrales, de variación y de forma: Medidas Descriptivas
El tercero es para distribución de probabilidades: Distribuciones de probabilidad

sábado, 18 de enero de 2014

Distribución de probabilidad Exponencial

La distribución exponencial aborda fenómenos cuya probabilidad se refiere a tiempo y distancias entre la ocurrencia de experimentos con respecto a un intervalo continuo.

Al estudiar la distribución de Poisson calculamos la probabilidad de que un evento ocurriera x veces durante un periodo de tiempo o espacio. Sin embargo en muchas aplicaciones la variable aleatoria de interés es la cantidad de tiempo o de espacio entre la ocurrencia de los eventos, por ejemplo el tiempo antes de la llegada del primer cliente al mostrador, la distancia entre dos averías en una carretera, etc., en este caso se dice que la variable sigue una función de densidad de probabilidad exponencial.

La función de densidad de la distribución exponencial esta generada por la fórmula :
La media de la distribución exponencial λ es el recíproco de la media μ de la distribución de Poisson, lo cual tiene sentido ya que si en la unidad de tiempo ocurren en promedio μ eventos entonces el tiempo promedio de separación entre cada evento es de 1 / μ = λ.

Su gráfica tiene la siguiente forma:



 
 
 
Distribución de probabilidad exponencial

Sea λ el tiempo o espacio promedio entre eventos, la probabilidad de que un suceso ocurra o no ocurra dentro del intervalo X0 es:
Donde:    λ =  valor medio entre eventos,     X0 = valor dado del intervalo,     e    = 2.7182…
La media y desviación estándar de la distribución exponencial tienen el  mismo valor:
Media = Desviación estándar  = λ

Ejemplo 1. Sea la variable x el tiempo para cargar un camión, el cual sigue una distribución exponencial con un tiempo promedio de 15 minutos. Calcular la probabilidad de que la carga de un camión tarde

a) menos de 10 minutos
Sea λ= 15 minutos,  X0 = 10 minutos


b) más de 18 minutos
Sea λ = 15 minutos,  X0 = 18 minutos.


c) Entre 8 y 12 minutos
Calculamos cada extremo por separado

El resultado es p (8 < x < 12) = p(x < 12) – p(x < 8) = 0.5507 – 0.4114 = 0.1393

d) La media y la desviación estándar
Media  = λ = 15       ,       Desviación estándar  σ = 15      

Ejemplo 2. Se ha comprobado que el tiempo de vida de una maquina sigue una distribución exponencial con media de 8 años.

a) ¿Cuál es la probabilidad de que a una maquina nueva dure menos de 12 años?
Sea λ = 8 años,  X0 = 12 años.

b) ¿cuál es la probabilidad de que le dure  más de 10 años?

c) ¿Cuál es la probabilidad de que le dure entre 5 y 17 años?

El resultado es p (5 < x < 17) = p(x < 17) – p(x < 5) = 0.8806 – 0.4648 = 0.4158

Ejercicios.

1. En una preparatoria el tiempo de recorrido promedio que realizan los alumnos de su casa a la escuela es de 36.5 minutos. Si este tiempo sigue una distribución de probabilidad exponencial, calcule la probabilidad de que un alumno
a) necesite entre 20 y 40 minutos para llegar a la escuela
b) necesite más de 40 minutos para llegar a la escuela

2. Se sabe que una colonia el gasto mensual de agua por familia tiene una distribución exponencial con media de 20 metros cúbicos.
a) ¿Cuál es la probabilidad de que una familia consuma menos de 15 metros cúbicos al mes?
b) ¿Cuál es la probabilidad de que el consumo mensual de agua de una familia rebase los 40 metros cúbicos?
c) ¿Cuál es la probabilidad de que el consumo mensual de agua de una familia sea de 30 a 50 metros cúbicos?

3. El tiempo de vida en horas de un dispositivo electrónico es una variable aleatoria exponencial con una media de 50 horas. Calcular la probabilidad de que un dispositivo:
a) falle en las primeras 25 horas de funcionamiento
b) funcione 100 o más horas sin fallar

Fuentes consultadas de donde se tomaron algunos ejemplos:
Anderson, D. (2008). Estadística para administración y economía. Cengage Learning Editores, México, D. F.
Levin, R. (2004). Estadística para administración y economía. Pearson Educación, México, México, D. F.
Mendenhall, W. (2010). Introducción a la probabilidad y estadística. Cengage Learning Editores, México, D. F.
Wackerly, D. (2010). Estadística matemática con aplicaciones. Cengage Learning Editores, México, D. F.
Walpole, R. (2012). Probabilidad y estadística para ingeniería y ciencias. Pearson Educación, México, México, D. F.

viernes, 17 de enero de 2014

Distribución de probabilidad Normal

Una distribución de probabilidad continua sumamente importante es la distribución normal, también conocida como distribución gaussiana en honor al matemático Karl Gauss. Existen dos razones fundamentales por las cuales la distribución normal ocupa un lugar tan prominente en la estadística:
  • Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras.
  • Se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas (peso, altura, coeficiente intelectual), resultados de procesos físicos (dimensiones y rendimientos), y muchas otras medidas de interés para los administradores, tanto en el sector público como en el privado.
La función de densidad normal esta generada por la fórmula:
Donde x es el valor de la variable aleatoria normal, μ es la media poblacional, σ es la desviación estándar poblacional, e = 2.7182..  y π = 3.1415…
Su grafica llamada curva normal tiene forma de campana por lo que se le conoce como campana de Gauss.
A pesar de la utilidad de la curva normal resulta impráctico construir una tabla de áreas para cada valor de la media y la desviación estándar, por lo que se suele emplear un procedimiento llamado estandarización que nos permite usar una única tabla para todas las distribuciones normales.
La distribución de probabilidad Normal Estándar
Una variable aleatoria normal X está estandarizada si expresamos su valor como el número de desviaciones estándar que se encuentran a la izquierda o derecha de su media. La variable aleatoria normal estandarizada z, se define como:
Dónde:
x = valor variable aleatoria normal X                  z = valor variable aleatoria normal estándar Z            
μ = media de la distribución normal                    σ = desviaciones estándar de la distribución
En términos sencillos la estandarización es un cambio de unidades de x a z, como si convirtiéramos de pulgadas a metros, o de horas a segundos. Con la ventaja de que se emplea una única tabla para calcular la probabilidad. 
Manejo de la tabla normal estándar
Supongamos que queremos calcular la probabilidad de que z este entre 0 y 2.24 es decir p (0 < z < 2.24)
En la tabla normal estándar buscamos primero el renglón correspondiente a 2.2, y en la columna superior buscamos las centésimas 0.04; la intersección nos da un el área de 0.4875 que es la probabilidad buscada:
p (0 < z  < 2.24) = 0.4875
Los valores negativos de z se buscan de la misma manera ya que la curva es simétrica, entonces
p (-2.24 < z  < 0) = 0.4875
Ejemplo 1. El tiempo de revelado de una fotografía sigue una distribución normal con media de 16.2 segundos y desviación estándar de 0.52 seg. Encontrar la probabilidad de que el tiempo de revelado requerido para una fotografía sea de:
a) mayor de 17 segundos
Sean  x = 17,  μ = 16.2,  σ = 0.52, sustituyendo en la fórmula   
b) mayor de 15 segundos
Sean  x = 15,  μ = 16.2,  σ = 0.52, sustituyendo en la fórmula   
c) Entre 16 y 17 segundos
En este caso tenemos dos valores, sean  x1 = 16,  x2 = 17, μ = 16.2,  σ = 0.52, calculamos dos z
d) Entre 17 y 18 segundos
En este caso tenemos dos valores, sean  x1 = 17,  x2 = 18, μ = 16.2,  σ = 0.52, calculamos dos z

Al calcular probabilidades con la tabla normal estándar podemos tener alguno de los siguientes cinco casos:
 

Aproximación de la binomial con la normal

La evaluación de una función de probabilidad binomial, a mano o con una calculadora, se dificulta cuando el número de ensayos es muy grande.
Sin embargo cuando n es lo suficientemente grande (n > 30), la gráfica de la distribución de probabilidad binomial se aproxima a la curva normal, por lo que es razonable usar la distribución normal para calcular una probabilidad binomial con una buena aproximación.
En general se usar esta aproximación cuando:
        (n)(p) ≥ 5     y        (n)(q) ≥ 5

Como estamos usando una distribución continua para aproximar una distribución discreta, se aplica un factor de corrección por continuidad el cual consiste en tomar 0.5 a la izquierda y/o a la derecha del valor de x segun corresponda (esto es semejante a los límites reales al construir el histograma en estadística).

Ejemplo 2. Una empresa manufacturera sabe por experiencia que 15% de sus artículos tienen algún defecto. Se toma una muestra de 100 artículos y desea calcular la probabilidad de que:


a) más de 20 sean defectuosos
Sea la variable aleatoria X: número de artículos defectuosos, entonces:
n = 100,  éxito: sea defectuoso con p = 15% = 0.15,  fracaso: este bien con q = 1 - 0.15 = 0.85
Calcular esta probabilidad usando la binomial implica aplicar la formula mínimo 20 veces, lo cual es algo laborioso, intentemos usar la distribución normal. Primero verificamos que se cumplan las condiciones (n)(p) = (100)(0.15) = 15 ≥ 5     y   (n)(q) = (100)(0.85) = 85 ≥ 5.

Primero calculamos la media y desviación estándar


Dado que nos piden x > 20 tomamos medio punto antes, nos queda x > 19.5
 
b) Exactamente 12 sean defectuosos
En las distribuciones continuas las probabilidades se calculan como áreas bajo la curva, por lo tanto  la probabilidad de un solo valor de la variable aleatoria es cero. En este caso tomamos medio punto antes y medio punto después de 12.
Sean  x1 = 11.5,  x2 = 12.5, μ = 15,  σ = 3.57, calculamos dos valores de z
 
c) menos de 18 sean defectuosos
Dado que nos piden x < 18 tomamos medio punto después, nos queda x < 18.5
 
Ejercicios.
1. Un estudio revelo que las horas quincenales que se conectan los jóvenes en internet sigue una distribución normal con una media de 77 horas y una desviación estándar de 20 horas. Calcular la probabilidad de que un joven seleccionado al azar:
a) Se conecte más de 70 horas a Internet
b) Se conecte menos de 50 horas a Internet
c) Se conecte de 40 a 80 horas
d) Se conecte de 85 a 100 horas
 2. Las barras de pan de una cierta marca tienen una longitud promedio de 30 centímetros y una desviación estándar de 2 centímetros. Si se supone que las longitudes están distribuidas normalmente, ¿qué porcentaje de las barras son
a) más largas que 31.7 centímetros?
b) de entre 29.3 y 33.5 centímetros de longitud?
c) más cortas que 25.5 centímetros?
3. Un paciente que sufre un trasplante tiene 0.4 de probabilidad de ser compatible. Si se sabe que 100 personas recibieron algún trasplante, ¿cuál es la probabilidad de que sean compatibles:
a) menos de 30?
b) más de 50?
c) de 30 a 50?
4. Los reportes del alcoholímetro indican que en fin de semana uno de cada 10 conductores no pasa la prueba. Si en un fin de semana se revisan 400 conductores al azar, calcular la probabilidad de que no pasen la prueba:
a) menos de 32
b) más de 49
c) entre 35 y 47

Fuentes consultadas de donde se tomaron algunos ejemplos:

Anderson, D. (2008). Estadística para administración y economía. Cengage Learning Editores, México, D. F.
Levin, R. (2004). Estadística para administración y economía. Pearson Educación, México, México, D. F.
Mendenhall, W. (2010). Introducción a la probabilidad y estadística. Cengage Learning Editores, México, D. F.
Wackerly, D. (2010). Estadística matemática con aplicaciones. Cengage Learning Editores, México, D. F.
Walpole, R. (2012). Probabilidad y estadística para ingeniería y ciencias. Pearson Educación, México, México, D. F.

jueves, 16 de enero de 2014

Distribución de probabilidad Continua Uniforme

Distribuciones Continuas de Probabilidad

Hasta ahora hemos trabajado con distribuciones de probabilidad para variables aleatorias discretas, las cuales se caracterizan por tomar un número finito de valores, asignar una probabilidad positiva a cada valor y que la suma de todas las probabilidades sea igual a 1. Sin embargo las variables aleatorias continuas deben tratarse de manera diferente.

Una variable aleatoria continua  es aquella que puede tomar cualquier valor dentro de un intervalo, esto implica que existe un número infinito de valores que la variable puede tomar, para darnos una idea de su comportamiento veamos la siguiente figura:
 








En la primera figura la variable aleatoria X (eje horizontal) toma pocos valores y su gráfica tiene la forma de un histograma, pero a medida que aumenta la cantidad de valores de la variable la amplitud de los intervalos se van haciendo cada vez más estrecha y el histograma adquiere la forma de una curva, esta curva describe la distribución de probabilidad de la variable aleatoria continua.

La curva que describe la probabilidad  de la variable aleatoria continúa X, es descrita mediante una fórmula matemática llamada función de densidad de probabilidad representada por f(x). La diferencia con la distribución de probabilidad es que la función de densidad de probabilidad calcula el área bajo la curva de f(x)  en un intervalo determinado.

 Para variables aleatorias continuas

          Área bajo la curva entre a y b
                               =
Probabilidad valor x este entre (a, b)



La función de densidad de probabilidad tiene las siguientes propiedades:
 
1. P(X = x) = 0    la probabilidad de cualquier valor determinado de la variable aleatoria es cero.
 
2. El área bajo la curva de una distribución continua de probabilidad es igual a 1.

Distribución Continua Uniforme

Si una variable aleatoria X puede tomar cualquier valor en un intervalo y además cada subintervalo tiene la misma probabilidad que cualquier otro subintervalo de igual longitud, se dice entonces que la variable aleatoria X tiene una distribución de probabilidad uniforme.

La probabilidad de que la variable aleatoria X este en el intervalo c < x < d está dada por:

Dónde:
a = Valor mínimo de la distribución.                          b = Valor máximo de distribución
c = Valor mínimo del subintervalo                             d = Valor máximo del subintervalo
 

La media y la varianza de la distribución uniforme son:
 
Ejemplo 1. La cantidad de litros de café diarios que sirve una máquina en el vestíbulo de un aeropuerto es una variable aleatoria X que tiene una distribución continua uniforme de 7 a 10 litros. Calcule la probabilidad de que en un día la cantidad de café que sirve esta máquina sea:
a) más de 7.4 litros pero menos de 9.5 litros
Establecemos los valores de la distribución y del subintervalo  a = 7  ,   b = 10  ,   c = 7.4  ,  d = 9.5
 
 
 
 
 b) a lo más 8.8 litros




 c) al menos 8.5 litros




d) La media y la desviación estándar
 





Ejemplo 2. Al cotizar los costos para transportar un embarque, una empresa fabricante de microcomputadoras encuentra que los costos están uniformemente distribuidos entre 20 y 25 mil pesos. Encuentre la probabilidad de que el costo

a) esté por debajo de $22,000.
Sean  a = 20 mil ,   b = 25 mil ,   c = 20 mil,  d = 22 mil




b) sea de más de $24,000.
Sean  a = 20 mil ,   b = 25 mil ,   c = 24 mil,  d = 25 mil




c) sea de $21 mil a $22,500
Sean  a = 20 mil  ,   b = 25 mil ,   c = 21 mil,  d = 22.5 mil




d) La media y la desviación estándar


 
 
Ejercicios.

1. Suponga que quiere comprar un terreno y sabe que también hay otros compradores interesados. Las ofertas X es una variable aleatoria que está uniformemente distribuida entre 10 000 y 15 000 pesos.
a) si ofreces 12 000 ¿Cuál es la probabilidad de que tu oferta sea aceptada?
b) si ofreces 14 000 ¿Cuál es la probabilidad de que tu oferta sea aceptada?
c) la media y la desviación estándar

 
2. Un autobús llega cada 10 minutos a una parada, Se supone que el tiempo de espera para un individuo en particular es una variable aleatoria con distribución continua uniforme.
a) ¿Cuál es la probabilidad de que el individuo espere más de 7 minutos?
b) ¿Cuál es la probabilidad de que el individuo espere entre 2 y 7 minutos?
 
3. Una compañía productora de acero corta y vende tubos con medidas que van de 1 a 5 metros, estas medidas son las más demandadas en el mercado:
a) ¿Cuál es la medida promedio de un tubo?
b) ¿Cuál es la probabilidad de que un tubo sea mayor de 3 metros?
c) ¿Cuál es la probabilidad de que un tubo sea menor de 4 metros?
 
Fuentes consultadas de donde se tomaron algunos ejemplos:
Anderson, D. (2008). Estadística para administración y economía. Cengage Learning Editores, México, D. F.
Levin, R. (2004). Estadística para administración y economía. Pearson Educación, México, México, D. F.
Mendenhall, W. (2010). Introducción a la probabilidad y estadística. Cengage Learning Editores, México, D. F.
Wackerly, D. (2010). Estadística matemática con aplicaciones. Cengage Learning Editores, México, D. F.
Walpole, R. (2012). Probabilidad y estadística para ingeniería y ciencias. Pearson Educación, México, México, D. F.

miércoles, 15 de enero de 2014

Distribución de probabilidad Geométrica

Sea un experimento con las mismas características del binomial es decir que este experimento comprende repeticiones idénticas e independientes, cada repetición tiene dos resultados (éxito o fracaso), la probabilidad de éxito es igual a p y la de fracaso es q, y son las mismas en cada repetición.

Pero ahora la variable aleatoria que nos interesa X es en que repetición ocurre el primer éxito, es decir que se repite el experimento hasta obtener el primer éxito, en esta situación se dice que la variable aleatoria sigue una distribución geométrica.

Analicemos un poco la situación en términos de éxito, fracaso y sus probabilidades p y q:

# de intento
Resultado
Probabilidad
1
E
p
2
F E
q p
3
F F E
(q) (q) (p) = q2 p
4
F F F E
(q) (q) (q) (p) = q3 p
.
.
.
.
.
.
x
F F F F ….E
(q) (q) (q)…. (p) = q x - 1  p

La probabilidad de que el primer éxito ocurra en el x-ésimo intento está dada por:

x  = número de intento en que se da el primer éxito          
p = probabilidad de éxito                                              q = probabilidad de fracaso

La media (esperanza) y desviación estándar de la distribución geométrica están dadas por:

Ejemplo 1. Se sabe que en cierto proceso de fabricación uno de cada 100 artículos resulta defectuoso.

a) ¿Cuál es la probabilidad de que al inspeccionar un lote el quinto artículo que se inspecciona sea el primer defectuoso que se encuentra?
Sea la variable aleatoria X: intento en que sale el primer defectuoso. Entonces x = 5,
Éxito: articulo sea defectuos, p = 1/100 = 0.01,  fracaso: articulo este bien, q = 1 - 0.01 = 0.99



b) La media y la desviación estándar

 
Ejemplo 2. En horas de alta demanda un conmutador telefónico se satura por lo que los usuarios tienen dificultad para hacer sus llamadas, si la probabilidad de que una llamada entre al conmutador es de 0.05 determine la probabilidad de que una persona logre comunicarse en:

a) su tercer intento
Sea la variable aleatoria X: intento en que entra la llamada, entonces x = 3,
Éxito: llamada entre con p = 0.05,  fracaso: no entre llamada con q = 1 - 0.05 = 0.95


 
b) su octavo intento



c) la media y la desviación estándar

 
Ejercicios.

1. La probabilidad de que una persona que estudia la carrera de piloto privado apruebe el examen escrito para obtener la licencia es de 0.7. Calcule la probabilidad de que cierto estudiante apruebe el examen
a) en su primer intento
b) en el segundo intento
c) antes del cuarto intento
d) la media y la desviación estándar

2. De una población de consumidores, 60% tienen fama de preferir una marca particular, A, de pasta dental. Si se entrevista a un grupo de consumidores escogidos al azar, calcule la probabilidad de que el primer consumidor que prefiera la marca A sea
a) la quinta persona
b) la tercera persona
c) la sexta persona
d) la media y la desviación estándar
 
3. Un contador público ha encontrado que tres de cada cinco diez compañías auditadas contienen errores importantes. Si el contador hace auditoría a una serie de empresas, ¿cuál es la probabilidad de que la primera cuenta que contenga errores importantes sea:
a) la tercera en ser auditada?,
b) la quinta cuenta auditada?
c) ¿Cuáles son la media y la desviación estándar del número de cuentas que deben ser examinadas para hallar la primera con errores importantes?

Fuentes consultadas de donde se tomaron algunos ejemplos:
Anderson, D. (2008). Estadística para administración y economía. Cengage Learning Editores, México, D. F.
Levin, R. (2004). Estadística para administración y economía. Pearson Educación, México, México, D. F.
Mendenhall, W. (2010). Introducción a la probabilidad y estadística. Cengage Learning Editores, México, D. F.
Wackerly, D. (2010). Estadística matemática con aplicaciones. Cengage Learning Editores, México, D. F.
Walpole, R. (2012). Probabilidad y estadística para ingeniería y ciencias. Pearson Educación, México, México, D. F.