martes, 14 de enero de 2014

Distribución de probabilidad Hipergeométrica

Supongamos que tenemos una población de tamaño N y de ella se selecciona una muestra de tamaño n para verificar si cada elemento tiene o no una cierta característica, esto se puede manejar en términos de éxito y de fracaso. Si el tamaño de la muestra n es pequeño en comparación con el tamaño de la población N ( n / N ≤ 0.05 ) podemos considerar los intentos como independientes y asumir que probabilidad de obtener un éxito en un elemento es la misma en cada intento, por lo que podemos aplicar la distribución binomial.

Sin embargo si el tamaño de la muestra n es grande en comparación con el tamaño de la población N entonces la probabilidad de obtener un éxito en un intento se ve afectada por los resultados en intentos anteriores es decir que son dependientes. Cuando pasa esto el número x de éxitos sigue lo que se conoce como una distribución hipergeométrica de probabilidad.

Es importante remarcar que tanto la distribución binomial como la distribución hipergeométrica persiguen un mismo objetivo (el número de éxitos en una muestra que contiene n observaciones), la diferencia entre ellas es que la hipergeométrica considera no solo a los elementos de la muestra, sino también a los elementos de la población.

En resumen la distribución hipergeométrica es aquella en la que se considera la existencia de éxitos y/o fracasos en una población conocida, y de la cual se extrae una muestra sin remplazo donde también existen éxitos o fracasos.

Su principal aplicación es en el muestreo de aceptación y control de calidad donde de un lote de artículos se toma una muestra y se analiza para decidir si se acepta o rechaza todo el lote.

Distribución de probabilidad hipergeométrica

Si en una población de N elementos se tienen k éxitos, la probabilidad de que en una muestra aleatoria de n elementos seleccionados sin reemplazo se tengan x éxitos está dada por:






 
N = número de elementos en la población                 n = número de elementos en la muestra          
k = número de éxitos en la población                         x = número de éxitos en la muestra
La media (esperanza) y desviación estándar de la distribución hipergeométrica están dadas por:







Ejemplo 1. De un grupo de 10 personas se sabe que siete practican el futbol y tres el básquetbol. Si se toma una muestra aleatoria de tres de estas personas. Calcular la probabilidad de que

a) exactamente dos practiquen futbol
Sea la variable X el número de personas que practican futbol, entonces
N = 10 (tamaño población),   n = 3 (tamaño muestra),  k = 7 (éxitos población),  x = 2 (éxitos muestra)



 

b) todos practiquen futbol
N = 10 (tamaño población),   n = 3 (tamaño muestra),  k = 7 (éxitos población),  x = 3 (éxitos muestra)

c) la media y la desviación estándar



 
 
 
 
Ejemplo 2. Una caja contiene 24 artículos de las cuales se sabe que 8 tienen algún defecto, si en una inspección de calidad el inspector selecciona al azar 6 piezas, hallar la probabilidad de que:

a) encuentre uno defectuoso
Sea la variable X el número de artículos defectuosos, entonces
N = 24 (tamaño población),   n = 6 (tamaño muestra),  k = 8 (éxitos población),  x = 1 (éxitos muestra)

b) la caja sea rechazada (esto sucede si se encuentran dos o  más artículos defectuosos en la muestra)
Nos piden la probabilidad de dos o más es decir X= 2, 3, 4, 5 y 6, por simplicidad calculamos su complemento es decir X= 0 y 1, y como ya tenemos la de X = 1 solo nos falta la de X = 0.




La probabilidad de (X ≥ 2) = 1 - 0.2596 – 0. 0595 = 0.6809  (es muy probable que sea rechazada)

c) la media y la desviación estándar


Calculo de probabilidades hipergeométricas con Excel

La hoja de cálculo de Excel también nos permite calcular la probabilidad hipergeométrica realizando los siguientes pasos:
1. Abrir Excel y vamos al menú de fórmulas
2. Damos clic a la opción de más funciones y seleccionamos estadísticas
3. Desplazamos el menú que se abre hacia abajo hasta localizar la función DISTR.HIPERGEOM.N
4. En la ventana que se abre introducimos los valores de n en población, k en población éxito, n en muestra y x en muestra éxito, en la parte de acumulado escribimos falso para que nos dé únicamente el valor de x



Tomando el ejemplo 1 inciso a, con  N = 10,   n = 3, k = 7 y x = 2


Obtenemos un resultado de  0.525 que es prácticamente igual al resultado que obtuvimos usando la fórmula.







Ejercicios.

1. De un lote de 10 misiles, se seleccionan 4 al azar y se disparan. Si el lote contiene 3 misiles defectuosos que no pueden dispararse, ¿cuál es la probabilidad de que
a) los 4 puedan dispararse
b) a lo más fallen 2
c) la media y la desviación estándar

2. De un grupo de 20 candidatos para un puesto 5 cuentan con experiencia previa, si se eligen 10 candidatos al azar, calcular la probabilidad de que
a) se incluya a los 5 con experiencia previa
b) no se incluya a ninguno con experiencia
c) se incluya a más de 2 con experiencia
d) la media y la desviación estándar

3. Un almacén contiene diez máquinas impresoras, cuatro de las cuales son defectuosas. Un cliente adquiere cinco de las máquinas al azar pensando que todas están en buenas condiciones. Cuál es la probabilidad de que:
a) una sea defectuosa
b) más de una sea defectuosa
c) Calcular la media y desviación estándar

4. De una baraja inglesa de 52 cartas, se toman 5 en una mano de póquer ¿cuál es la probabilidad de que a un jugador le toquen
a) exactamente cuatro ases?
b) al menos 1 de ellas sea una reina?

Fuentes consultadas de donde se tomaron algunos ejemplos:
Anderson, D. (2008). Estadística para administración y economía. Cengage Learning Editores, México, D. F.
Levin, R. (2004). Estadística para administración y economía. Pearson Educación, México, México, D. F.
Mendenhall, W. (2010). Introducción a la probabilidad y estadística. Cengage Learning Editores, México, D. F.
Wackerly, D. (2010). Estadística matemática con aplicaciones. Cengage Learning Editores, México, D. F.
Walpole, R. (2012). Probabilidad y estadística para ingeniería y ciencias. Pearson Educación, México, México, D.F.

12 comentarios :

  1. Buenas tardes, de casualidad tiene el ejercicio #1 resuelto? El de los 10 misiles, por favor.

    ResponderEliminar
    Respuestas
    1. a) los 4 puedan dispararse, si k representa los misiles defectuosos que todos se disparen implica x=0
      N= 10 , n= 4 , k= 3 , x= 0
      p(x=0) = 3C0 * 7C4 / 10C4 = (1 * 35) / 210 = 0.1666

      b) a lo más dos fallen , es decir que fallen 0, o 1 o 2
      N= 10 , n= 4 , k= 3 , x= 0 p(x=0) = 3C0 * 7C4 / 10C4 = (1 * 35) / 210 = 35 / 10 = 0.1666
      N= 10 , n= 4 , k= 3 , x= 1 p(x=1) = 3C1 * 7C3 / 10C4 = (3 * 35) / 210 = 105 / 210 = 0 0.5
      N= 10 , n= 4 , k= 3 , x= 2 p(x=2) = 3C2 * 7C2 / 10C4 = (2 * 21) / 210 = 42 / 210 = 0.2
      P(x<= 2) = 0.1666 + 0.5 + 0.2 = 0.8666

      c) media m= 4*(3 / 10) = 4 * 0.3 = 1.2 misiles

      desviación = raiz ( 1.2) * ( (10 - 3 ) / 10 ) * ( (10 - 4) / (10 - 1) ) = raiz (1.2) * (7 / 10) * (6 / 9) =
      raiz (1.2) * (0.7) * (0.666) = raiz (0.56) = 0.74 misiles



      Eliminar
  2. COLABORENME CON LOS DEMASPUNTOS EL DE LOS CANDIDATOS, ALMACEN Y BARAJAS .SIIIIIIIIIIIII

    ResponderEliminar
  3. Candidatos N= 20, n=10, k candidatos con experiencia = 5
    a) se incluya a los 5 con experiencia previa
    p(x=5)= 5C5 * 15C5 / 20C10 = (1)(3003)/184756 = 0.016


    b) no se incluya a ninguno con experiencia
    p(x=0)= 5C0 * 15C10 / 20C10 = (1)(3003)/184756 = 0.016

    c) se incluya a más de 2 con experiencia , X= 3,4,5.....10
    p(x=0)= 5C0 * 15C10 / 20C10 = (1)(3003)/184756 = 0.016
    p(x=1)= 5C1 * 15C9 / 20C10 = (5)(5005)/184756 = 0.135
    p(x=2)= 5C2 * 15C8 / 20C10 = (10)(6435)/184756 = 0.348

    p(x>2)= 1-p(x=0)- p(x=1)- p(x=2)= 1- 0.016 - 0.135 - 0.348 =0.501

    d) la media y la desviación estándar
    media = 10(5/20)= 2.5
    desviación raiz de(2.5)((20-5)/20)((20-10/20-1)) = raiz(2.5)(15/20)(10/19) = raiz de 0.9868 = 0.993

    ResponderEliminar
    Respuestas
    1. que significa C y porque dices 5C1 no entiendo

      Eliminar
    2. La C significa combinaciones y 5C1 representa las combinaciones de un grupo de 5 elementos seleccionando solamente a 1

      Eliminar
  4. c= combinación y se encuentra en tu calculadora científica = shift + nCr

    ResponderEliminar
    Respuestas
    1. Este comentario ha sido eliminado por un administrador del blog.

      Eliminar
  5. Buenas Noches Me podrian colaborar con el punto 3 y 4 por favor

    ResponderEliminar
    Respuestas
    1. Ejercicio 3
      Impresoras N= 10, n=5, k defectuosas= 4
      a) se incluya 1 defectuosa
      p(x=1)= 4C1 * 6C4 / 10C5 = (4)(15)/252 = 0.238

      b) más de 1 defectuosa
      Nos piden la probabilidad de X= 2, 3, 4, 5, por simplicidad calculamos su complemento es decir X= 0 y 1, y como ya tenemos la de X = 1 solo nos falta la de X = 0.

      p(x=0) = 4C0 * 6C5 / 10C5 = (1)(6)/252 = 0.023
      p(x>1)= 1-p(x=0)- p(x=1) = 1- 0.023 - 0.238 = 0.739

      c) la media y la desviación estándar
      media = 4(5/10)= 2
      desviación raiz de(2)((10-4)/10)((10-5/10-1)) = raiz(2)(6/10)(5/9) = raiz de 0.6666 = 0.8164

      Eliminar
    2. Ejercicio 4 De una baraja inglesa de 52 cartas, se toman 5 en una mano de póquer

      Cartas N= 52, mano n=5, total ases k = 4
      a) cuatro ases x = 4
      p(x=4)= 4C4 * 48C1 /52C5 = (1)(48)/ 2 598 960 = 0.000018

      b) al menos 1 reina
      Nos piden la probabilidad de X= 1, 2, 3, 4 reinas, por simplicidad calculamos su complemento es decir X= 0 reinas.
      Cartas N= 52, mano n=5, total reinas k = 4, # reinas x = 0
      p(x=0) = 4C0 * 48C5 / 52C5 = (1)(1 712 304)/ 2 598 960 = 0.6588
      p(x>=1)= 1-p(x=0) = 1 - 0.6588 = 0.3412

      Eliminar