Iniciar sesión

Ver la versión completa : Necesito ayuda para calcular una probabilidad



imeko
03/05/2013, 13:35
Hola, tengo un amigo que se va a presentar a unas oposiciones. Me ha dicho que solo le da tiempo a estudiarse 20 temas de 68. El examen consistira en un sorteo/s en el que saldrán 3 temas de los cuales podrá elegir dos de ellos para examinarse. ¿Que probabilidad existe de que salgan 2 de los 20 temas que se va a preparar? ¿Existiran las mismas probabilidades tanto si salen los 3 temas en un unico sorteo, o se hacen 3 sorteos independientes?
Gracias.

Dullyboy
03/05/2013, 14:20
La probabilidad de este tipo de probelmas sigue una distribución hipergeométrica:

33223
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_hipergeom%C3%A9trica

En este caso tenemos que N = 68, d = 20 y n = 3, por lo que:
P(X >= 2) = P(X = 2) + P(x = 3) = ... =~ 0.182 + 0.0227 = 0.2047, un 20% escaso vamos.

Tirando de aquí (http://www.elosiodelosantos.com/hipergeometrica.html) los calculos que no voy a escribir esos chorizos en google :D.

Trenz
03/05/2013, 14:22
Ups, respondimos casi a la vez. Borro la mía, que tu respuesta está mejor XD

juanvvc
03/05/2013, 14:33
Voy a suponer que las preguntas no pueden repetirse y usaré la definición frecuencial de la probabilidad.

Como dice Dullyboy, la distribución es hipergeométrica. Pero en este caso los cálculos son suficientemente sencillos como para poder razonarlos sin necesidad de explicar fórmulas generales que no sabes de dónde vienen :D

Las probabilidades de aprobar son la probabilidad de que salgan:
1.- tres preguntas que sé, o...
2.- dos preguntas que sé seguidas y una que no sé, o...
3.- una pregunta que no sé, seguida de dos preguntas que sé, o...
4.- una pregunta que sé, una que no sé, una que sé

(date cuenta de que el orden es importante porque cada vez que preguntas un tema lo sacas de la lista para que no se repita)



octave:1> 20/68 * 19/67 * 18/66 + 20/68 * 19/67 * 48/66 + 48/68 * 20/67 * 19/66 + 20/68 * 48/67 * 19/66
ans = 0.20473


Es decir, poco más de un 20%.

Comprobémoslo con un experimentos empírico. Código Python:



import random

def examen(num_preguntas, num_temas):
a = range(1, num_temas)
random.shuffle(a)
return a[0:num_preguntas]

def cuantas_preguntas_respondo(examen, num_estudiados):
w = 0
for i in examen:
if i <= num_estudiados:
w = w + 1
return w

aprobados = 0
tests = 10000

for i in range(0, tests):
if cuantas_preguntas_respondo(examen(3, 68), 20) > 1:
aprobados = aprobados + 1

print (1.0 * aprobados ) / tests


Y sus respuestas coinciden:


juanvi@montse:~$ python prueba.py
0.2047
juanvi@montse:~$ python prueba.py
0.2011
juanvi@montse:~$ python prueba.py
0.2129
juanvi@montse:~$ python prueba.py
0.2079
juanvi@montse:~$ python prueba.py
0.2098

Dullyboy
03/05/2013, 14:38
Como dice Dullyboy, la distribución es hipergeométrica. Pero en este caso los cálculos son suficientemente sencillos como para poder razonarlos sin necesidad de explicar fórmulas generales que no sabes de dónde vienen :D

Hay que enseñar a pescar, no dar pescados :D.


Ups, respondimos casi a la vez. Borro la mía, que tu respuesta está mejor XD

Sí estaba bien (bueno te faltaba el caso cuando salen los 3, pero aún así era útil), no tendrías que haberla borrado. Como si no escribiese la gente post inútiles aquí a diario :D (yo el primero, lol).

juanvvc
03/05/2013, 15:01
Hombre, poner la fórmula de la distribución hipergeométrica sin decir de dónde sale, a mí me parece "dar pescados" :D

Estoy leyendo un libro de probabilidad, el de Jaynes. Tarda unas 150 páginas en presentar la primera distribución de probabilidad, y es precisamente la hipergeométrica.

-----Actualizado-----


¿Existiran las mismas probabilidades tanto si salen los 3 temas en un unico sorteo, o se hacen 3 sorteos independientes?

Antes de irme a comer respondo también a esto por curiosidad. Si es un único sorteo la distribución es hipergeométrica como hemos visto más arriba. Si los sorteos son independientes entonces asumimos que las preguntas se pueden repetir (si no, no serían independientes) Ahora ya NO es distribución hipergeométrica. La probabilidad de aprobar es igual a la probabilidad de que salgan dos o tres preguntas que sé. Los casos son los mismos que antes, pero ahora no borramos las preguntas de la lista así que siempre habrá 68 preguntas disponibles y siempre me sé 20 de ellas.



octave:1> 20/68 * 20/68 * 20/68 + 48/68 * 20/68 * 20/68 + 20/68 * 20/68 * 48/68 + 20/68 * 48/68 * 20/68
ans = 0.20863


(los tres últimos sumandos son iguales, los pongo expandidos para que sea más fácil comparar con la fórmula de antes)

Así que con sorteos independientes (es decir, que se pueden repetir preguntas), la probabilidad de aprobar es ligeramente mayor con estos datos en concreto.

De todas formas dudo mucho que se puedan repetir preguntas en una oposición, así que no sé qué quieres decir con "sorteos independientes"

-----Actualizado-----

NOTA: no me fío mucho de mi último mensaje pero me tengo que ir a comer. ¡Toca corregirlo!

Dullyboy
03/05/2013, 15:07
Hombre, poner la fórmula de la distribución hipergeométrica sin decir de dónde sale, a mí me parece "dar pescados" :D
De donde sale tendría que buscarlo él o preguntarlo :), pero vamos la hipergeométrica solo es la regla de laplace, casos favorables entre casos posibles. Arriba todas las combinaciones sin repetición (2 temas estudiados y 1 no estudiado en el primer caso, 3 y 0 en el segundo) y abajo todas las combinaciones posibles sin repetición.

Trenz
03/05/2013, 15:42
Sí estaba bien (bueno te faltaba el caso cuando salen los 3, pero aún así era útil), no tendrías que haberla borrado. Como si no escribiese la gente post inútiles aquí a diario :D (yo el primero, lol).

Chsss... yo que la había borrado para que no quedara constancia de que había metido la pata XD. Nah, al margen del despiste, mi respuesta era, como la de Juanvvc, usando el concepto clásico de probabilidad, la probabilidad a priori; pero me ponía sin más a contar combinaciones. Para eso, la explicación de Juanvvc es mucho más clara, intuitiva y didáctica.

Hablando de peces y de pescar, en este caso, para que el pez tenga mal sabor y al receptor se le quede cara de WTF, nada mejor que añadir que un espacio de probabilidad es una sigma-algebra (que ya no recuerdo si era un tipo de topología o un primo hermano de éstas) XD.

juanvvc
03/05/2013, 15:58
Ya he vuelto de comer. Retomo el caso de preguntas independientes, es decir, que se pueden repetir. El código Python ahora es prácticamente el mismo, varía la definición del examen para permitir preguntas repetidas:



def examen(num_preguntas, num_temas):
a = []
for i in range(0, num_preguntas):
a.append(random.randint(1, num_temas))
return a


(el resto, como antes)

Y los resultados:



juanvi@montse:~$ python prueba.py
0.2126
juanvi@montse:~$ python prueba.py
0.2082
juanvi@montse:~$ python prueba.py
0.2086
juanvi@montse:~$ python prueba.py
0.2094
juanvi@montse:~$ python prueba.py
0.2083


Pueden parecer los mismos resultados que antes, pero hemos visto por el análisis teórico que en realidad en este caso, si se repiten preguntas, tiene una probabilidad ligeramente más alta de aprobar. Es muy curioso, había intuido que si permitíamos que se repitiesen preguntas una persona que solo hubiese estudiado 20 preguntas de 68 tendría MENOS posibilidades de aprobar, no más. Ahora con los datos en la mano ya razono que la probabilidad de que se repita un tema que sabe casualmente compensa la probabilidad de que se repita un tema que no sabe, ¡pero a priori no lo hubiese dicho! Nota: eso solo pasa justo con estos datos, si fuesen otros quizá cambien las tornas.

Dullyboy
03/05/2013, 16:09
Hablando de peces y de pescar, en este caso, para que el pez tenga mal sabor y al receptor se le quede cara de WTF, nada mejor que añadir que un espacio de probabilidad es una sigma-algebra (que ya no recuerdo si era un tipo de topología o un primo hermano de éstas) XD.

Sí, espacio de probabilidad = topología con función de probabilidad básicamente :).

juanvvc
03/05/2013, 16:52
Yo sigo con mis cosas que la chorrada esta me ha molado. Sigo con aquello de comparar preguntas con repetición o sin ellas. Si el sujeto estudió un número determinado de temas... ¿qué le conviene más, que haya repeticiones o que no las haya?

Caso 1: 3 preguntas, tiene que contestar mínimo 2:
33229

Da igual cuántos temas estudie: ¡apenas hay diferencia entre preguntas repetidas o no repetidas! En la parte alta el examen sin permitir preguntas repetidas tiene una ligerísima ventaja según la curva, aunque ya vimos que con 20 temas estudiados era al revés.

Caso 2: 30 preguntas, tiene que contestar mínimo 20:
33230

En este caso, si estudia pocos temas es mejor que las preguntas puedan ser repetidas, mientras que si estudia muchos temas es mejor que las preguntas no se puedan repetir.

Caso 3: 30 preguntas, tiene que contestar mínimo 10:
33231

Otra sorpresa: ¡igual que el caso anterior, pero la curva está desplazada sin más!

Supongo que en el caso 1 las curvas será similares a las del caso 2 y caso 3, solo que como están muy juntas no las vemos bien. Así que es posible que existe un número de temas a estudiar para el cual convenga más que las preguntas se puedan repetir, o no.

imeko
03/05/2013, 17:02
Muchas gracias por vuestra ayuda. Me quedo asombrado al comprobar que sabiendo la mitad de los temas, tengas el 50% de probabilidad de que te salgan dos que te sepas. Lo de sorteos independientes me referia a como si saliesen las bolas de un bingo; es decir primero una y luego las otras.

juanvvc
03/05/2013, 17:28
Lo de sorteos independientes me referia a como si saliesen las bolas de un bingo; es decir primero una y luego las otras.

Ah, ¿preguntas si es mejor hacer todo el sorteo al inicio o después de cada pregunta sortear la siguiente? Matemáticamente da igual, psicológicamente no saber cuál será la siguiente sí que puede afectarte pero eso ya es otra historia.

De todas formas las bolas de un bingo NO son independientes: si el 2 sale el primero, la probabilidad de que vuelva a salir es nula. Si han salido todas las bolas menos el 2, entonces el 2 saldrá seguro en la siguiente. ¿Ves? Los experimentos no son independientes, dependen de lo que haya pasado antes. Para que fuesen independientes, la bola que salga se tendría que volver a echar en el bombo... y girar el bombo muy bien para que no se quede la bola arriba :)

Trenz
03/05/2013, 20:18
Sí, espacio de probabilidad = topología con función de probabilidad básicamente :).

Pues gracias por la aclaración :). Hace un montón de tiempo se lo pregunté a un tipo que conocía, que era matemático, lo que pasa es que ya no recordaba lo que me respondió exactamente, aunque sí que era algo que tenía relación con las topologías.

Me quito el sombrero ante las explicaciones de Juanvvc, ilustradas con gráficas y un programa :O

MWarrior
03/05/2013, 20:24
¿Pero de donde cojones habéis salido???
Ahora en serio, buenas respuestas ;)