videos variaciones variacion resueltos permutaciones permutacion identificar estadistica ejercicios como combinatorio combinaciones combinacion analisis math probability bayesian

math - variaciones - variacion combinacion y permutacion ejercicios resueltos



entrevista de permutación y combinaciones (5)

Esta es una buena porque es muy contra-intuitiva:

Imagine una urna llena de bolas, dos tercios de las cuales son de un color y un tercio de las cuales son de otra. Un individuo ha extraído 5 bolas de la urna y descubrió que 4 son rojas y 1 es blanca. Otro individuo ha dibujado 20 bolas y encontró que 12 son rojas y 8 son blancas. ¿Cuál de los dos individuos debería sentirse más seguro de que la urna contiene dos tercios de bolas rojas y un tercio de bolas blancas, en lugar de viceversa? ¿Qué probabilidades debería dar cada individuo?

Conozco la respuesta correcta, pero tal vez no entienda el cálculo de las probabilidades. ¿Alguien puede explicar?


Jeje. Puede ser que estoy totalmente equivocado, pero ¿no es intuitiva esa respuesta debería ser el segundo tipo?

Uno ve una proporción: 4: 1 4/5: 1/5

Dos ve una proporción 3: 1 3/4: 1/4

Entonces la pregunta simple es ¿quién está más cerca de 2/3: 1/3? Por lo tanto, la respuesta es Obs. Dos.

Puede ser que haya cometido dos errores y obtenga una respuesta simple a algo complejo, pero perdone mi paciencia para pasar por una larga explicación de lo que pensé que era realmente intuitivo.


P [2 / 3R 1 / 3W | 4R, 1W] = (2/3) ^ 4 * (1/3) ^ 1 * (1/2) / {(2/3) ^ 4 * (1/3) ^ 1 * (1/2) + (1/3) ^ 4 * (2/3) ^ 1 * (1/2)} = 2 ^ 4 / (2 ^ 4 + 1) = 16/17

er,

= ⅔^4*⅓ / (⅔^4*⅓ + ⅓^4*⅔) = 16/243 / (16/243 + 2/243) = 16/18

P (⅔R⅓W | 12R8W) sí, sin embargo = 16/17, por lo que el 12R8W puede ser más seguro.


Deje que A sea ​​el evento en el que 2/3 de las bolas son rojas, y luego ¬ A es el evento en el que 2/3 de las bolas son blancas. Sea B el evento en el que el primer observador ve 4 bolas rojas de 5 y que C sea ​​el evento en el que el segundo observador ve 12 bolas rojas de 20.

Aplicando algunos combinatorios simples, obtenemos eso

  • P ( B | A ) = (5 elige 4) (2/3) 4 (1/3) 1 = 80/243
  • P ( B | ¬ A ) = (5 elije 4) (1/3) 4 (2/3) 1 = 10/243

Por lo tanto, de la Ley de Bayes, el observador 1 tiene un nivel de confianza de 80 / (80 + 10) = 8/9 que A es verdadero.

Para el segundo observador:

  • P ( C | A ) = (20 elige 12) (2/3) 12 (1/3) 8 = 125970 * 2 12/3 20
  • P ( C | ¬ A ) = (20 elegir 12) (1/3) 12 (2/3) 8 = 125970 * 2 8/3 20

Por lo tanto, de nuevo según la Ley de Bayes, el observador 2 tiene un nivel de confianza de 2 12 / (2 12 + 2 8 ) = 16/17 que A es verdadero.

Por lo tanto, el observador dos tiene un nivel de confianza más alto que 2/3 de las bolas son rojas. La clave es entender cómo funciona la ley de Bayes. De hecho, todo lo que importa es la diferencia en el número de bolas rojas y blancas observadas. Todo lo demás (específicamente el número total de bolas extraídas) se anula en las ecuaciones.


Eliezer Yudkowsky tiene una explicación (realmente larga, pero buena) del Teorema de Bayes . Aproximadamente el 70% de reducción, hay un párrafo que comienza "Delante de usted hay una cartera de libros" que explica el núcleo de este problema.

El punto culminante es que lo único que importa es la diferencia entre la cantidad de bolas rojas y blancas que se han dibujado. Por lo tanto, al contrario de lo que otros han estado diciendo, no tienes que hacer ningún cálculo. (Esto es hacer cualquiera de las suposiciones razonables (a) que las bolas se dibujan con reemplazo , o (b) la urna tiene muchas bolas. Entonces el número de bolas no importa.) Aquí está el argumento:

Recuerda el teorema de Bayes: P (A | B) = P (B | A) * P (A) / P (B). (Una nota sobre la terminología: P (A) es el previo y P (A | B) es el posterior . B es una observación que usted hizo, y la terminología refleja su confianza antes y después de su observación.) Esta forma del teorema es bien, y @bobince y @Adam Rosenfield lo aplicaron correctamente. Sin embargo, el uso de esta forma directamente te hace susceptible a errores aritméticos y realmente no transmite el corazón del teorema de Bayes. Adam mencionó en su publicación (y menciono arriba) que lo único que importa es la diferencia entre cuántas bolas rojas y blancas se han dibujado, porque "todo lo demás se anula en las ecuaciones". ¿Cómo podemos ver esto sin hacer ningún cálculo?

Podemos usar los conceptos de odds ratio y likelihood ratio . ¿Qué es una odds ratio? Bueno, en lugar de pensar en P (A) y P (¬A), pensaremos en su relación P (A): P (¬A). O bien es recuperable desde el otro, pero la aritmética funciona mejor con odds ratios porque no tenemos que normalizar. Además, es más fácil "obtener" el teorema de Bayes en su forma alternativa.

¿Qué quiero decir con que no tenemos que normalizar, y cuál es la forma alternativa? Bueno, vamos a calcular. El teorema de Bayes dice que las probabilidades posteriores son

P (A | B): P (¬A | B) = (P (B | A) * P (A) / P (B)): (P (B | ¬ A) * P (¬A) / P (SEGUNDO)).

El P (B) es un factor de normalización para hacer que las probabilidades sumen a uno; sin embargo, estamos trabajando con ratios, donde las probabilidades 2: 1 y 4: 2 son la misma cosa, por lo que el P (B) cancela. Nos queda una expresión fácil que pasa a tener en cuenta:

P (A | B): P (¬A | B) = (P (B | A) * P (A)): (P (B | ¬ A) * P (¬A)) = (P (B | A): P (B | ¬ A)) * (P (A): P (¬A))

Ya hemos oído hablar del segundo término allí; es la odds ratio anterior. ¿Qué es P (B | A): P (B | ¬A)? Eso se llama razón de verosimilitud . Entonces nuestra expresión final es

probabilidades posteriores = razón de verosimilitud * cuotas previas.

¿Cómo lo aplicamos en esta situación? Bueno, supongamos que tenemos algunas probabilidades anteriores x: y para el contenido de la urna, con x representando 2 / 3rds en rojo y y representando 2/3 en blanco. Supongamos que dibujamos una sola bola roja. La razón de verosimilitud es P (la bola roja dibujada | urn es 2 / 3rds roja): P (dibujó la bola roja | urn es 2 / 3rds blanca) = (2/3): (1/3) = 2: 1. Entonces la las probabilidades posteriores son 2x: y; si hubiéramos dibujado una bola blanca, las probabilidades posteriores serían x: 2y por un razonamiento similar. Ahora hacemos esto para cada pelota en secuencia ; si los sorteos son independientes, entonces solo multiplicamos todos los odds ratios. Entonces, tenemos que si comenzamos con una razón de posibilidades de x: y dibujamos bolas rojas y con bolas blancas, obtenemos una odds ratio final de

(x: y) * (2: 1) ^ r * (1: 2) ^ w = (x * 2 ^ r): (y * 2 ^ w) = (x: y) * (2 ^ (rw) : 1).

entonces vemos que todo lo que importa es la diferencia entre r y w. También nos permite resolver el problema fácilmente. Para la primera pregunta ("¿quién debería tener más confianza?"), Las probabilidades anteriores no importan, siempre que no sean 1: 0 o 0: 1 y ambas personas tengan antecedentes idénticos. De hecho, si su anterior idéntico fuera x: y, la parte posterior de la primera persona sería (2 ^ 3 * x): y, mientras que la posterior de la segunda persona sería (2 ^ 4 * x): y, entonces la segunda persona es más Por supuesto.

Supongamos además que las probabilidades anteriores eran uniformes, es decir 1: 1. Entonces la parte posterior de la primera persona sería 8: 1, mientras que la segunda persona sería 16: 1. Podemos traducir fácilmente estas en probabilidades de 8/9 y 16 / 17, confirmando los otros cálculos.

El punto aquí es que si obtienes la ecuación en negrita anterior, entonces este problema es realmente fácil . Pero, lo que es más importante , puedes estar seguro de que no has estropeado ninguna aritmética, porque tienes que hacer muy poco.

Entonces esta es una mala pregunta de programación, pero es una buena prueba de la ecuación en negrita. Solo para practicar, apliquemoslo a dos problemas más:

Escojo al azar una de dos monedas, una moneda justa o una moneda falsa de dos cabezas, cada una con un 50% de probabilidad. Lo doy tres vueltas y sale a la luz las tres veces. ¿Cuál es la probabilidad de que sea la verdadera moneda?

Las probabilidades anteriores son reales: falso = 1: 1, como se indica en el problema. La probabilidad de que hubiera visto tres cabezas con la moneda real es 1/8, pero es 1 con la moneda falsa, por lo que la razón de probabilidad es 1: 8. Entonces las probabilidades posteriores son = probabilidad * previa = 1: 8. Por lo tanto la probabilidad de que sea la moneda real es 1/9.

Este problema también plantea una advertencia importante: existe una relación de probabilidad posiblemente diferente para cada observación posible. Esto se debe a que la razón de verosimilitud para B es P (B | A): P (B | ¬ A), que no está necesariamente relacionada con la razón de verosimilitud para ¬B, que es P (¬B | A): P (¬ B | ¬A). Desafortunadamente, en todos los ejemplos anteriores, han sido inversos el uno del otro, pero aquí, no lo son.

De hecho, supongamos que doy la vuelta a la moneda una vez y me sale la cola. ¿Cuál es la probabilidad de que sea la verdadera moneda? Obviamente uno. ¿Cómo funciona el teorema de Bayes? Bueno, la relación de probabilidad para esta observación es la probabilidad de ver este resultado con la moneda real frente a la moneda falsa, que es 1/2: 0 = 1: 0. Es decir, ver una sola cola mata la probabilidad de que la moneda sea falso, que se verifica con nuestra intuición.

Este es el problema que mencioné en la página de Eliezer:

Delante de ti hay una mochila que contiene 1,000 fichas de póker. Comencé con dos tales bookbags, uno que contiene 700 rojos y 300 azules, el otro contiene 300 rojos y 700 azules. Lancé una moneda justa para determinar qué cartera de libros usar, por lo que su probabilidad previa de que la cartera en frente suyo sea la del libro rojo es del 50%. Ahora, muestras aleatoriamente, con reemplazo después de cada chip. En 12 muestras, obtienes 8 rojos y 4 azules. ¿Cuál es la probabilidad de que esta sea la bolsa roja predominante? (No necesita ser exacto, una estimación aproximada es lo suficientemente buena).

Las probabilidades previas son rojas: azul = 1: 1. Las razones de probabilidad son 7: 3 y 3: 7, por lo que las probabilidades posteriores son (7: 3) ^ 8 * (3: 7) ^ 4 = 7 ^ 4: 3 ^ 4. En este punto, solo estimamos 7: 3 como, por ejemplo, 2: 1, y obtenemos 2 ^ 4: 1 = 16: 1. Nuestra respuesta final es aún mayor, por lo que definitivamente es más grande que el 95% aproximadamente; la respuesta correcta es alrededor del 96.7%. Compare esto con las respuestas de la mayoría de las personas, que están en el rango de 70--80%.

Espero que estén de acuerdo en que los problemas se vuelvan realmente fáciles e intuitivos cuando se los considere de esta manera.


Supongo que la probabilidad ''a priori'' de una hipótesis frente a la otra es 1/2, y además que ambos individuos reinserten cada bola después de extraerla (las extracciones son independientes entre sí).

La respuesta correcta es que el segundo observador debería tener más confianza que el primero. Mi respuesta anterior fue incorrecta debido a un error trivial en los cálculos, muchas gracias y +1 a Adam Rosenfield por su corrección.

Deje 2 / 3R 1 / 3W denotar el evento "la urna contiene 2/3 de bolas rojas y 1/3 bolas blancas", y deje que 4R, 1W denoten el evento "4 bolas rojas y 1 bola blanca se extraen". Entonces, usando la regla de Bayes,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = P [ 4R, 1W | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] / P [ 4R, 1W ] = (2/3) 4 (1/3) 1 (1/2) / P [ 4R, 1W ]

Ahora, dado que 2 / 3R 1 / 3W y 1 / 3R 2 / 3W son complementarios por hipótesis,

P [ 4R, 1W ] = P [ 4R, 1W | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] + P [ 4R, 1W | 1 / 3R 2 / 3W ] P [ 1 / 3R 2 / 3W ] = (2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2/3) 1 (1 / 2)

Así,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = (2/3) 4 (1/3) 1 (1/2) / {(2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2 / 3) 1 (1/2)} = 2 ^ 4 / (2 ^ 4 + 2) = 8/9

El mismo cálculo para P [ 2 / 3R 1 / 3W | 12R, 8W ] (es decir, tener (2/3) 12 (1/3) 8 en lugar de (2/3) 4 (1/3) 1 ) cede ahora 16/17 , por lo tanto, la confianza del segundo observador es mayor que el del primero