Abro este pequeño post para procurar determinar la probabilidad que tiene un seleccionado representante de toda una nación de consagrarse campeón en el próximo Mundial Sudáfrica 2010. Es bastante sencillo, pero aclaro que hago el procedimiento para calcular la probabilidad de que un equipo favorito se corone. Comencemos:
Supongamos que nuestro equipo, Argentina, llegó a los octavos de final. Al ser favorito (supuesto del modelo), asumamos por simplicidad que tiene el 66% de probabilidad de ganar contra cualquier equipo que juegue o lo que es exactamente lo mismo, tiene 2/3 de probabilidad de victoria a su favor. Así:
[*]1. La probabilidad de ganar el primer partido: 2/3
[*]2. La probabilidad de ganar los dos primeros partidos: (2/3).(2/3)= 4/9
[*]3. La probablidad de que gane tres partidos consecutivos: (2/3).(2/3).(2/3)= 8/27
Y, finalmente,
[*]4. La probabilidad de que gane cuatro partidos al hilo: (2/3).(2/3).(2/3).(2/3)= 16/81 = 0.1975 < 0.2
Con lo que se concluye que, bajo las condiciones planteadas, hay menos del 20% de probabilidad a favor de un favorito para que salga campeón HABIENDO llegado a octavos de final. ¿Acaso no es interesante este resultado? Supongamos por un momento que me equivoqué en la estimación de certeza del equipo y asignémosle un 75% de índice de victoria ó 3/4. El resultado sería 81/256= 0.3164------> ¿apenas poco más del treinta por ciento, ya habiendo llegado a octavos y ganando el 75% de los partidos contra cualquier equipo? No deja de sorprenderme y espero que tenga el mismo efecto sobre ustedes.
Y recuerden, sin embargo, que siempre algún equipo se consagra campeón.
jueves, 27 de mayo de 2010
¿Cuál es la probabilidad de ganar un mundial? PARTE I
¿Cuál es la probabilidad de ganar un mundial? PARTE II
Faltaría completar el sisilàna con la clasificación de grupo:
-Clasificar implica, por lo menos, ganar un partido, empatar otro y perder el tercero (o en orden cambiado). ¿Por qué? Porque existen cuatro equipos en el grupo y cada uno juega tres partidos, es decir, el máximo de puntos que se pueden obtener son 9; asumiendo que un equipo ganó todos los partidos, entonces hizo perder un partido a todos los demás. El segundo lugar sólo podría aspirar a tener 6 puntos. Se demuestra entonces que para clasificar en la situación de que un equipo gane sus tres partidos es necesario como mínimo empatar el otro y ganar el que queda. Veamos: ganando los dos son seis puntos y los restantes equipos qudarían así: los dos necesariamente tendría que haber perdido dos (uno frente al equipo de los 9 puntos y otro frente al de 6 puntos), por lo que sólo podría aspirar a tener 3 puntos máximo y quedarían automáticamente descalificados; ahora, si ganase uno y empatase otro tendría 4 puntos y los otros dos equipos restantes quedarían de la siguiente manera: uno descalificado en el supuesto de que perdiese en contra del otro y éste en competencia con posibilidad de igualar al de 4 puntos y superarlo por diferencia de goles (caso Argentina, Mundial Corea Japón 2002).
Supongamos por un momento el peor caso, es decir, clasificar al filo de la navaja por diferencia de goles. Eso implica:
1. Que se ganó un partido: partiendo desde el supuesto de que se ganan el 66% de los partidos que se disputan entonces hay que asignar una probabilidad de 2/3 a ello.
2. Que se empató un partido: le correspondería una asignación de probabilidad nueva que debemos obtener por deducción. Si el 66 % de los partidos disputados se ganan, entonces el restante 33% está repartido entre dos resultados: empate y pérdida. No podemos equidistribuirlos porque sería demasiado simple y pecaría por ello. Digamos que este equipo tiene un 10% de probabilidad de empatar (dato empírico) y un 23% de perder (también empírico). Queda, así, asignada una probabilidad del 10% a este ítem.
3. Que se perdió un partido: asignamos el 23%.
En resumen, nos quedaría:
Probabilidad total calculada considerando a los partidos como eventos mutuamente excluyentes e independientes entre sí por regla de conjunción multiplicativa:
(2/3).(1/10).(23/100) = 0.01518 -----> 1.518% de probabilidad de que se dé esto, considerando las características mencionadas.
Bien, ya habíamos quedado en que teníamos una probabilidad del 0.1975 de que el equipo saliera campeón habiendo llegado a octavos y ahora tenemos que el equipo tendría una probabilidad de 1.518 % (¿¿??) de que llegue a octavos bajo las condiciones dadas. Invítoles a hacer el producto necesario para llegar a la probabilidad de consagrarse campeón a partir de ese 1.518% y se darán cuenta de que es menor al uno por ciento.
El objetivo aquí es: detectar el error que estoy cometiendo (si es que lo estoy cometiendo), al sacar estas conclusiones y afirmar con toda vehemencia que cualesquiera equipo que se quiera consagrar campeón tiene menos del 1 por ciento de probabilidad de hacerlo incluso cuando gane 2/3 de los partidos que dispute y habiendo llegado a octavos bajo la situación descrita. Escucho a los valientes a ver que tan ávidos están y consideren las condiciones de las que se parte, puesto que el equipo más allá de ganar el 66% de los partidos, también pierde el 23%.
Un afectuoso saludo para todos los que se bancaron mi pesada argumentación determinística y rigurosa.
¿Cuál es la probabilidad de ganar un mundial? PARTICIPACIÓN de destacado comentario
Esta es la respuesta recibida por la persona cuyo alias es "pibefantasía" en el excelente foro www.panaforum.com.ar, la cual transcribo sin corregir errores ortográficos, de sintaxis, estructura ni gramaticales:
"hola juan, la verdad que yo tambien estoy haciendo algo parecido, queiero calcular la probabilidad de ganar de un equipo en primer rueda, ejemplo como va a ser el resultado del primer partido de argenitna contra nigeria (entendiendo como resultado si gano perdio o empato)
te comento que para eso hice dos tablas una con la de resultados en la historia de los mundiales en primer rueda y otra con los resultados de un equipo determinado en primer vuelta, (en el caso del ejemplo Alemania)
1° RONDA EN GRAL
OBSERV FREC
PG 371 0.75
PE 126 0.25
teniendo en cuenta que para que halla ganado un equipo otro tiene que haber perdido, la probabilidad real de ganar un partido es de 0.375 y la de perder es de 0.375 y asi llego al 0.75
PROB DE ALEMANIA EN 1° RONDA
OBSERV FREC
PG 28 0.64
PE 13 0.30
PP 3 0.06
con estas dos tablas calcula una formula creada por mi que es igual a la siguiente:
PG = 2/18*0.375 + 16/18 * 0.25
PE = 2/18*0.25+16/18* 0.30
PP = 2/18* 0.75+16/18*0.06
el 2/18 es la cantidad de mundiales en los cuales el equipo no jugo, y el 16/18 en los que si jugo, hago esta ponderacion para el caso de selecciones, como ser las de ghana qque participaron en un solo mundial y tuvieron buenos resultados (2 pg y 1 pe), entonces su probabilidad es alta pero poco realista, ya qeu si no clasificaste al mundial quiere decir q tu seleccion no tenia un nivel para hacerlo.
luego calculo el coef para todos los equipos del grupo, en el ejemplo es el grupo uno del mundial 06, guarda que en ves de 18 mundiales en esa fecha son 17
ALEmania: PG 0.56 pe 0.24 pp 0.13
Costa rica: PG 0.39 pe 0.24 pp 0.37
Ecuador: PG 0.37 pe 0.23 pp 0.39
Polonia: PG 0.40 pe 0.27 pp 0.33
y aca se me complica todo ya que no se como relasionar estos datos para calcular el resultado de un partido, por ejemplo saber como sale alemania - costa rica, con esos datos...
no se si lo que hice esta bien o no, soy un principiante en esto de las estaidisticas y me gustaria que alguien como vos mie dijera si voy por buen camino o no, en caso de que se q me equivoque marcarme el error y si se puede arreglar, y en caso de que no, como sigo apartir de ahora porq no tengo ni idea...
saludos y espero tu respuesta"
¿Cuál es la probabilidad de ganar un mundial? PARTE III
Estimado pibe:
Me interesa sobremanera tu cociente. Es más, di en llamarlo "refinamiento de pibefantasía" o REDEPI. Ahora bien, creo entrever arbitrariedad en la estructura bajo la cual constituiste la ponderación de partidos ganados y empatados; en palabras más sencillas, el 0.375 multiplicado por 2 es incorrecto y lo recomendable es que esa revisión histórica que mencionás (lo cual me parece una idea brillante) debe hacerse con sumo cuidado pero siempre refiriéndonos al país que se pretende realizar la estimación. Me explico: deberíamos conseguir las estadísticas de AFA (por ejemplo) respecto del historial argentino en mundiales, acto seguido sumamos los ganados por un lado, los empatados por otro y, finalmente, los perdidos (siempre referidos a la etapa que se quiere analizar: primera, octavos, cuarta, semi y final), dividimos por el total para cada caso y establecemos la tasa que luego se empleará en REDEPI.
A REDEPI lo calculamos para ganados, empatados y perdidos, pero de la siguiente manera:
1. REDEPI (G)= 16/18*(tasa G) - 2/18 (tasa P) -----> ¿qué implica esto? Que el hecho de no haber participado en un mundial implica considerar PERDIDOS todos los partidos correspondientes a la etapa analizada (siendo tasa P= tasa de pérdidas).
2. REDEPI (E)= 16/18*(tasa E) - 2/18 (tasa P)
3. REDEPI (P)= 16/18*(tasa P) - 2/18 (tasa P)
Todo muy lindo, pero, ¿qué aplicación práctica tiene REDEPI? Será la ponderación histórico-objetiva correspondiente a la situación que se pretende analizar y para la etapa bajo revisión. Esto es sumamente importante, ya que vendría a corregir la arbitrariedad presente en mi modelo que funciona bajo una débil hipótesis inicial que es fijada en forma subjetiva (el famoso 67%).
Muy bien, hemos llegado a la parte más relevante: ¿cómo lo utilizamos para predecir el resultado de un partido en particular? Supuesto de inicio: hemos calculado REDEPI para la etapa en la que OCURRE el partido, para los equipos intervinientes y este ha resultado positivo y mayor que 0 (de no ser así, deberá revisarse el procedimiento de cálculo y la precisión de las estadísticas empleadas, admitiendo la situación en la que la selección hubiera participado en muy pocos mundiales, en cuyo caso se podrá observar un REDEPI negativo). Ahora trataré la parte siguiente con tu ejemplo: Alemania vs Costa Rica. Supongamos (insisto, SUPONGAMOS):
- REDEPI aG= REDEPI para Alemania, partidos GANADOS = 0.675; REDEPI aE = REDEPI Alemania, partidos EMPATADOS 0.225; REDEPI aP= 0.1(*)
(*) Nótese que hice que la suma de REDEPI fuese 1, aunque se debe admitir que esto sería así en caso de que la selección hubiera participado en TODOS los mundiales disputados. Así, debe tenerse en cuenta de que la mayor parte de las veces el resultado será inferior a 1.
-REDEPI crG= 0.35; REDEPI crE= 0.4; REDEPI crP= 0.25
Interpretemos, a modo de casuística, qué significa REDEPIaG=0.675 y REDEPI crG = 0.35: quiere decir que en este partido en particular, dentro del mundial, dentro de la etapa analizada, basándonos en el historial completo de partidos disputados por las selecciones en cuestión, Alemania tendrá el 67.5 % de probabilidad de ganar y Costa Rica, el 0.35. Aquí queda demostrado que la utilidad de REDEPI se limitaría, pura y exclusivamente, a indicarnos probabilidad de ganar, empatar o perder. Sin embargo, ¿cómo predeciríamos un resultado concreto? Ahí tendríamos otro desafío: revisar el historial de enfrentamientos, en esa etapa, de esos equipos en particular y registrar las estadísticas de resultados (revisando su varianza o, mejor aún, su desviación estándar, para determinar la confiabilidad de la predicción) y ponderar los resultados por REDEPI (según se haya ganado, empatado o perdido) y sumar los equivalentes, ante lo cual tendríamos una aproximación confiable al resultado con una tasa de error aproximadamente igual a la desviación estándar contemplada en el historial de resultados, tanto de enfrentamientos como del equipo en particular para el que se calculó REDEPI.
Bueno, sigamos armando el modelo predictivo. Tal vez escriba un paper sobre esto, el cual recién serviría para Brasil 2014. Un abrazo y gracias por la participación.
JMR