sabéis cuánto dinero se han jugado los españoles en apuestas deportivas en el último trimestre 1700 millones de euros y eso sólo en las solo contando las casas que operan legalmente en nuestro país las apuestas deportivas que son para mucha gente es una forma de ocio para algunas personas lamentablemente es una serie adicción las podemos ver también como una competición una competición por ver quién es capaz de predecir mejor el futuro en este caso el futuro sobre algo tan trivial pero a la vez tan importante como el fútbol y que es la movilización y el data science pues se trata de analizar información para encontrar patrones que precisamente nos permitan predecir mejor hace unos años trabajando en banca pensé hoy enrique tú has construido modelos de scoring porque no te confíes una base de datos de fútbol la analizas a lo mejor con lo que aprendas puedes apostar y sacar algo de dinero en aquel momento todavía estaba soltero no tenía niños pequeños y tenía tiempo libre y me puse a ello construir una base de datos con más de 100.000 partidos de fútbol y un montón de variables explicativas de ambos equipos y lo más interesante con las cuotas que ofrecían varias casas de apuestas en esos eventos con lo cual podía probar qué estrategias hubieran sido rentables y cuáles no y que se observa cuando comienzas a torturar los datos pues empiezas a observar algunas características de la psicología humana y algunos sesgos que en los que incurren los apostadores cuando se trata de predecir el primero de esos sesgos es que los apostadores se centran demasiado en los resultados de los equipos y demasiado poco en su nivel de juego a medio plazo nivel de juego y resultados van de la mano pero a corto plazo no necesariamente imaginemos un equipo que ha ganado sus últimos partidos mucha gente se pone apostar a favor de ese equipo pero cabría preguntarse a ganado porque está jugando bien o porque ha tenido suerte yo os digo que se ha ganado marcando un único gol que ha logrado la única vez que ha tirado a la portería contraria es que ha ganado por suerte y así deberíamos tratarlo a la hora de pronosticar las variables ligadas al nivel de juego como los tiros o los goles son mucho más predictivas que las ligadas directamente a resultados como serían puntos o porcentaje de victorias otro sesgo que cometen los apostadores es que se centran en los partidos más recientes de cada equipo la realidad es que las variables más potentes para predecir se construyen con los partidos que ha disputado cada equipo en la temporada en curso pero también en las dos temporadas anteriores es decir con 70 80 90 partidos qué implicaciones tiene eso si el equipo de tus amores acaba de hacer un temporadón es bastante más probable que la próxima temporada baje su rendimiento que siga mejorando si pudiera darle un consejo a un entrenador de fútbol le diría bien no fichas por un equipo que acaba de ganar tres champions seguidas otro de los aspectos qué afecta el rendimiento de los equipos y que a la vez es más difícil de modelizar es la motivación por ejemplo los equipos que están en mitad de la tabla cuando llegue a las últimas jornadas de vida pegan un bajón en su rendimiento ya no se juegan nada no pueden clasificarse para europa no van a descender por el contrario los equipos que bordean el descenso pegan un subidón de rendimiento en las últimas jornadas y eso además en el mundo del fútbol se puede medir y se ve que ocurre en italia en francia en alemania en españa es es humano es un comportamiento profundamente humano eso a la hora de modelizar es todo un desafío porque significa que las correlaciones varían en función de en qué momento de la temporada nos encontremos otro aspecto que afecta a la motivación en ocasiones es la sed de venganza sí sí la sed de venganza cuando un equipo humilla a otro suele ser interesante apostar a favor del equipo humillado en la siguiente oportunidad que ambos equipos se enfrentan así que ya sabéis lo que tienes que hacer el proximo madrid-barça la motivación no puede estar siempre en máximos por su propia naturaleza es inconstante cuando un equipo ha jugado un partido muy importante y ha logrado un buen resultado por ejemplo contra el madrid contra el barça en el siguiente encuentro suele pegar un bajón pensemos en el betis no el el fin de semana pasado ganó al barcelona en el camp nou que habrán hecho los jugadores del betis después del partido saldrán igual de motivados en el próximo encuentro contra el villarreal viendo los datos vemos que no suele ser así que la motivación baja después del gran día si os interesa este mundillo tengo una cuenta en twitter llamada métodos predictivos para fútbol donde todas las semanas subo algún pequeño análisis también he dejado unos unos libros en las estanterías de intercambio que está en la entrada de amazon ya vale cuando ya tenía construido mi modelo y conforme iba apostando me comencé a dar cuenta que en algunas casas lograba ganar dinero pero en otras no lograba ganar dinero porque porque no todas las casas predicen igual a la hora de predecir el futuro no se trata de hacerlo perfectamente es imposible se trata de predecir lo mejor que quien tienes delante imaginaros tenéis unas acciones y estáis pensando en venderlas si se presentan en la puerta de nuestra casa el inversor más exitoso del mundo como warren buffett queriendo comprar las qué pensaríais nosotros como equipo como equipo ganador si queremos seguir siendo un equipo ganador necesitamos predecir el futuro mejor que nuestros competidores necesitamos predecir bien qué préstamo nos interesa conceder en qué derivados debemos meternos en que economías debemos crecer a qué empleados debemos incorporar sí no si no lo pre decimos bien daremos los préstamos que no nos convienen entraremos en los derivados que no nos interesa no atinar hemos a crecer las economías que van a ir bien contrataremos a gente que no debería estar aquí en esa labor de predecir el futuro la modelización y el data science son absolutamente fundamentales cuando se enfrenten a una base de datos por favor no tengáis piedad torturarla por arriba por abajo por la izquierda por la derecha por el centro usad las técnicas de modelización convencionales pero también ejecutar cualquier query cualquier análisis que se os pase por la cabeza sin ideas preconcebidas os aseguro que si lo hacemos lograremos resultados sorprendentes muchísimas gracias [Aplausos] [Música]