Una mayoría de PP y Vox es el resultado más probable. Pero la suma de PSOE, Más Madrid y Unidas Podemos mantiene 1 de cada 6 opciones.
Este miércoles se publicaron los últimos sondeos que podrán publicarse sobre las elecciones en la Comunidad de Madrid del 4 de mayo. Esas encuestas mantienen primero al PP (que ronda el 41% de los votos), seguido de PSOE (21%), Más Madrid (16%), Vox (9%-10%), Unidas Podemos (7%) y Ciudadanos (4%). A continuación ofrecemos la última predicción de EL PAÍS a partir de las encuestas difundidas.
Antes, conviene fijarse en las tendencias de los últimos días. En la derecha, el único movimiento es un ligero descenso de Ciudadanos —que se aleja más del 5% y reduce sus opciones de lograr representación—, pero en la izquierda hay uno más claro: el PSOE ha perdido 5 o 6 puntos desde marzo, mientras que Más Madrid se eleva del 11% al 16%.
El resultado de las elecciones depende de un duelo entre dos porcentajes: la suma de votos de PP y Vox (que ronda el 50%) y la de PSOE, Más Madrid y Podemos (45%). La diferencia se ha reducido de seis a cinco puntos en los últimos días, pero la izquierda todavía necesita sorprender a los sondeos para imponerse. Esos tres puntos que tienen que cambiar de bloque, en esencia, determinan las probabilidades de victoria de cada uno.
La predicción de escaños
El gráfico siguiente representa nuestra estimación de escaños a partir del promedio de sondeos. El PP rondaría los 59 diputados, seguido de PSOE (30), Más Madrid (23), Vox (13), Unidas Podemos (9) y Ciudadanos (0 de resultado probable; 2 de media).
Para hacer esta estimación usamos un modelo estadístico y simulamos las elecciones 25.000 veces, tal y como explica la metodología al final del texto. El modelo se alimenta de sondeos e incorpora una pieza clave de información: su acierto histórico. En España los sondeos se desvían del resultado unos dos puntos por partido, de media, y no es raro que cometan errores de tres o más puntos con alguno. Por eso es importante conocer su grado de precisión a la hora de hacer predicciones.
Es fácil ver la incertidumbre que todavía rodea estas elecciones. Por ejemplo, según nuestros cálculos el resultado más probable del PP son 59 escaños, pero su intervalo de 90% de probabilidad va desde 49 a 69 asientos. Es decir, que una de cada 20 veces veríamos al PP por encima (o por debajo) de esa franja. También es llamativo el caso de Ciudadanos: la probabilidad de que logre escaños es solo del 20%, pero si lo hace se llevará siete asientos, de manera que de media logrará dos (aunque ese resultado exacto es imposible).
La clave: quién alcanzará la mayoría
La principal ventaja de tener un modelo de predicción es que permite atribuir probabilidades a diferentes resultados, algo que los sondeos no pueden hacer por sí mismos. Eso nos permite responder la pregunta fundamental de estas elecciones: ¿Qué partidos tienen opciones de sumar los 69 diputados necesarios? El gráfico muestra el resumen:
METODOLOGÍA
Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en las elecciones de abril y noviembre de 2019, en México, Francia, el Reino Unido, Andalucía o Cataluña. Funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar la incertidumbre esperada, y 3) simular 15.000 elecciones para repartir escaños y calcular probabilidades.
Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisión. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha.
Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado e importante. Se necesita estimar la precisión esperada de los sondeos. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en España y miles internacionales.
Calibrar los errores esperados. Primero se estima el error de las encuestas en España. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 2 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, publicada en Nature. Se han analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: 1) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y 2) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).
Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación se utiliza una distribución multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver: «El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda España. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración».
Paso 3. Simular. El último paso consiste en ejecutar el modelo 15.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto número de escaños, alcanzar la mayoría, quedar primero, etcétera.
Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal últimamente. En los últimos dos o tres años han sido bastante precisas en España, aunque con excepciones, como las elecciones andaluzas de 2018. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.
Fuente Principal: El País.
Compilado por: Oliver Omar Rosales Ocampo.