English version

Resumen del trabajo: elecciones presidenciales, México 2006

¿Anomalías en el PREP?

Luis Mochán

CCF-UNAM, Cuernavaca, Morelos

RESUMEN DE ANOMALIAS ENCONTRADAS EN EL PREP

(Favor de seguir los hipervínculos para leer la explicación de cada punto)

ANOMALIA #1:  El conteo inicial de votos es atípico

 

ANOMALIA #2: La diferencia de votos entre AMLO-Calderón prácticamente no se modifica con el número de actas procesadas   

 

ANOMALIA #3: El número de votos por casilla es mayor al permitido cuando se llevan entre 6100 y 6200 actas procesadas

 

ANOMALIA #4: El número de votos en negativo en algunas casillas

 

ANOMALIA #5: La diferencia de votos AMLO-Calderón tiene tres regiones con transiciones abruptas

 

ANOMALIA #6: AMLO obtiene muchos menos votos al final de las actas procesadas

 

ANOMALIA #7: La distribución del número de casillas con un cierto número de votos obtenidos no es una curva normal (Gaussiana) para AMLO y Calderón; para Madrazo sí lo es

 

ANOMALIA #8: La curva del número de casillas con un cierto número de casillas con un cierto número de votos para AMLO parece cortada; la de Calderón tiene una terminación anormal

 

ANOMALIA #9: La estadística de las diferencias de votos entre AMLO-Calderón está desplazada

 

ANOMALIA #10: La estadística del dígito menos significativo en los votos por acta es diferente en el caso de AMLO

 

Consideraciones finales

 

 


ANOMALIA #1:  EL CONTEO INICIAL DE VOTOS ES ATIPICO


En la figura 1 se muestra a el porcentaje total de la votación logrado por Calderón y por AMLO como función del porcentaje de actas procesadas. Cuando apenas se había computado el 1% de las actas, Calderón iba arriba por alrededor de 7% (según recuerdo) y gradual pero sistemáticamente su porcentaje iba disminuyendo mientras el porcentaje de AMLO iba aumentando. (las encuestas pre-electorales predecían un empate técnico). Yo hubiera esperado un resultado muy fluctuante que rápidamente se estabilizaría alrededor de los valores finales hacia el final del conteo. Este resultado muestra que las primeras casillas contabilizadas tuvieron resultados aparentemente atípicos y que le dieron a Calderón una ventaja porcentual considerable que disminuyó conforme avanzaba el conteo. La pregunta es ¿por qué el inicio de las actas computadas (quizás poco más de 1000 actas) tuvo un comportamiento tan aparentemente atípico? (ver abajo).

Advertencia: Modifiqué la curva correspondiente a Madrazo añadiéndole 13% para poder mostrarla en la misma gráfica. Por lo tanto, el lector deberá restar 13% del valor que lea en el eje vertical.

Figura 1

Gráfica previa
Datos (Datos previos)

Finalmente, es curioso que la tendencia al alza de AMLO que se había mantenido constante durante el 70% del conteo se revierte rápidamente al llegar al 70%+ de las actas procesadas. Sin embargo, esto podría explicarse si fuera que el voto rural, quizás mayoritariamente pro PRI, hubiera empezado a llegar y a computarse cerca de las 2AM. Otra posible explicación es la llegada de los resultados del noroeste, retrasada debido a las diferencias de huso horario. Sin embargo, deberìa esperarse que si el causante de dicha caída fuera el voto rural, entonces este también debería haber afectado a los otros partidos, algo que no se observa en los datos.  Lo mismo puede decirse del efecto del huso horario.


ANOMALIA #2: LA DIFERENCIA DE VOTOS AMLO-CALDERON PRACTICAMENTE NO SE MODIFICA CON EL NUMERO DE ACTAS PROCESADAS   


En la figura 3 se muestra el número total de votos obtenidos por los tres candidatos como función del número de actas procesadas. Curiosamente, Calderón y AMLO incrementan su número de votos aproximadamente con la misma velocidad. Calderón y AMLO recibieron aproximadamente el mismo número de votos por casilla computada. Es por ello que me pareció atípico que en las primeras casillas computadas (no mostradas) Calderón estableciera una fuerte diferencia que no se modificó prácticamente en las demás casillas. Esta gráfica indica que el acercamiento entre los porcentajes de la votación obtenidos por Calderón y por AMLO disminuyó al transcurrir el tiempo sobre todo por el aumento del número total de votos computados y no por que hubiera disminuido la diferencia de votos entre ellos (ver figura 6).

Figura 3

Gráfica previa
Datos (Datos previos)


ANOMALIA #3: EL NUMERO DE VOTOS POR CASILLAS ES MAYOR AL PERMITIDO CUANDO SE LLEVAN ENTRE 6100 y 6200 ACTAS PROCESADAS

 

ANOMALIA #4: EL NUMERO DE VOTOS ES NEGATIVO EN ALGUNAS CASILLAS


 

En esta figura muestro los votos obtenidos por Calderón, AMLO y Madrazo en cada casilla, promediados sobre todas las actas que se procesaron en los 5-10 minutos en que el programa obtenía una nueva radiografía del proceso. Esta gráfica muestra fluctuaciones aparentemente normales (ver arriba) y resultados muy similares para los candidatos durante el tiempo que el programa estuvo capturando datos. Hacia el final, el número de votos disminuye y las fluctuaciones aumentan. Hay una anomalía curiosa alrededor de las 61000-62000 actas procesadas, en que aparecen estructuras similares correlacionadas en las curvas correspondientes a los tres candidatos. Una anomalía que definitivamente requiere explicación corresponde a los datos hacia el final del conteo, donde se ven fluctuaciones tan grandes que se salen de la gráfica. En esta región se llegan a detectar más de 1200 votos por casilla. Creo que ninguna casilla debía haber recibido más de 750 votos. Peor aún, algunos datos indican un número de votos por casilla negativos. Estudiando con detalle una de éstas anomalías a través de las páginas del PREP, encontré que el número de actas procesadas a las 12:39 era de 127772, mientras que hora y media después, a las 14:03, el número disminuyó abruptamente, situándose en 127752, por debajo de su valor a las 12:39.

Figura 4

Gráfica previa
Datos (Datos previos)


ANOMALIA #5: LA DIFERENCIA DE VOTOS AMLO-CALDERON TIENE TRES REGIONES  CON TRANSICIONES ABRUPTAS


La figura 5 muestra la diferencia entre los votos atribuidos a Calderón y a AMLO como función del número de actas procesadas. La curva muestra claramente tres regiones: una subida seguida de una caída, otra subida y finalmente algunas fluctuaciones. Las primeras tres regiones muestran pendientes bastante constantes y las transiciones de una a otra son bastante abruptas. El origen de dichas transiciones debe ser explicado.

Figura 5

Gráfica previa
Datos (los mismos que para la figura 3) (Datos previos)


ANOMALIA #6: AMLO OBTIENE MUCHOS MENOS VOTOS AL FINAL DE LAS ACTAS PROCESADAS


Las figuras 13, 14 y 15 muestran el voto obtenido en cada acta como función del número de proceso de dicha acta para Calderón, Madrazo y AMLO respectivamente. Cada punto en la gráfica corresponde a un acta. Las regiones obscuras corresponden a resultados frecuentes y deben ser cercanas a las votaciones promedio (como las mostradas previamente en la figura 4. El ancho de dichas regiones corresponde a las dispersiones alrededor de los valores promedio. Qué tanto difieran dichas regiones de ser franjas horizontales es una medida de las variaciones de las preferencias electorales entre el electorado que fue contado antes vs. después. El voto en cada casilla es un número entero y puede aparecer un batimiento entre las posiciones ocupadas por los puntos que representan los datos y los pixeles de la pantalla de su computadora. Es interesante notar que las figuras correspondientes al PAN muestra una franja relativamente ancha, mientras que la del PRI es una franja muy angosta. ¿Representará esto el llamado voto duro del PRI? Por otro lado, la figura correspondiente al PRD muestra una franja angosta pero con muchos puntos que caen arriba de dicha franja. Para AMLO, la distribución parece ser mucho más asimétrica que para sus contendientes. Las franjas claras en la parte baja de las gráficas de Madrazo y de AMLO muestran que en casi todas las casillas obtuvieron al menos una o dos decenas de votos. Por otro lado, la franja clara correspondiente a Calderón está muy tenuemente marcada y parece desaparecer después de la 90,000-ava casilla, lo cual implicaría que en un número significativo de casillas recibió pocos o nulos votos. La franja clara correspondiente a AMLO no desaparece, pero se adelgaza visiblemente en dicha zona. Pareciera ser que entre las últimas actas recibidas, muchas provinieron de regiones muy polarizadas en las que barría ya fuera uno o el otro de los dos contendientes principales. ¿Por qué son tan distintos los diagramas para cada candidato? ¿Por qué cambia el comportamiento de los datos de Calderón y de AMLO después del acta 90,000?

Figura 13

Figura 14

Figura 15

Datos.


ANOMALIA #7: LA DISTRIBUCION DEL NUMERO DE CASILLAS CON UN CIERTO NUMERO DE VOTOS OBTENIDOS NO ES UNA CURVA NORMAL (GAUSSIANA) PARA AMLO Y CALDERON; PARA MADRAZO SI LO ES 


Para visualizar la distribución de votos de los candidatos principales de manera más clara, en las figuras 16, 17 y 18 muestro los histogramas correspondientes a los datos de las figuras 13, 14 y 15. Cada punto en esta gráfica está determinado por dos números: uno (el que leemos en el eje horizontal debajo de él) representa un posible número de votos; el otro (el que leemos en el eje vertical a su izquierda) representa en cuantas actas se reportó ese número de votos.

La figura 16, correspondiente a Madrazo, muestra un comportamiento muy común en procesos con cierta aleatoriedad. Tiene un máximo que resulta estar en 53 votos con una altura de 1603 actas, i.e., obtuvo 53 votos en 1603 de las cerca de 117000 actas. A ambos lados del máximo, el número de actas disminuye gradualmente con algunas fluctuaciones. Como el número máximo de votos que podría haber obtenido es mucho mayor que 55 (del orden de 700), mientras que el número mínimo de votos que pudo haber sacado (0) es relativamente cercano a 55, el decaimiento hacia la derecha es más lento que el decaimiento hacia la izquierda, i.e., su distribución es unimodal (tiene un pico), y corresponde a una curva suave ligeramente asimétrica. Se ve cualitativamente como la famosa campana de Gauss pero deformada. Apenas obtuvo cero votos en un manojo de actas.

Figura 16

Datos.

Los datos correspondiente a AMLO se ven bastante peculiares. Tienen un máximo en una posición cercana al máximo de Madrazo, aunque con una altura menor. A la derecha del máximo muestra un decaimiento suave mucho más extendido que el de Madrazo pero cualitativamente similar. Lo que me llama mucho la atención es que el decaimiento hacia la izquierda del máximo no parece ser una curva suave sino más bien podría describirse muy bien por una burda línea recta, cuya ordenada al origen estaría entre 25 y 50 actas donde habría obtenido 0 votos. De hecho, obtuvo 0 votos en 45 casillas. A diferencia de la curva típica de Madrazo, la de AMLO tiene un quiebre abrupto en el máximo. Las curvas usuales suelen empezar con curvatura positiva, la cual cambia de signo antes de llegar al máximo y vuelve a cambiar de signo a medio descenso. Esta curva podría describirse como una curva típica a la que se le cortó una parte.

Figura 17

Datos.

Los datos correspondientes a Calderón son más curiosos aún. Tienen un máximo muy ancho cercano a los 80 votos por acta con una altura cercana a 700 actas. Hacia la derecha tiene un decaimiento extendido y suave cualitativamente similar al de AMLO. Hacia la izquierda, el decaimiento comienza de una manera normal, con la misma forma que el de Madrazo, pero cambia su comportamiento pues aparece un segundo pico con un máximo cerca de 15 votos. La mayor parte de la contribución a este segundo pico se debe a las actas que más tarde llegaron al IFE.

Figura 18

Datos.

Figura 19

Datos.


ANOMALIA #8: LA CURVA DEL NUMERO DE CASILLAS CON UN CIERTO NUMERO DE VOTOS PARA AMLO PARECE CORTADA; LA DE CALDERON TIENE UNA TERMINACION ANORMAL


 

Curvas del número de casillas donde Calderón, Madrazo y AMLO sacaron cierto número de votos (figura 21.2). Estas son las mismas que mis figuras 16, 17 y 18, pero superpuestas y graficadas en un rango mayor. En la figura se ve claramente que las curvas correspondientes a Calderón y a AMLO son my cercanas entre sí y siguen un comportamiento normal en la región correspondiente a actas con más de 180 votos cada una. Sin embargo, cerca de 180 votos, la curva correspondiente a AMLO cambia abruptamente de pendiente situándose a la izquierda de este punto por debajo de Calderón. No he podido encontrar una explicación para este cambio abrupto. La parte superior de la curva de Calderón se ve muy plana y ancha comparada con la de los otros dos candidatos. Finalmente, es donde se vuelven a encontrar las dos distribbuciones donde aparece la anomalía inferior de la curva de Calderón, la cual tiene un cambio abrupto de pendiente volviéndose horizontal en el extremo izquierdo.

Figura 21.2

Datos.


ANOMALIA #9: LA  ESTADISTICA DE LAS DIFERENCIAS DE VOTOS ENTRE AMLO-CALDERON ESTA DESPLAZADA

 


Es importante conocer las estadísticas de la diferencia de votos entre Calderón y AMLO para poder entender la estructura de las figuras 17, 18 y 21.2. En la figura 21.5 muestro un histograma de esta diferencia. A lo largo del eje horizontal se hallan la ventaja que Calderón podría haberle llevado a López Obrador en alguna casilla. El eje vertical indica el número de casillas en los que obtuvo precisamente esa diferencia. Si la diferencia es negativa, simplemente significa que en las casillas correspondientes López Obrador obtuvo más votos que Calderón. Cualitativamente, la curva parece una gaussiana normal. Sin embargo, los resultados cerca de dicho máximo tienen un comportamiento muy distinto al de una curva normal. Para guiar el ojo, hice un ajuste Gaussiano a todos los datos que se hallan debajo de de la marca de las 250 actas. Notamos que el ajuste es bueno (no excelente) en la parte baja de la distribución, pero que es pésimo en la parte alta. De los parámetros de la distribución notamos que su centro está desplazado una distancia muy pequeña hacia la derecha, es decir, que en promedio Calderón le hubiera ganado a AMLO en 0.1 votos por casilla si la distribución hubiese sido la gaussiana ajustada arriba, i.e., hubiera ganado la elección por 1000 votos aproximadamente. Sin embargo, su ventaja fue mucho mayor gracias a la deformación en la cima de la distribución. La distribución tiene un cambio discontinuo de pendiente cerca de V=-100. ¿Por qué la distribución es aproximadamente gaussiana en la mayor parte del intervalo? ¿Por qué la distorsión en la parte alta de dicha distribución? ¿Por qué el cambio de pendiente es abrupto al llegar a dicha distorsión?

Figura 21.5

Datos.


Parece ser que la distorsión en la parte alta de la distribución mostrada arriba es la responsable del aparente triunfo de Calderón. Para cuantificar su contribución, en la figura 21.6 muestro la diferencia entre los datos del PREP y la curva ajustada. Hay menos casillas en las que AMLO gano por poco que las que seguirían de la distribución normal, y hay más casillas donde Calderón ganó por pocos votos que las que predice la distribución normal. Como si los datos de las actas con poca diferencia migrado hacia la derecha. ¿Cual es el origen de la bajada y subida?

Figura 21.6

Datos.


ANOMALIA #10: LA  ESTADISTICA DEL DIGITO MENOS SIGNIFICATIVO EN LOS VOTOS POR ACTA ES DIFERENTE EN EL CASO DE AMLO

 


Una forma de distinguir números enteros grandes obtenidos de un proceso estocástico de números inventados tiene que ver con su estadística. A continuación muestro un histograma del número de veces que apareció cada digito entre el 0 y el 9 en la posición de las unidades, i.e., no de las decenas, centenas, etc. La probabilidad de obtener cierto dígito en la última posición debe ser la misma que para cualquier otro dígito. Las figuras 24, 25 y 26 muestran que cada dígito apareció más o menos el mismo número de veces para cada candidato, alrededor de 11700 veces, aunque la dispersión de los datos para AMLO parece ser la mitad que para los otros dos. Curioso.

Figura 24

Datos.

Figura 25

Datos.

Figura 26

Datos.

 


CONSIDERACIONES FINALES


Algunas preguntas en la primera versión de esta página pueden contestarse ahora que tenemos más datos. Por ejemplo, la ventaja numérica inicial de Calderón sobre AMLO en las primeras casillas computadas no fue tan grande como podría suponerse de su gran ventaja porcentual, sino que se fue construyendo gradualmente durante las primeras 70000 casillas computadas. No hay que olvidar que un porcentaje se obtiene de hacer una división y puede resultar grande tanto si el numerador es grande como si el denominador es pequeño. Sin embargo, los nuevos datos originan nuevas dudas.

Si entiendo bien, los resultados arriban al PREP en un orden determinado principalmente por la accesibilidad y facilidades de comunicación. Así, los datos de ciudades grandes arribarían antes que los de ciudades pequeñas y éstas antes que de poblaciones rurales. Sin embargo, no esperaría otras distinciones geográficas ni de clase socioeconómica. Por lo tanto me queda abierta la pregunta ¿son normales y explicables los datos mostrados arriba? ¿cual es su explicación? ¿son consistentes con resultados de elecciones previas?

Es importante resaltar que la elección se define por el valor final del recuento de votos y que el 'ganador provisional' durante el recuento debería considerarse un dato circunstancial sin valor alguno. Si las mismas boletas fueran contadas en un orden distinto, podría fácilmente modificarse la identidad del 'ganador provisional' durante parte, o incluso, durante la mayor parte del conteo. Sin embargo, su identidad sí tiene un valor psicológico y estratégico, pues fortalece la imagen entre la ciudadanía de que hay un ganador establecido desde el inicio del conteo. De hecho, desde la noche de la elección, el candidato del PAN argumentó que había estado por arriba de su contrincante durante todo el conteo, como si esa infomación sirviera para establecer su triunfo de manera irrebatible. Este argumento ha sido repetido en días posteriores en los medios. La implicación es, desde luego, falaz.

Si desea comentar esta página, por favor envíeme un mensaje aquí o, mejor aún, añada un comentario al blog. Puede consultar los mensajes recibidos con anterioridad, organizados como cronológicamente o como hilos de discusión.