ANOMALIA #1: El conteo inicial de votos es atípico
ANOMALIA #4: El número de votos en negativo en algunas
casillas
ANOMALIA #5: La diferencia de votos AMLO-Calderón tiene
tres regiones con transiciones abruptas
ANOMALIA #6: AMLO obtiene muchos menos votos al final de las actas
procesadas
ANOMALIA #9: La estadística de las diferencias de votos entre
AMLO-Calderón está desplazada
ANOMALIA
#1: EL
CONTEO INICIAL DE VOTOS ES ATIPICO
En la figura
1 se muestra a el porcentaje total de la
votación logrado por Calderón y por AMLO como función del porcentaje de actas
procesadas.
Cuando apenas se había computado el 1% de las actas, Calderón iba arriba por
alrededor de 7% (según recuerdo) y gradual pero sistemáticamente su porcentaje
iba disminuyendo mientras el porcentaje de AMLO iba aumentando. (las encuestas pre-electorales
predecían un empate técnico). Yo hubiera esperado un resultado muy fluctuante
que rápidamente se estabilizaría alrededor de los valores finales hacia el final
del conteo. Este resultado muestra que las primeras casillas contabilizadas
tuvieron resultados aparentemente atípicos y que le dieron a Calderón una
ventaja porcentual considerable que disminuyó conforme avanzaba el conteo. La
pregunta es ¿por
qué el inicio de las actas computadas (quizás poco más de 1000 actas) tuvo un
comportamiento tan aparentemente atípico? (ver abajo).
Advertencia: Modifiqué
la curva correspondiente a Madrazo añadiéndole 13%
para poder mostrarla en la misma gráfica. Por lo tanto, el lector deberá restar
13% del valor que lea en el eje vertical.
Figura 1
Gráfica previa
Datos (Datos
previos)
Finalmente, es curioso que la tendencia al alza de AMLO que se había
mantenido constante durante el 70% del conteo se revierte
rápidamente al llegar al 70%+ de las actas procesadas. Sin embargo, esto podría
explicarse si fuera que el voto rural, quizás mayoritariamente pro PRI, hubiera
empezado a llegar y a computarse cerca de las 2AM. Otra posible explicación es
la llegada de los resultados del noroeste, retrasada debido a las diferencias
de huso horario. Sin embargo, deberìa esperarse que si el
causante de dicha caída fuera el voto rural, entonces este también debería
haber afectado a los otros partidos, algo que no se observa en los datos. Lo mismo puede decirse del efecto del huso
horario.
ANOMALIA
#2:
En la figura 3 se muestra el número total de votos obtenidos por
los tres candidatos como función del número de actas procesadas. Curiosamente,
Calderón y AMLO incrementan su número de votos aproximadamente con la misma
velocidad. Calderón y AMLO recibieron aproximadamente el mismo número de votos
por casilla computada. Es por ello que me pareció atípico que en las primeras
casillas computadas (no mostradas) Calderón estableciera una fuerte diferencia
que no se modificó prácticamente en las demás casillas. Esta gráfica indica que el acercamiento entre los
porcentajes de la votación obtenidos por Calderón y por AMLO disminuyó al
transcurrir el tiempo sobre todo por el aumento del número total de votos
computados y no por que hubiera disminuido la diferencia de votos entre ellos
(ver figura 6).
Figura 3
Gráfica previa
Datos (Datos
previos)
ANOMALIA
#4: EL NUMERO DE VOTOS ES NEGATIVO EN ALGUNAS CASILLAS
En
esta figura muestro los votos obtenidos por Calderón, AMLO y Madrazo en cada casilla, promediados sobre todas las actas
que se procesaron en los 5-10 minutos en que el programa obtenía una nueva
radiografía del proceso. Esta gráfica muestra fluctuaciones aparentemente normales
(ver arriba) y resultados muy similares para los candidatos durante el tiempo
que el programa estuvo capturando datos. Hacia el final, el número de votos
disminuye y las fluctuaciones aumentan. Hay una
anomalía curiosa alrededor de las 61000-62000 actas procesadas, en que aparecen
estructuras similares correlacionadas en las curvas correspondientes a los tres
candidatos. Una anomalía que definitivamente requiere explicación corresponde a
los datos hacia el final del conteo, donde se ven fluctuaciones tan grandes que
se salen de la gráfica. En esta región se llegan a detectar más de
1200 votos por casilla. Creo que ninguna casilla debía haber recibido más
de 750 votos. Peor aún, algunos datos indican un número de votos por
casilla negativos. Estudiando con detalle una de éstas anomalías a través de las páginas del PREP, encontré que el número de actas
procesadas a las 12:39 era de 127772, mientras que hora y media después, a las
14:03, el número disminuyó abruptamente, situándose en 127752, por debajo
de su valor a las 12:39.
Figura 4
Gráfica previa
Datos (Datos previos)
ANOMALIA
#5:
La figura
5 muestra la diferencia entre los votos atribuidos a Calderón y a AMLO
como función del número de actas procesadas. La curva muestra claramente tres
regiones: una subida seguida de una caída, otra subida y finalmente algunas
fluctuaciones. Las primeras tres regiones muestran pendientes bastante
constantes y las transiciones de una a otra son bastante abruptas. El origen de
dichas transiciones debe ser explicado.
Figura 5
Gráfica previa
Datos (los mismos que para la figura
3) (Datos previos)
ANOMALIA
#6: AMLO OBTIENE MUCHOS MENOS VOTOS AL FINAL DE LAS ACTAS PROCESADAS
Las
figuras 13, 14 y 15 muestran el voto obtenido en cada acta como función
del número de proceso de dicha acta para Calderón, Madrazo
y AMLO respectivamente. Cada punto en la gráfica corresponde a un acta. Las
regiones obscuras corresponden a resultados frecuentes y deben ser cercanas a
las votaciones promedio (como las mostradas previamente en la figura 4. El ancho de dichas regiones corresponde a las dispersiones
alrededor de los valores promedio. Qué tanto difieran dichas regiones de ser
franjas horizontales es una medida de las variaciones de las preferencias
electorales entre el electorado que fue contado antes vs. después.
El voto en cada casilla es un número entero y puede aparecer un batimiento
entre las posiciones ocupadas por los puntos que representan los datos y los pixeles de la pantalla de su computadora. Es interesante
notar que las figuras correspondientes al PAN muestra
una franja relativamente ancha, mientras que la del PRI es una franja muy
angosta. ¿Representará esto el llamado voto duro del PRI? Por otro
lado, la figura correspondiente al PRD muestra una franja angosta pero con
muchos puntos que caen arriba de dicha franja. Para AMLO, la distribución parece
ser mucho más asimétrica que para sus contendientes. Las franjas claras
en la parte baja de las gráficas de Madrazo y de AMLO
muestran que en casi todas las casillas obtuvieron al menos una o dos decenas
de votos. Por otro lado, la franja clara correspondiente a Calderón está muy
tenuemente marcada y parece desaparecer después de la 90,000-ava casilla, lo cual implicaría que en un número
significativo de casillas recibió pocos o nulos votos. La franja clara
correspondiente a AMLO no desaparece, pero se adelgaza visiblemente en dicha
zona.
Pareciera ser que entre las últimas actas recibidas, muchas provinieron de
regiones muy polarizadas en las que barría ya fuera uno o el otro de los dos
contendientes principales. ¿Por qué son tan distintos los diagramas para cada
candidato? ¿Por qué cambia el comportamiento de los datos de Calderón y de AMLO
después del acta 90,000?
Figura 15
Datos.
ANOMALIA
#7:
Para
visualizar la distribución de votos de los candidatos principales de manera más
clara, en las figuras 16, 17 y 18 muestro los histogramas correspondientes a los
datos de las figuras 13, 14 y 15. Cada punto en esta
gráfica está determinado por dos números: uno (el que leemos en el eje
horizontal debajo de él) representa un posible número de votos; el otro (el que
leemos en el eje vertical a su izquierda) representa en cuantas actas se
reportó ese número de votos.
La figura 16, correspondiente a Madrazo, muestra un comportamiento muy común en procesos
con cierta aleatoriedad. Tiene un máximo que resulta estar en 53 votos con
una altura de 1603 actas, i.e., obtuvo 53 votos en 1603 de las cerca de 117000
actas. A ambos lados del máximo, el número de actas disminuye gradualmente con
algunas fluctuaciones. Como el número máximo de votos que podría haber obtenido
es mucho mayor que 55 (del orden de 700), mientras que el número mínimo de
votos que pudo haber sacado (0) es relativamente cercano a 55, el decaimiento
hacia la derecha es más lento que el decaimiento hacia la izquierda, i.e., su distribución
es unimodal (tiene un pico), y corresponde a una
curva suave ligeramente asimétrica. Se ve cualitativamente como la famosa campana
de Gauss pero deformada. Apenas obtuvo cero votos en un
manojo de actas.
Figura 16
Datos.
Los datos
correspondiente a AMLO se ven bastante peculiares. Tienen un máximo en
una posición cercana al máximo de Madrazo, aunque con
una altura menor. A la derecha del máximo muestra un decaimiento suave mucho
más extendido que el de Madrazo pero cualitativamente
similar. Lo que me llama mucho la atención es que el decaimiento hacia la
izquierda del máximo no parece ser una curva suave sino más bien podría
describirse muy bien por una burda línea recta, cuya ordenada al origen estaría
entre 25 y 50 actas donde habría obtenido 0 votos. De hecho, obtuvo 0 votos en
45 casillas. A diferencia de la curva típica de Madrazo, la de AMLO tiene un quiebre abrupto en el máximo.
Las curvas usuales suelen empezar con curvatura positiva, la cual cambia de
signo antes de llegar al máximo y vuelve a cambiar de signo a medio descenso. Esta curva podría
describirse como una curva típica a la que se le cortó una parte.
Figura 17
Datos.
Los datos correspondientes a
Calderón son más curiosos aún. Tienen un máximo muy ancho
cercano a los 80 votos por acta con una altura cercana a 700 actas. Hacia la
derecha tiene un decaimiento extendido y suave cualitativamente similar al de
AMLO. Hacia la izquierda, el decaimiento comienza de una manera normal, con la
misma forma que el de Madrazo, pero cambia su
comportamiento pues aparece un segundo pico con un máximo cerca de 15 votos. La
mayor parte de la contribución a este segundo pico se debe a las actas que más
tarde llegaron al IFE.
Figura 18
Datos.
Figura 19
Datos.
ANOMALIA
#8:
Curvas del número de casillas
donde Calderón, Madrazo y AMLO sacaron cierto número
de votos (figura 21.2). Estas son las
mismas que mis figuras 16, 17 y 18, pero superpuestas
y graficadas en un rango mayor. En la figura se ve claramente que las curvas
correspondientes a Calderón y a AMLO son my cercanas entre sí y siguen un comportamiento normal en la
región correspondiente a actas con más de 180 votos cada una. Sin embargo,
cerca de 180 votos, la curva correspondiente a AMLO cambia
abruptamente de pendiente situándose a la izquierda de este punto por debajo
de Calderón. No he podido encontrar una explicación para este cambio abrupto.
La parte superior de la curva de Calderón se ve muy plana y ancha comparada con
la de los otros dos candidatos. Finalmente, es donde se vuelven a encontrar las
dos distribbuciones donde aparece la anomalía
inferior de la curva de Calderón, la cual tiene un cambio abrupto de pendiente
volviéndose horizontal en el extremo izquierdo.
Figura 21.2
Datos.
ANOMALIA
#9:
Es importante conocer
las estadísticas de la diferencia de votos entre Calderón y AMLO para poder
entender la estructura de las figuras 17, 18 y 21.2. En la figura 21.5 muestro un
histograma de esta diferencia. A lo largo del eje horizontal se hallan la
ventaja que Calderón podría haberle llevado a López Obrador en alguna casilla.
El eje vertical indica el número de casillas en los que obtuvo precisamente esa
diferencia. Si la diferencia es negativa, simplemente significa que en las
casillas correspondientes López Obrador obtuvo más votos que Calderón. Cualitativamente,
la curva parece una gaussiana normal. Sin embargo,
los resultados cerca de dicho máximo tienen un comportamiento muy distinto al
de una curva normal. Para guiar el ojo, hice un ajuste Gaussiano
a todos los datos que se hallan debajo de de la marca de las 250 actas. Notamos
que el ajuste es bueno (no excelente) en la parte baja de la distribución, pero
que es pésimo en la parte alta. De los parámetros de la distribución notamos que su
centro está desplazado una distancia muy pequeña hacia la derecha, es decir,
que en promedio Calderón le hubiera ganado a AMLO en 0.1 votos por casilla si
la distribución hubiese sido la gaussiana ajustada
arriba, i.e., hubiera ganado la elección por 1000 votos aproximadamente. Sin
embargo, su ventaja fue mucho mayor gracias a la deformación en la cima de la
distribución. La distribución tiene un cambio discontinuo de pendiente cerca de
V=-100. ¿Por qué la distribución es aproximadamente gaussiana
en la mayor parte del intervalo? ¿Por qué la distorsión en la parte alta de
dicha distribución? ¿Por qué el cambio de pendiente es abrupto al llegar a
dicha distorsión?
Figura 21.5
Datos.
Parece ser que la
distorsión en la parte alta de la distribución mostrada arriba es
la responsable del aparente triunfo de Calderón. Para cuantificar su
contribución, en la figura 21.6 muestro la
diferencia entre los datos del PREP y la curva ajustada. Hay menos casillas en
las que AMLO gano por poco que las que seguirían de la distribución
normal, y hay más casillas donde Calderón ganó por pocos votos que las que
predice la distribución normal. Como si los datos de las actas con poca
diferencia migrado hacia la derecha. ¿Cual es el origen de la bajada y
subida?
ANOMALIA
#10:
Una forma de distinguir números
enteros grandes obtenidos de un proceso estocástico de números inventados tiene
que ver con su estadística. A continuación muestro un histograma del número de
veces que apareció cada digito entre el 0 y el 9 en la posición de las
unidades, i.e., no de las decenas, centenas, etc. La probabilidad de obtener
cierto dígito en la última posición debe ser la misma que para cualquier otro
dígito. Las figuras 24, 25 y 26 muestran que cada
dígito apareció más o menos el mismo número de veces para cada candidato,
alrededor de 11700 veces, aunque la dispersión de los datos para
AMLO parece ser la mitad que para los otros dos. Curioso.
Figura 24
Datos.
Figura 25
Datos.
Figura 26
Datos.
Algunas
preguntas en la primera versión de esta página pueden contestarse ahora que
tenemos más datos. Por ejemplo, la ventaja numérica inicial de Calderón sobre
AMLO en las primeras casillas computadas no fue tan grande como podría
suponerse de su gran ventaja porcentual, sino que se fue construyendo
gradualmente durante las primeras 70000 casillas computadas. No hay que olvidar
que un porcentaje se obtiene de hacer una división y puede resultar grande
tanto si el numerador es grande como si el denominador es pequeño. Sin embargo,
los nuevos datos originan nuevas dudas.
Si entiendo
bien, los resultados arriban al PREP en un orden determinado principalmente por
la accesibilidad y facilidades de comunicación. Así, los datos de ciudades
grandes arribarían antes que los de ciudades pequeñas y éstas antes que de
poblaciones rurales. Sin embargo, no esperaría otras distinciones geográficas
ni de clase socioeconómica. Por lo tanto me queda abierta la pregunta ¿son
normales y explicables los datos mostrados arriba? ¿cual
es su explicación? ¿son consistentes con resultados de
elecciones previas?
Es
importante resaltar que la elección se define por el valor final del recuento
de votos y que el 'ganador provisional' durante el recuento debería
considerarse un dato circunstancial sin valor alguno. Si las mismas boletas
fueran contadas en un orden distinto, podría fácilmente modificarse la
identidad del 'ganador provisional' durante parte, o incluso, durante la mayor
parte del conteo. Sin embargo, su identidad sí tiene un valor psicológico y estratégico,
pues fortalece la imagen entre la ciudadanía de que hay un ganador establecido
desde el inicio del conteo. De hecho, desde la noche de la elección, el
candidato del PAN argumentó que había estado por arriba de su contrincante
durante todo el conteo, como si esa infomación
sirviera para establecer su triunfo de manera irrebatible. Este argumento ha
sido repetido en días posteriores en los medios. La implicación es, desde
luego, falaz.
Si desea
comentar esta página, por favor envíeme un mensaje aquí o, mejor aún, añada un
comentario al blog. Puede consultar
los mensajes recibidos con anterioridad, organizados como cronológicamente o como hilos de discusión.