Elecciones Presidenciales, México 2012
W. Luis Mochán Backal
Julio 1, 2012-
Última actualización
Table of Contents
1 Algunos datos del PREP
Los datos mostrados a continuación son tomados de la base de datos que liberó el IFE el 2 de julio a las 8:00PM. Algunos de ellos son algo irrelevantes y otros tienen más sustancia.
1.1 Sobre la base de datos
- La base de datos tiene 144,013 registros.
- Hay 320 registros correspondientes al número de sección 0 que acumularon 45,095 votos.
- 312 son Básicas con lista nominal de 59,046 y recibieron 42598 votos.
- 8 son Contiguas con lista nominal 0 y recibieron 2497 votos.
- Parecen ser las relativas al voto en el extranjero.
- Mi base de datos de casillas no las tiene.
- Incluyen las 305 casillas que tienen TIPO_ACTA=1, que no está documentado en la base de datos, pero también otras 15 casillas más.
- Las casillas se distribuyeron en
- 91,906 casillas urbanas,
- 51,531 no urbanas
- 576 sin clasificación.
- De las 576 sin clasificación
- 15 corresponden a la sección 0, donde (creo) que votan los extranjeros.
- 84 son básicas,
- 269 son contiguas,
- 175 son extraordinarias y
- 48 son especiales.
- La lista nominal es de 79,392,217 votantes potenciales.
- 53,322,775 votantes en casillas urbanas,
- 26,169,442 votantes en casillas no urbanas.
- 0 votantes en las casillas no clasificadas.
- Estos datos son consistentes con los publicados en ésta página, donde se discute el aumento en la lista nominal y en el número de casillas no-urbanas y su comparación con la disminución relativa de la población rural.
- Yo hubiera esperado que las casillas con lista nominal=0
hubiesen sido únicamente las especiales. Sin embargo las
casillas sin clasificación respecto a ubicación tienen listado
nominal = 0 y son
- 84 básicas,
- 269 contiguas,
- 175 extraordinarias y
- 48 especiales.
- Por otro lado, hubo 1478 casillas donde la lista nominal era
cero. Estas fueron
- 84 básicas,
- 269 contiguas,
- 175 extraordinarias y
- 950 especiales.
- No entiendo por qué hay casillas básicas y contíguas que no son ni urbanas ni no-urbanas y que además tienen listado nominal=0.
- Hubo 19 casillas donde la lista nominal superó los 750 votos, incluyendo 15 básicas y 4 contíguas, con lista nominal total de 17,644.
- Hubo 15,756 secciones cuya lista nominal sobrepasó los 1500
votantes. Estas secciones incluyen 61,802 casillas y su lista
nominal es de 38,118,884.
- El COFIPE sí permite en casos excepcionales secciones con más de 1,500 votantes nominales, cuando el crecimiento poblacional lo justifique. Sin embargo, es raro que la mitad de los votantes lo hagan en secciones 'excepcionales'.
1.2 Sobre los resultados
- El resultado de la elección fue
PAN PRI PRD PVEM PT MC PANAL C-PRI-PVEM C-PRD-PT-MC C-PRD-PT C-PRD-MC C-PT-MC NO-REGISTRADOS NULOS TOTAL-VOTOS LISTA-NOMINAL 12,560,758 14,323,820 9,645,472 950,877 1,218,282 986,260 1,137,848 3,611,143 2,940,408 610,708 181,441 92,534 46,863 1,220,217 49,526,631 79,492,217 - Agrupando los resultados por candidato, obtenemos
JVM EPN AMLO GQ NO-REG. NULOS TOT LISTA-NOMINAL Núm. 12,560,758 18,885,840 15,675,105 1,137,848 46,863 1,220,217 49,526,631 79,492,217 % 25.36 38.13 31.65 2.30 0.09 2.46 99.99 - (El error de redondeo en esta tabla suma 0.01%)
- El porcentaje de participación ciudadana fue de 62.30%.
- Yo hubiera esperado que las casillas con lista nominal=0
hubiesen sido únicamente las especiales. Sin embargo las
casillas sin clasificación respecto a ubicación tienen listado
nominal = 0 y son
- 84 básicas que recibieron 25,269 votos,
- 269 contiguas que recibieron 91,560 votos,
- 175 extraordinarias con 60,637 votos y
- 48 especiales con 24,320 votos
para un total de 201,786 votos.
- En estas casillas hubo 201,786 votos.
- Los resultados en estas casillas fueron
JVM EPN AMLO GQ NO-REG NULOS TOT Núm. 50,838 77,310 64,412 4,352 81 4,793 201,786 % 25.19 38.31 31.92 2.16 0.04 2.38 100.00 - Curiosamente, los porcentajes sobre estas casillas extrañas son muy similares a los de la elección completa; ¡estas casillas forman un excelente muestreo de todo el país!
- Otro conjunto curioso de casillas son aquellas que tienen lista
nominal nula y sin embargo no son especiales. De estas hay 528 casillas.
- 84 básicas,
- 269 contiguas y
- 175 extraordinaria.
- En estas casillas hubo 177,466 votos.
- Los resultados en dichas casillas fueron
JVM EPN AMLO GQ NO-REG NULOS TOT Núm. 44,243 69,735 55,015 3,943 75 4,455 177,466 % 24.93 39.29 31.00 2.22 0.04 2.51 99.99 - Por otro lado, los resultados sobre las casillas especiales,
donde sí era de esperar que hubiese listados nominales nulos,
fueron
JVM EPN AMLO GQ NO-REG NULOS TOT Núm. 165,150 166,845 244,312 9,716 438 7,308 593,769 % 27.81 28.10 41.15 1.64 0.07 1.23 100.00 - En las casillas especiales vota la gente que está de tránsito, lejos de su vivienda o trabajo, por lo cual ha de ser difícil comprar o coaccionar sus votos.
- Los resultados sobre todas las casillas con lista nominal cero son
JVM EPN AMLO GQ NO-REG NULOS TOT Núm. 209393 236580 299327 13659 513 11763 771235 % 27.15 30.68 38.81 1.77 0.07 1.53 - De nueva cuenta, los resultados difieren de los nacionales y se parecen a los de las casillas especiales.
- En las casillas con número de sección 0 votan (creo) los residentes en el extranjero.
- Los resultados en dichas casillas fueron
JVM EPN AMLO GQ NO-REG NULOS TOT LISTA-NOMINAL Núm. 18,097 7,912 17,598 916 81 491 45,095 59,046 % 40.13 17.55 39.02 2.03 0.18 1.09 100.00 - De nueva cuenta, estos resultados difieren notablemente de los resultados nacionales. Los residentes en el extranjero votaron en primer lugar por JVM. AMLO está en segundo lugar pero casi empatado, mientras que ¡EPN queda 22% detrás!.
- Los residentes en el extranjero no parecen querer mucho al PRI.
- Además, no es fácil comprar o coaccionar el voto del extranjero.
- Los resultados sobre las 91,906 casillas urbanas fueron
JVM EPN AMLO GQ NO-REG NULOS TOT LISTA-NOMINAL Núm. 8517296 11722426 11223203 805981 32987 682468 32984361 53322775 % 25.82 35.54 34.03 2.44 0.10 2.07 - Notamos un resultado muy cerrado entre EPN y AMLO, arriba de JVM.
- Los resultados sobre las 51,531 casillas no urbanas son
JVM EPN AMLO GQ NO-REG NULOS TOT LISTA-NOMINAL Núm. 3992624 7086104 4387490 327515 13795 532956 16340484 26169442 % 24.43 43.37 26.85 2.00 0.08 3.26 - Aquí, la ventaja de EPN es enorme mientras que JVM y AMLO están casi empatados.
- Es importante la dependencia tan fuerte de los resultados
dado que la evolución reciente entre el número de casillas y de
votantes en casillas urbanas y no-urbanas no es consistente con
la evolución de la población del país registrada por el INEGI.
- De 2006 a 2012, el número de casillas no-urbanas se incrementó significativamente más que el número de casillas urbanas y el número de electores potenciales también, pasando de alrededor de 19 millones a cerca de 26 millones, y del 27% al 33% del listado nominal completo.
- Estos datos son curiosos en el contexto de los datos del INEGI, que muestran un reducción contínua del porcentaje de la población rural, la que, por ejemplo, bajo de 25% en 2000 a 22% en 2010.
- El IFE tiene varios esquemas de clasificación de casillas y que no son consistentes entre sí. En particular, rurales+mixtas no es igual a no-urbanas.
- En las 19 casillas cuyas listas nominales superaron el límite de 750, hubo 7598 votos y en ellas gano EPN con 42.88% contra 33.09% para JVM y 20.07% para AMLO.
- En las 61,802 casillas que formaron parte de las 15,756 secciones donde la lista nominal sobrepasó el tope de 1500 votantes nominales se recibieron 23,312,572 votos. En esos, ganó EPN con 37.66% vs. AMLO con 32.40% y JVM con 25%.
1.3 Mecanismo de registro
Durante la noche de la elección cada acta tuvo que ser llevada a uno de los Centros Distritales, donde sería acopiada, sellada y puesta en una cola para que sus datos sean capturados e inmediatamente enviados a las computadoras centrales del IFE, donde serían registrados. La base de datos del PREP indica la hora de acopio, la de captura y la de registro.
- Hay 3462 actas donde no se registró la hora de acopio, indicando que no llegaron a los centros distritales o no se cumplió el protocolo.
- Hubo 1785 actas que no fueron capturadas en los centros distritales (no tienen indicada la hora de captura).
- Hubo 1480 actas que no fueron registradas.
- Hay 140,551 actas que sí fueron acopiadas.
- Hubo 142,228 actas que sí fueron capturadas.
- Hubo 142,553 actas que sí fueron registradas.
- Aquí empieza lo divertido. Hubo 1677 actas que sí fueron capturadas ¡a pesar de que no fueron acopiadas!.
- Hubo 305 actas que sí fueron registradas ¡a pesar de no haber sido capturadas! De éstas, ninguna fue acopiada. Todas éstas
corresponden a casillas básicas tipo 1 (¿qué significa? la base
de datos no lo explica) y se
distribuyeron en:
- Aguascalientes 3
- Baja California 8
- Baja California Sur 2
- Campeche 2
- Coahuila 7
- Colima 2
- Chiapas 12
- Chihuahua 9
- Distrito Federal 32
- Durango 4
- Guanajuato 14
- Guerrero 9
- Hidalgo 7
- Jalisco 19
- México 40
- Michoacán 12
- Morelos 5
- Nayarit 3
- Nuevo León 12
- Oaxaca 11
- Puebla 16
- Querétaro 4
- Quintana Roo 3
- San Luis Potosí 7
- Sinaloa 8
- Sonora 7
- Tabasco 6
- Tamaulipas 8
- Tlaxcala 3
- Veracruz 21
- Yucatán 5
- Zacatecas 4.
- Y hubo 1982 actas que se sí fueron registradas en las
computadoras centrales a pesar de no haber sido acopiadas, sin que hubiesen sido entregadas en ningún distrito. De éstas
- 1038 fueron casillas básicas,
- 855 fueron contiguas,
- 76 fueron extraordinarias y
- 13 fueron especiales.
Además, de éstas,
- 1368 fueron urbanas,
- 597 fueron no urbanas
- 17 no tuvieron clasificación.
- Estas incluyen las 305 de arriba, además de otras 1677. Se
distribuyern 1038 en casillas básicas 1038, 855 en contiguas,
76 en extraordinarias y 13 en especiales y se distribuyeron
como:
- Aguascalientes 12
- Baja California 110
- Baja California Sur 12
- Campeche 15
- Coahuila 60
- Colima 11
- Chiapas 91
- Chihuahua 79
- Distrito Federal 146
- Durango 57
- Guanajuato 83
- Guerrero 128
- Hidalgo 19
- Jalisco 179
- México 247
- Michoacán 41
- Morelos 22
- Nayarit 16
- Nuevo León 101
- Oaxaca 32
- Puebla 35
- Querétaro 20
- Quintana Roo 21
- San Luis Potosí 19
- Sinaloa 24
- Sonora 95
- Tabasco 57
- Tamaulipas 93
- Tlaxcala 12
- Veracruz 97
- Yucatán 35
- Zacatecas 13
- ¿Cómo pudieron registrar dichas actas?
- La siguiente figura compara la hora de acopio de los datos en
los centros distritales y los correspondientes tiempos de
registro de sus datos en las computadoras centrales.
:FAcopio :
- Cada acta (que fuese acopiada y registrada) corresponde a un punto sobre esta gráfica. Su tiempo de registro (a partir de las 0 horas del 1o de julio, hora del centro) se indica en el eje horizontal mientras que el eje vertical grafico el tiempo que tardaron en registar los datos después de haber recibido el acta.
- El tiempo en la gráfica está medido en horas.
- La gráfica muestra dos líneas verticales en que no hay puntos. Estas regiones muestran que el proceso de registro de actas se detuvo alrededor de las dos de la tarde y de las cuatro de la tarde del dos de julio.
- ¿Se habrá caido el sistema momentáneamente?
- La segunda interrupción duró alrededor de dos horas y media.
- El tiempo mínimo entre acopio y registro fue de 50.94 segundos. Me parece extremadamente rápido.
- Las diez casillas más rápidas en registrarse fueron
- Ags. (D)istrito 3, (S)ección 234 casilla (B)ásica urbana registrada el 2012-07-01 a las 21:17:00.0 tardó 51s.
- DF, D1, S967 (C)ontigua-1 urbana el 2012-07-02 a las 06:20:00, tardó 55s.
- Chih. D6 S641 C1 urbana el 2012-07-02 a las 06:07:00, tardó 57s.
- Nayarit D1 S491 B no-urbana el 2012-07-02 a las 10:20:00, tardó 60s.
- Zac. D1 S277 B no-urbana el 2012-07-02 a las 02:07:00.0, tardó 61s.
- México D31 S3523 C1 urbana el 2012-07-02 a las 08:59:00.0, tardó 63s.
- Mich. D6 S551 B no-urbana el 2012-07-01 a las 22:25:00 tardó 63s.
- Tamaulipas D3 S995 C5 no-urbana el 2012-07-02 a las 09:15:00.0 tardó 66s.
- DF D2 S1060 B urbana el 2012-07-01 a las 22:19:00 tardó 67s.
- Guerrero D9 S162 C1 urbana el 2012-07-02 a las 07:43:00.0 tardó 67s.
- Esto muestra que se tenía la capacidad de capturar un acta en tiempos tan bajos como un minuto, aún en zonas no urbanas.
- FALTA: ¿Cómo se ven los resultados de estas actas?
- Por otro lado, el tiempo más largo entre acopio y registro ¡fue de 21 horas con 21 minutos!
- Las diez casillas más lentas en registrarse fueron
- Tamaulipas D1 S902 C1 urbana el 2012-07-01 a las 22:20:00.0, tardó 21.33 horas
- Guerrero D1 S1085 B no-urbana, el 2012-07-01 a las 21:27:00, tardó 21.29hrs.
- Michoacán D5 S2447 B urbana, el 2012-07-01 a las 21:45:00.0, tardó 21.09hrs.
- Veracruz D12 S4799 B urbana el 2012-07-01 a las 21:58:00 tardó 21.07hrs.
- DF D22 S2701 C1 urbana el 2012-07-01 a las 22:25:00 tardó 21.01hrs.
- Querétaro D2 S571 C2 urbana el 2012-07-01 a las 22:39:00.0 tardó 21.01hrs
- Quintana Roo D3 S25 C1 urbana el 2012-07-01 a las 21:48:00 tardó 20.94hrs.
- Jalisco D8 S577 C1 urbana el 2012-07-01 a las 21:51:00.0 tardó 20.80hrs.
- Jalisco D10 S3137 B1 urbana el 2012-07-01 a las 22:46:00.0 tardó 20.76hrs.
- Veracruz D10 S1873 1B urbana el 2012-07-01 a las 22:51:00 tardó 20.69hrs.
- FALTA: ¿Cómo se ven éstas actas?
- ¿Qué ṕuede explicar estos retrasos?
- El retraso promedio entre acopio y registro fue de una hora con nueve minutos.
- Hubo 46,838 actas que tardaron más de una hora en fila antes de ser capturadas,
- 25623 tardaron más de dos horas,
- 13,860 tardaron más de tres horas y
- 7,422 tardaron más de cuatro horas.
- FALTA: ¿Cómo varía el resultado de la elección como función de este retraso?
- :SRegCap : El proceso de captura puede ser lento pues es llevado a cabo por humanos y debe repetirse y verificarse. Por ello, es razonable que haya algunos retrasos, sobre todo durante la noche de la elección cuando el flujo de actas hacia los centros distritales es máximo. Esto produce que las actas deban formarse en fila antes de ser capturadas.
- Sin embargo, una vez capturados los datos, éstos quedan dentro del sistema de cómputo y pueden transmitirse prácticamente instanténeamente a las computadoras centrales donde es registrada. El retraso entre captura y registro debería ser mínimo.
- La siguiente figura compara la hora de captura de los datos en
los centros distritales y el correspondiente tiempo de
registro de los mismos en las computadoras centrales.
- La forma de leer esta gráfica es análoga a la anterior; cada acta correponde a un punto, el eje horizontal corresponde a la hora de registro, medida en horas a partir de las 0:00 del 1o de julio, y el eje vertical corresponde al retraso entre captura y registro.
- La figura muestra que efectivamente, para casi todas las actas, el retraso es despreciable.
- El retraso mínimo fue de 2.36 segundos y
- 75,394 actas fueron registradas en menos de diez segundos despúes de haber sido capturadas.
- Sin embargo, 1,431 tardaron más de un minuto, 561 más de una hora, 393 más de dos horas, 122 más de tres horas,
- y hubo una decena de actas que tardaron más de 6 horas.
- La que más tardó, pasó siete horas en el sistema.
- ¿Por qué estos retrasos?
- ¿Qué les pudo pasar a los datos durante el tiempo que transcurrió entre la captura en las computadoras de los centros distritales y su registro en las computadoras centrales?
- Esta gráfica muestra claramente las fallas a las 14:00 y a las 16:00 horas del lunes 2012-07-02.
- Terminando la interrupción de las 16:00-18:30 empezaron a llegar la información que estaba en cola. Sin embargo, los retrasos fueron no de dos y media horas, sino hasta de 7 horas.
- FALTA: ¿Averiguar sobre estas actas?
1.4 Problemas con actas.
- Existen 2,109 actas donde algún campo fue ilegible
- 424 PAN
- 442 PRI
- 441 PRD
- 410 PVEM
- 381 PT
- 388 MC
- 347 PANAL
- 475 C-PRI-PVEM
- 464 C-PRD-PT-MC
- 434 C-PRD-PT
- 537 C-PRD-MC
- 560 C-PT-MC
- 807 NO-REGISTRADOS
- 480 NULOS
La suma de los números previos es mayor a 2109 pues en algunas actas varios campos son ilegibles.
- Existen 195 registros donde todos los campos correspondientes a algún partido están marcados como ilegibles.
- Existen 3,157 registros donde los campos correspondientes a algún
partido quedaron vacíos. De hecho, en estos, los campos
correspondientes a todos los partidos quedaron vacíos. Estos
tienen cero votos.
- 1668 son básicas,
- 1287 contíguas,
- 180 extraordinarias y
- 22 especiales.
- Hay 17,140 registros donde se anotó la leyenda 'Sin dato' a
alguno de los partidos.
- 220 corresponden al PAN,
- 354 al PRI,
- 624 al PRD,
- 3162 al PVEM,
- 3023 al PT,
- 3598 al MC,
- 1139 al PANAL,
- 2964 a la coalición C_PRI_PVEM,
- 3341 a C_PRD_PT_MC,
- 5620 a C_PRD_PT,
- 8065 a C_PRD_MC,
- 9755 a C_PT_MC,
- 15529 a NO_REGISTRADOS,
- 1669 a NULOS.
- Hay 15,463 registros donde algún partido tiene un campo en
blanco o el campo se registró como 'ilegible' o como 'sin
dato'. En algunos registros hubo datos de varios partidos
faltantes. Estos registros se distribuyeron como
- pan-3801
- pri-3953
- pvem-6729
- c_pri_pvem-6596
- prd-4222
- pt-6561
- mc-7143
- c_prd_pt_mc-6962
- c_prd_pt-9211
- c_prd_mc-11759
- c_PT_MC-13472
- panal-4643
- nulos-5306
- no_registrados-19493
y agrupándolos por candidato
- JVM-3801
- EPN-7801
- AMLO-14943
- GQ-4643
Note que los resultados son menores que la simple suma, debido a los translapes. Quienes iban en coalición tuvieron más errores de este tipo y AMLO tuvo poco menos del doble que EPN. Esto podría deberse a que había más cuadros en cada acta correspondientes a las coaliciones, aumentando la probabilidad de cometer errores.
- Hay 1761 casillas en las que el total de votos supera en más de
14 a la lista nominal (14 corresponde a dos boletas por partido
para los posibles representantes que se presentasen).
- Estas casillas recibieron 1,002,030 votos.
- Sin embargo, este número puede ser engañoso, pues muchas de estas casillas tienen lista nominal nula, como se discute en [[base][esta sección].
- Existen 1,478 casillas donde la lista nominal es nula.
- De aquellas casillas con lista nominal no nula, hay 327 donde el número de votos excede a la lista nominal más catorce.
- El número de votos totales en dichas casillas es 230,796.
- El exceso de votos en dichas casillas es al menos 56,840.
- El número máximo de votos en cualquier casilla es 750+14.
- El número de casillas donde la lista nominal es nula y en las cuales los votos exceden este tope es de 10.
- El voto total en estas casillas es 8,597.
- El exceso de votos en dichas casillas es de 957.
- En algunas casillas, un solo candidato obtuvo más votos que
la lista nominal.
- En 21 casillas EPN rebasó la lista nominal+14 por un total de 1759 votos,
- en 19 casillas AMLO rebasó por 4681 y
- en 3 casillas JVM rebasó por 474.
- El exceso de votos sobre la lista nominal o sobre los máximos permitidos no parece ser un problema grave. Más grave podría ser la ausencia de un valor para la lista nominal en casillas que no son especiales.
- El número de votos que recibieron estas casillas fue
- 25269 en 84 casillas básicas,
- 91560 en 269 casillas contiguas y
- 60637 en 175 casillas extraordinarias,
- además de 593769 en 950 casillas especiales.
- El total de votos en estas casillas fue de 177856+593769=771625.
1.5 Dependencia temporal
- La siguiente figura muestra los resultados de la elección como
función del número total de actas procesadas.
- Los resultados iniciales difirieron notablemente de los
posteriores.
- En las primeras 10 actas EPN ganaba con 60% vs. AMLO con 24% y JVM con %20.
- En las primeras 100 iban EPN 38% vs JVM 32% vs AMLO 26% en tercer lugar.
- En las primeras 1,000 iban EPN 37% vs. JVM y AMLO empatados con 29%.
- En las primeras 10,000 ya se había establecido la tendencia global, EPN 36% en primer lugar, AMLO 32% en segundo y JVM 27% en tercero.
- El porcentaje correspondiente a la suma de los votos por GQ sumados a los de candidatos no registrados y de votos anulados se estabiliza rápidamente alrededor de su resultado final, cercano a 5%.
- Por otro lado los porcentajes correspondientes a EPN, AMLO y JVM ¡nunca se estabilizan!.
- En la parte inicial los cambios descendentes de JVM se complementan con los cambios ascendentes de AMLO.
- En la parte final, los cambios ascendentes de EPN se compensan con los cambios descendentes de AMLO.
- Los resultados iniciales difirieron notablemente de los
posteriores.
- Ahora muestro los resultados pero como función de la hora de
registro, midiendo ésta a partir de las 00:00 del primero de
julio, 2012.
- Notamos que las fluctuaciones iniciales son más visibles que en la gráfica anterior, debido a que las primeras actas llegaron espaciadas en el tiempo, pero poco tiempo después el sistema empezó a trabajar a toda capacidad.
- Hay un cambio de tendencia cerca de la media noche y otro cerca de las 4 de la mañana, visible sobre todo en los datos de AMLO.
- Por mera curiosidad, a continuación muestro los mismos
resultados separados en casillas urbanas y no urbanas.
- De nuevo, se ven cambios más o menos abruptos en las curvas correspondientes a AMLO, aunque en el caso no urbano sólo hay un cambio alrededor de la una de la mañana.
- Abajo se muestran los resultados totales, sin tomar porcentajes.
- Como es de esperar, durante una gran parte del tiempo los datos se acumulan a velocidad constante, con la maquinaria del IFE trabajando a toda su capacidad. Por ello, las tres curvas tienen una amplia región recta, cuya pendiente es proporcional al porcentaje del voto obtenido.
- Curiosamente, alrededor de las 14:00 y hasta las 16:30 2 de julio, todas las curvas se ven horizontales. Esto es una consecuencia de la caida del sistema mencionada arriba.
- :IdifVsTR : La caida del sistema es aún más clara si graficamos únicamente
la diferencia entre los votos obtenidos entre EPN y AMLO, como
en la siguiente figura.
- En esta figura añadimos una ampliación de la región entre las 13 y las 20 hrs del 2 de julio.
- Se ve claramente que se detiene la acumulación de votos entre las 14:14 y las 14:37 horas, y luego se vuelve a detener por un periodo mayor entre las 15:49 y las 18:26, periodos que corresponden a la caida del sistema.
- Se aprecia otro incidente relativamente menor a las 18:40.
- A partir de esta caida, la diferencia aumenta en casi 100,000 votos más antes del cierre del PREP.
- La siguiente figura muestra la velocidad de proceso de actas del
sistema.
- Desde poco antes de las 22:00 del 1o de julio y hasta alrededor de las 5:00 del 2 de julio el sistema trabajó a máxima capacidad y las actas procesadas aumentaron linealmente conforme pasaba el tiempo. El número de actas procesadas durante este tiempo fue de 244 cada minuto. Habiendo 300 distritos, esto significa que cada distrito capturaba alrededor de un acta cada minuto y cuarto.
- Como las anteriores, esta gráfica también muestra de nuevo las interrupciones del registro hacia las cuatro de la tarde.
- Usando la diferencia entre la hora de acopio de actas en los centros
distritales y su registro en las computadoras centrales, se
puede calcular el número total de actas que se hallan en cola
esperando ser procesadas, como muestra la siguiente figura.
- Notamos que a partir de las 21:00 se empiezan a acumular las actas rápidamente hasta la 1:00 del día siguiente, en que alcanza un máximo de 26,000 actas, un promedio de 87 actas por distrito.
- Después de la 1:00 disminuye el ritmo de llegadas de actas y la pila de actas acumuladas disminuye.
- Comparando esta figura con la anterior, vemos que el ritmo de proceso empieza a disminuir alrededor de las 5:00 AM, a pesar de que aún quedan más de 10000 actas en fila.
- Se observan varias fluctuaciones pequeñas que corresponden a pequeños tiempos de inactividad y fluctuaciones mayores hacia el final, en que se vuelven a acumular actas durante un periodo de dos horas y media.
- :FResVsRet :
Como la figura anterior y esta figura muestra unos retrasos
temporales interesantes
entre el acopio de las actas y su registro, como función del
tiempo de registro, investigué si había o no alguna correlación
entre el resultado de la elección y el tiempo que las actas
permanecieron en los Centros Distritales desde que fueron
acopiadas hasta que su información quedó capturada en las
computadoras centrales del IFE. El resultado puede verse en la
siguiente figura.
- En esta figura cada acta corresponde a un punto.
- Sólo hay 140,551 puntos, pues hubo 3462 actas de las cuales no se capturó el tiempo de acopio.
- El eje horizontal en esta gráfica son las horas transcurridas entre el acopio y la captura.
- Elegí una escala logarítmica, pues hubo muchas más actas con retrasos pequeños que con retrasos grandes. Al deformar el eje, la distribución se ve más homogénea y eso permite visualizar detalles.
- Observamos que los puntos toman valores con una distribución extremadamente amplia, con valores que van desde -100% (ventaja absoluta para AMLO) hasta 100% (ventaja absoluta para EPN), aunque la mayor parte de los datos se halla en la franja entre -50% y 50%.
- Es difícil concluir algo simplemente de observar un conjunto de puntos tan dispersos. Por ello, junté las actas en grupos de 5000 en 5000 y las promedié, obteniendo así datos que se distribuyen a lo largo de una línea relativamente suave, la que indico en color azul.
- :FResVsRetDet : Para apreciar más claramente la variación de
los resultados de
la elección con el tiempo que las actas permanecieron acopiadas
antes de que sus datos fueran registrados en las computadoras
centrales, en la siguiente figura muestro una ampliación de la
figura anterior.
- Notamos que la ventaja de EPN aumenta rápidamente de 4% a poco más de 8% conforme el retraso aumenta de dos a seis minutos, y fluctúa un poco alrededor de los 8 puntos hasta llegar a una hora de retraso, para después disminuir gradualmente hasta 2.5% cuando el retraso alcanza las tres horas. Los últimos dos grupos de 5,000 actas muestran fluctuaciones que van de 5% a 0.8% y los retardos en estos llegan a ser tan grandes como 20 horas.
- Los tiempo de retardo mostrados corresponden a actas que ya han llegado a los centros distritales y están en manos de personal del IFE. NO me refiero al tiempo que pudieron tardar las actas en llegar desde la casilla hasta los centros distritales. Por lo tanto, no deberían tener que ver con las condiciones sociales y geográficas de las casillas a las que corresponden.
- Las fluctuaciones estadísticas esperadas sobre conjuntos de 5000 actas serían del orden de una parte en setenta, mucho menores que los cambios mostrados por la figura, los cuales parecen ser estadisticamente significativos.
- ¡El resultado en un conjunto de actas depende significativamente del tiempo que las mismas permanecieron en los Centros Distritales antes de que sus datos fuesen registrados! ¿Qué puede explicar esta dependencia?
- :SResVsRetCR : De acuerdo al inciso SRegCap, hubo unos
retrasos notables, de hasta siete horas, entre la captura electrónica de datos en los Centros Distritales y su
registro en las computadoras centrales del IFE, el cual debió
ser (y en lo general, fue) prácticamente simultáneo.
- En la siguiente figura se muestran los resultados de la
elección calculado sólo sobre aquellas casillas que se
retrasaron más que cierto umbral desde que sus datos fueron
capturados hasta que fueron registrados
- El eje horizontal de esta gráfica es la cantidad de segundos transcurridos desde que se capturaron los datos en los centros distritales hasta que se registraron en las computadoras centrales.
- El eje vertical del lado izquierdo muestra la diferencia porcentual entre la votación obtenida por EPN y por AMLO sobre aquellas casillas cuyo registro se retrasó respecto a la captura un tiempo mayor al retraso mínimo indicado en el eje horizontal.
- La curva correspondiente a esta información es la curva roja.
- Por ejemplo, el punto del extremo izquierdo de la línea roja muestra que EPN supera a AMLO por alrededor de 6.5% en aquellas actas que tardaron más de 5 segundos en registrarse. Siguiendo la línea roja vemos que la ventaja de EPN aumenta considerablemente, hasta más del 10%, cuando sólo consideramos las actas que se retrasaron más de 25 segundos en ser registradas.
- Para valorar la importancia de este curioso efecto sobre el resultado global de las elecciones, la figura muestra con una curva verde el número de votos involucrado en dichas casillas. La escala correspondiente se indica de forma logarítmica sobre el eje vertical del lado derecho.
- Lo que vemos es que el aumento de aproximadamente 4% se da sobre alrededor de 400,000 votos, i.e., contribuye con solo 16,000 votos a la diferencia total.
- De hecho, si descartamos de los resultados aquellos que tardaron más de 5 segundos en ser capturados, la brecha entre EPN y AMLO se cerraría, pero en apenas 0.23%.
- También son curiosos los resultados si nos concentramos en
tiempo pequeños. En la figura que sigue se muestra el
resultado como función del retraso máximo.
- Con en la figura previa, el eje horizontal muestra el retraso entre captura y registro.
- La curva roja corresponde al resultado de la votación sobre las actas que se registraron en un tiempo menor al indicado sobre el eje horizontal. La curva verde indica el número de votos asociado.
- De nueva cuenta, el resultado no impacta por el número de votos, pero es curioso que sobre las pocas actas que se registraron en tiempo menores a 3.5seg. la diferencia se incrementó hasta más de 20%.
- En la siguiente figura se muestran los resultados de la
elección calculado sólo sobre aquellas casillas que se
retrasaron más que cierto umbral desde que sus datos fueron
capturados hasta que fueron registrados
2 Algunos datos de los Cómputos Distritales
2.1 Sobre la base de datos
Los datos que siguen fueron tomados de la tabla casillas_presidente. Estoy apenas (
) en proceso de entenderla.- La base de datos tiene 132,437 registros.
- 143,292 casillas aparecen una sola vez en la tabla pero
- 71 casillas que aparecen repetidas.
- 68 aparecen dos veces y
- 3 aparecen tres veces.
- Éstas tienen tipo de casilla=M, que no está definido en la documentación que viene con la base de datos.
- Éstas difieren entre sí en el campo D_DISTRITO.
- El número total de casillas tipo M es de 305. Este número corresponde a las 305 casillas que en el PREP tienen tipo de acta = 1 y sección=0 que parecen estar relacionadas con el voto en el extranjero, (aunque hay otras 15 actas en el PREP que tienen sección = 0 pero con otro tipo de acta).
- Hay una casilla (la casilla básica de la sección 1,340 del distrito 7 de Oaxaca) en que el total de votos para diputado quedó en blanco. En dicha casilla no se asentó voto alguno para nadie. Por lo visto, el Cómputo Distrital no corrigió todos los errores.
- :IPresSen : Nota: Este inciso sólo básicamente valor
anecdótico; contiene y describe algunos errores, los cuales se
corrigen en el siguiente inciso.
- El total de votos para presidente es 50,323,153, para senadores 50,306,565 y para diputados 50,084,202. El Ing. Jesús Ibarra ha insistido desde hace años en comparar estos números, pues en la generalidad de las casillas los votantes en la elección presidencial también lo debieron hacer en las votaciones por diputados y senadores federales.
- Existen 57,392 casillas donde el número de votos para presidente difiere del número de votos para senador, y 56,313 casillas donde el número de votos para presidente difiere del número de votos para diputado.
- El número de casillas donde el número de votos en la elección de presidente difiere del de la elección de senadores o de la de diputados es de 75,279, más del 52% del total.
- Este número es menor a la suma de los dos números anteriores pues en muchas casillas difieren ambos números.
- La suma de las diferencias entre la votación para presidente y para senador en estas casillas (agrupando los datos por estado, distrito, sección, número de casilla (cuando es contigua a una básica), tipo de casilla y número de casilla (cuando es contigua a una extraordinaria) es de 1,113,442.
- La suma de las diferencias entre la votación para presidente y para diputado en estas casillas (agrupando los datos por estado, distrito, sección, número de casilla (cuando es contigua a una básica), tipo de casilla y número de casilla (cuando es contigua a una extraordinaria) es de 1,568,687. (Nota, estos números son equivocados; ver abajo).
- Para mi sorpresa inicial, la diferencia entre la votación total para presidente y senadores es de únicamente 16,588 y la diferencia entre presidente y diputados es 238,951 y no corresponden a los números de los incisos anteriores (Nota, estos números también están equivocados, ver abajo).
- Calculando estas diferencias para las casillas especiales únicamente, obtengo -28,757 y 204,125 para votaciones de presidente sobre senadores y sobre diputados. (Y éstos números también)
- ¡Es sorprendente que hubiese habido casi treinta mil votos menos en la elección presidencial que en la de senadores en las casillas especiales!, sobre todo porque cualquier ciudadano podría haber votado por presidente en cualquier casilla especial, pero no podría haber votado por senador ni por diputado por hallarse lejos de su vivienda.
- Analizando con detenimiento la base de datos, caí en la cuenta de que los números mencionados arriba son erróneos pues en las 902 casillas especiales hubo dos votaciones por senador y dos votaciones por diputado, debido a la existencia de candidaturas plurinominales.
- Por los motivos anteriores, el análisis de diferencias debe proceder únicamente sobre las casillas ordinarias y no sobre las especiales.
- Restando simplemente el total de votos entre la elección presidencial, obtengo una discrepancia de 45,345 votos entre presidente y senadores y 34,836 entre presidente y diputados en casillas no especiales.
- Sin embargo, si tomo el valor absoluto de las discrepancias antes de sumar sobre las casillas obtengo una discrepancia de 1,552,408 entre votos para presidente y para senadores y 1,978,811 entre presidente y diputados.
- Haciendo la misma cuenta sólo para casillas especiales obtengo 1,113,324 votos entre presidente y senadores y 1,574,928 entre presidente y diputados.
- Eso deja diferencias de 439,084 y 403,883 respectivamente en las casillas no especiales.
- Por otro lado, en la elección presidencial hubo 305 casillas tipo M que no tienen correspondencia en las elecciones de senadores y diputados (y que no están documentadas, pero que parecen corresponder al voto del extranjero).
- Por lo tanto, para poder extraer alguna conclusión del análisis presentado arriba, éste debe repetirse eliminando antes a las casillas especiales y a las casillas tipo 'M'.
- :IPresSen1 : En este inciso repito el análisis anterior, pero
concentrándome en aquellas casillas donde sí se pueden
comparar las elecciones por presidente con las de senadores y
diputados.
- El total de votos para presidente en casillas que no son especiales y no son tipo M (i.e., no corresponden al voto en el extranjero) es de 49,698,747, mientras que para senadores es de 49,694,469 y de diputados 49,704,988.
- Dentro de estas casillas, existen 55,633 donde el número de votos para presidente difiere del número de votos para senador y 54,510 donde el número de votos para presidente difiere del número de votos para diputado.
- El número de casillas donde el número de votos en la elección de presidente difiere del de la elección de senadores o de la de diputados es de 71,671 más del 50% del total de casillas en dicho grupo.
- ¡Las diferencias entre el número de votos en la elección presidencial y las otras dos elecciones llega a ser del orden de -1000 hasta 700!
- Este número es menor a la suma de los dos números anteriores pues en muchas casillas difieren ambos números.
- La suma de las diferencias entre la votación para presidente y para senador en estas casillas (agrupando los datos por estado, distrito, sección, número de casilla (cuando es contigua a una básica), tipo de casilla y número de casilla (cuando es contigua a una extraordinaria) es de 4,278.
- La suma de las diferencias entre la votación para presidente y para diputado en estas casillas (agrupando los datos por estado, distrito, sección, número de casilla (cuando es contigua a una básica), tipo de casilla y número de casilla (cuando es contigua a una extraordinaria) es de -6,241.
- Sin embargo, si tomo el valor absoluto de las discrepancias antes de sumar sobre las casillas obtengo una discrepancia de 439,084 entre la elección para presidente y para senadores y 403,883 entre presidente y diputados.
- Es natural que el número de votos en la elección presidencial difiera del de senadores y diputados pues aquellos viajeros lejos de su hogar podrían votar por presidente pero no por sus diputados ni senadores. Sin embargo, aún eliminando las casillas especiales y los votos provenientes del extranjero, ¡permanece una discrepancia absoluta entre el número total de votos por presidente y por diputados o senadores que es de alrededor de 400,000! ¿Cuál es el origen de esta discrepancia? Podría deberse a haber añadido y/o substraido boletas de manera ilegal.
- Para entender un poco más estas discrepancias, en la siguiente
figura grafiqué el número de casillas que tienen una cierta
discrepancia vs. la discrepancia misma.
:FPresSen :
- El eje horizontal en el panel superior es el número total de votos en la elección de presidente menos el número total de votos en la elección de diputados de la misma casilla.
- El eje vertical es el número de casillas donde se observa exactamente dicha diferencia.
- El panel de abajo es similar, pero en él se resta la a la votación de presidente la votación por senadores.
- Notamos que en un número muy alto de casillas no hubo discrepancia alguna. Estos números correspondientes a la absisa 0 tienen una altura de 87,720 para el panel superior y 86,597 para el panel inferior, y están fuera de la escala de la gráfica.
- Las discrepancias máximas en los números de votos van desde -999 hasta 634 en el caso de la comparación con la votación por senadores y desde -780 hasta 688 en el caso de la comparación con la votación por diputados. Estos números, extremadamente altos, sobrevivieron a los Cómputos Distritales. Creo que son un botón de muestra que muestra la calidad de dichos cómputos y su capacidad de corregir errores.
- El número de casillas con error decrece rápidamente conforme el error crece, y así, tenemos del orden de 300-400 casillas donde el error es de más o menos 9.
- Sin embargo, ambas gráficas muestran un pico grande de altura cercana a 1,000 (fuera de escala de nuevo), cuando el error alcanza exactamente el valor 10 o -10.
- Si nos seguimos alejando, el número de casillas vuelve a bajar hasta que llegamos a discrepancias de más o menos 19 casillas, donde el número de casilas ha disminuido hasta 70-100.
- Sin embargo, al pasar a más o menos 20 el número de casillas brinca abruptamente por un factor de más de dos, hasta 200-250.
- El fenómeno se repite subsecuentemente. Cada vez que la discrepancia aumenta en exactamente 10 votos, aparece un pico en el histograma de casillas.
- Quizás el pico más notable corresponde a más y menos cien, donde brinca desde un mínimo de 2 o 3 casillas en el rango más menos 91-99 hasta un máximo de entre 120 y 180, ¡entre 40 y 100 veces mayor!
- El número de casillas donde la discrepancia entre la votación total para presidente difiere de la de senadores en un múltiplo exacto de 10 es de 3498.
- La suma aritmética de las discrepancias sobre todas estas casillas da un total de 3,390 votos. Este número es, sin embargo, engañoso, pues en él se cancelan las discrepancias positivas de las negativas, siendo que las positivas podrían tener votos de más por un candidato y las negativas votos de menos por otro candidato.
- Es más útil obtener la discrepancia total como la suma de los valores absolutos de las discrepancias individuales. En este caso, la discrepancia total en estas casillas es de 117,470 votos. La votación total en estas casillas es de 1,260,892, por lo cual la discrepancia es alrededor del 10% de los votos de estas casillas.
- Los números equivalentes para la elección de presidente comparada con la de diputados es de 3,372 casillas donde la diferencia en votaciones totales es un múltiplo exacto de 10, con una discrepancia total 108,010 votos de un total de 1,212,101 votos.
- ¿Qué puede producir estos picos periódicamente ordenados?
- La única explicación que se me ocurre es hubo un ejército de
mapaches, cada uno con la consigna de sustraer o de añadir
ilegalmente 10 votos a las urnas de, digamos, la elección
presidencial. A algunas casillas no llegó ninguno de éstos,
a muchos llegaron dos, a otras tres, etc., y por ello,
aparece una distribución anormal con picos en 10, 20,
30,… y -10, -20, -30…
- Ahora creo que ésta no es la explicación correcta.
- Javier Aparicio me sugirió que la explicación podría ser la de errores en llenado de actas con gente que accidentalmente añade un cero a la derecha de un resultado. No me parece convincente, pues un cero a la derecha multiplica a un número por 10, pero no vuelve a la diferencia de dos números múltiplo de 10.
- Otra explicación, creo que más acertada, fue ofrecida por Jesús
Ibarra: si se dejasen en paz los paquetes electorales pero
se modificasen las actas cambiando los dígitos más
significativos o añadiendo dígitos a la izquierda, ésto
modificaría el total de votos añadiéndo o sustrayendo
múltiplos de 10 o de 100.
- FALTA. Sería interesante estudiar la distribución de
dígitos. Por un lado, verificar si se cumple o no la ley
de Benfor para los dígitos significativos. Luego, checar
la estadísitica de números fácilmente modificables, como
el cambio de 1 a 4 o de 2 a 3.
- Tal vez las manipulaciones serían más visibles si se restringen a las actas que difieren por múltiplos de 10.
- FALTA. Sería interesante estudiar la distribución de
dígitos. Por un lado, verificar si se cumple o no la ley
de Benfor para los dígitos significativos. Luego, checar
la estadísitica de números fácilmente modificables, como
el cambio de 1 a 4 o de 2 a 3.
- Claro que modificando al alza las cifras de EPN por ejemplo, y a la baja las cifras de AMLO, podría lograrse un cambio nulo en el total de votos.
- Para completar el análisis anterior, hice una gráfica con el
histograma de diferencia de votos entre la elección de diputados
y la de senadores.
- Los resultados son similares a los histogramas de discrepancias presidente/diputados y presidente/senadores.
- Aparece la misma serie de picos equiespaciados en múltiplos de 10.
- Esto implica que el mismo tipo de modificaciones se hicieron en las tres elecciones.
- Esta última afirmación puede explicar la simetría en las tres gráficas previas entre resultados con discrepancias positivas y resultados con discrepancias negativas.
- Es absurdo que los Cómputos Distritales no hubiesen corregido manipulaciones tan burdas como la modificación de dígitos significativos en actas.
- Sería importante que en los cómputos distritales se revisen los paquetes de presidente junto con los de diputados y senadores correspondientes para detectar y corregir estas anomalías.
- Buscando dónde y/o cuándo pudieron haberse alterado los
resultados aumentando o disminuyendo votos, sobre todo en
múltiplos de 10, grafiqué las discrepancias entre las distintas
elecciones tal y como las reporta la base de datos de los
cómputos distritales, como función de los distintos tiempos
correspondientes a la elección presidencial como los reporta el
PREP.
- Por ejemlo, la siguiente figura muestra el número total de
votos obtenido en cada casilla para la elección
presidencial menos el número obtenido en la
elección de senadores como función del número de acta. Las
actas están numeradas de acuerdo al tiempo que estuvo el
paquete en el distrito desde que fue acopiado hasta que
sus datos fueron registrados en las computadoras centrales
del IFE.
- Cada punto en esta gráfica corresponde a una casilla.
- Si el número o la magnitud de las discrepancias dependiera del tiempo de retraso entre acopio y registro, estaríamos justificados en sospechar que los paquetes pudieron ser manipulados durante dicha espera.
- Sin embargo, la figura no muestra ninguna tendencia obvia.
- Gráficas similares en las que las actas fueron ordenadas de acuerdo al tiempo de registro, captura o acopio tampoco parecen tener mostrar dependencia alguna en el número de acta.
- Esto permite concluir que de haberlas, las manipulaciones se dieron antes del acopio y durante la jornada electoral, sin correlacionarse con los tiempos dentro de las instalaciones del IFE.
- Por ejemlo, la siguiente figura muestra el número total de
votos obtenido en cada casilla para la elección
presidencial menos el número obtenido en la
elección de senadores como función del número de acta. Las
actas están numeradas de acuerdo al tiempo que estuvo el
paquete en el distrito desde que fue acopiado hasta que
sus datos fueron registrados en las computadoras centrales
del IFE.
2.2 Sobre los resultados
- Los resultados (si interpreto bien la base de datos) son
Votos Porcentaje EPN 19226784. 38.21% AMLO 15896999. 31.59% JVM 12786647. 25.41% GQ 1150662. 2.29% Nulos 1241154. 2.47% No Reg 20907. 0.04% Total 50323153. 100.01% - Los resultados calculados sobre las casillas especiales son
Votos Porcentaje EPN 163982 28.11 AMLO 240472 41.22 JVM 161887 27.75 - Es muy llamativo que en ellas AMLO gana le gana a EPN por más de 13%. ¿Por qué de esta diferencia? Podría ser por el perfil de los viajeros que podría diferir del del resto de la población, pero también podría ser por la dificultad de de comprar y coaccionar votos entre dicha población.
- Los resultados calculados sobre las casillas tipo M (¿voto en el
extranjero?) son
Votos Porcentaje EPN 6377 15.53 AMLO 15980 38.91 JVM 17168 41.8 - Entre estos pocos votantes tampoco gana EPN, sino JVM seguida de cerca por AMLO.
- :ISinSM : Elminando las casillas especiales y las tipo M, el resultado de
la elección queda
Votos Porcentaje EPN 19056425 38.34 AMLO 15640547 31.47 PAN 12607592 25.37 con una diferencia ligeramente mayor entre los dos punteros.
- Los resultados sobre las 3,498 casillas donde la discrepancia entre la
votación total por presidente y la votación total por senadores
difiere un un múltiplo exacto de 10 son
Votos Porcentaje EPN 490556 38.91% AMLO 389884 30.92% JVM 320106 25.38% Total 1260892 Los resultados equivalentes sobre las 3,372 casillas donde la presidencial difiere en múltiplos de 10 de la de diputados son
Votos Porcentaje EPN 469604 38.74% AMLO 377934 31.18% JVM 307513 25.37% Total 1212101 - Comparando estos resultados con los del inciso ISinSM vemos que la brecha entre los primeros dos contendientes se amplió un poco, 1.12% en el primer caso y 0.69% en el segundo.
- A pesar de que el número de votos añadidos o substraidos en estas casillas fue de alrededor de 10% del total, no podemos concluir nada sobre la magnitud de la manipulación electoral en estas casillas, pues no sabemos si las casillas en las que se cometió esta adición o substracción indebida de boletas hubiesen sido representativas antes de realizarse la trampa.
- Sería factible que no lo hubiesen sido y que la trampa las acercara al resultado nacional como una técnica para ocultar el ilicito.
- Para verificar esto requeriríamos la lista de casillas (eso es fácil de obtener) y compararlas con casillas cercanas geográficamente y socioeconómicamente donde no se hubiese hecho trampa (esto es difícilo de hacer, al menos para mí).
- Por otro lado, que los picos en múltiplos de 10 indiquen una manipulación obvia, ello no significa que los resultados con discrepancias que no son múltiplos de 10 o incluso sin discrepancias no hubiesen sido manipulados también.
- La siguiente figura muestra la distribución del número total de
votos sobre todas las casillas.
- Para suavizar la figura, se agruparon las casillas de 10 en 10.
- La distribución es bastante extraña, a pesar de que los resultados se suavizaron promediándolos sobre grupos consecutivos de diez casillas.
- El pequeño pico alrededor de 750 votos corresponde a las casillas especiales, donde la participación fue muy grande.
- La forma extraña de esta curva ha de deberse a la extraña
distribución de casillas sobre las listas nominales, como
muestra la siguiente figura.
- Cada punto verde sobre la figura muestra el número total de casillas que hay con cierto valor de la lista nominal.
- La curva roja corresponde a los mismos datos promediados sobre grupos de diez para suavizar un poco la figura.
- Hay 902 casillas con lista nominal igual a cero. Estas corresponden a las casillas especiales. En la figura no se ve el punto correspondiente por estar fuera de la escala.
- Así mismo, ¡hay 19 casillas con lista nominal de más de 750 electores! violando así el código electoral.
- De éstas, 15 son básicas y 4 son contíguas.
- La casilla con mayor lista nominal ¡tiene 1687 electores!
- La figura muestra unos brincos curiosos cerca de los 375 electores y 500 electores. Esos han de ser debidos a los criterios que emplea el IFE para dividir casillas cuando crecen demasiado, dando lugar a nuevas casillas pequeñas.
- La siguiente figura muestra los resultados de la votación como
función del exceso X de votos para presidente comprarados con los
votos para diputados. Para cada X, se grafican los resultados
sobre aquellas actas donde la diferencia de votos es mayor que
X.
- Es curioso que para X negativo el resultado casi no depende de X, pero para X positivo hay un fuerte aumento en el número de votos que obtiene AMLO, quien rápidamente alcanza y supera a EPN, cuyo porcentaje en la votación disminuye.
- Sin embargo, no debemos saltar a conclusiones, pues la gráfica anterior incluye resultados de las casillas especiales que dominan la votación cada vez más, mientras X aumenta. En las casillas especiales, AMLO obtuvo significativamente más votos que EPN.
- Elminando las casillas especiales, todas las curvas se aplanan y queda EPN arriba de AMLO arriba de JVM.
- Dado que las discrepancias entre el número total de votos
obtenido en las eleccones para presidente, diputado y senadores
es interesante investigar si dichas diferencias se deben a
errores en el llenado de actas o se debieron a manipulación
intencional. En todo caso, estos errores debieron y no fueron corregidos en los cómputos distritales.
- Si las discrepancias se debiesen a manipulación intencional, podría detectarse a partir de una violación a la ley de Benford. Notemos que una violación a la ley de Benford implica manipulación, pero cumplir la ley de Benford no implica ausencia de manipulación. La ley de Benford establece una distribución estadística que cumplen los digitos que ocupan la posición más significativa de un conjunto de números, i.e., el que se halle más a la izquierda. Existen versiones de la Ley de Benford para el segundo y tercer dígito.
- Por ser la aprueba más sencilla de aplicar y de interpretar, consideré abajo la distribución del dígito menos significativo del número de votos obtenido por cada candidato, es decir, el dígito hasta la derecha de cada número. Como los primeros tres contendientes obtuvieron números de tres y dos dígitos, es razonable esperar que la probabilidad de que dicho número termine en 0 sea igual a la de terminar en 1, 2, 3…8 o 9. Los dígitos menos significativos han de estar uniformemente distribuidos con probabilidad 10% de tomar cualquiera de sus diez valores posibles.
- La siguiente figura muestra el número de veces que apareció
cada dígito como último número en el resultado de alguna casillas
sumado sobre todas las casillas donde hubo una discrepancia
entre los votos totales para presidente y para senadores. El
eje horizontal son los diez posibles dígitos y el eje
vertical indica el número de veces que dichos dígitos
aparecieron en la posición menos significativa. El panel de
arriba corresponde a EPN, el de enmedio a AMLO y el de abajo
a JVM.
En la figura se aprecia que cada dígito apareció alrededor de 5600 veces y tiene algunas fluctuaciones estadísticas.
- Si las distribuciones fueran de origen estadístico, su desviación estandard estaría dada por p*(1-p)*N donde p=0.1 es la probabilidad de que un dígito aparezca en la última posición, (1-p) su complemento y \(N=56,633\) es el número de casillas donde hay discrepancia. El valor esperado es +/- 71 casillas.
- Calculando las desviaciones estandard para cada candidato
obtuve
Candidato Desviación Estandard EPN 84 AMLO 63 JVM 55 Notamos que no se cumple la equiprobabilidad. La distribución de votos para EPN es mucho más dispersa que lo esperado, la de AMLO es menos dispersa y la de JVM es mucho menos dispersa.
- Tratando de averiguar el por qué de estas diferencias,
desglosé los resultados anteriores por partido.
Partido Desviación Estandard PRI 77 PVEM 2,576 PRD 72 PT 918 MC 1,539 PAN 55 Notamos que PRI, PRD son cercanos a los esperado, el PAN tiene desviaciones mucho más pequeñas, PT tiene desviaciones mucho más grandes y MC y PVEM tienen desviaciones gigantes. Sin embargo, para los partidos con desviaciones grandes hubo muchas casillas donde su votación total era de una o dos cifras únicamente, y en las cuales la equiprobabilidad no es esperada.
- Es curioso que la desviación del PRD disminuyó al mezclar sus resultados con el PT y el MC que tienen desviaciones mucho mayores, mientras que la desviación del PRI aumentó sustancialmente al mezclarse con el PVEM.
- La siguiente figura muestra los histogramas de número de
casillas vs número de votos recibidos.
- La distribución correspondiente a EPN es más angosta y recorrida hacia la izquierda que las otras dos.
- La de AMLO es más ancha y baja que la de JVM.
- El número de casillas donde JVM y AMLO obtienen un número de votos cercano a cero es mucho mayor que el correspondiente a EPN.
- El número máximo de votos obtenido en una sola casilla por algún candidato es 716 para EPN, 638 para AMLO y 717 para JVM, fuera del rango en que hice la gráfica.
- Es interesante desglozar la figura anterior en términos de sus contribuciones urbanas y no urbanas.
- En la siguiente figura se muestran los histogramas tomados
únicamente sobre las casillas no urbanas.
- Es notable que la distribución de AMLO y de JVM se vuelven
casi idénticas, a diferencia de su distribución global.
- Ambas tienen un gran número de casillas donde obtuvieron cero votos, del orden de 150.
- El máximo de su distribución corresponde a casillas donde obtuvieron del orden de 10 votos.
- La distribución de EPN se vuelve mucho más ancha y recorrida a la derecha, con un máximo alrededor de 350 casillas donde obtuvo alrededor de 135 votos por casilla.
- La forma de la distribución de EPN es muy distinta a la de los otros candidatos.
- Es notable que la distribución de AMLO y de JVM se vuelven
casi idénticas, a diferencia de su distribución global.
- Para completar la imagen, la siguiente figura muestra los
histogramas correspondiente a las casillas urbanas.
- Notamos que en este caso, a diferencia del caso rural, ningún partido obtiene cero votos en un número importante de casillas.
- En este caso, la forma de las tres distribuciones se parece entre sí cualitativamente y sólo hay cambios cuantitativos.
- Una primera forma cruda para caracterizar las distribuciones es a partir de sus promedios, que son simplemente los resultados de las elecciones discutidos arriba.
- Una segunda forma es a través de su ancho, medido a través de
la desviación estandard. Obtenemos
Desviación Estandard EPN AMLO JVM Total 51.56 66.63 55.35 Urbana 42.73 63.36 53.94 No Urbana 63.79 65.43 56.52 - Notamos que los anchos de las distribuciones de AMLO son mayores que las de JVM en aproximadamente 10 votos.
- Por otro lado, los anchos de la distribución global de EPN es la más pequeña de las tres en la distribución global.
- En el caso urbano, el ancho es todavía menor y disminuye en 9 votos sobre el resultado global, mientras que
- el ancho sobre las casillas no urbanas aumenta en alrededor de 12 votos sobre el global.
- La diferencia en el ancho de la distribución de EPN entre el caso urbano y el no urbano ¡es de más de veinte votos! ¡El ancho aumenta en casi cincuenta porciento entre el caso urbano y el no urbano! ¿Por qué?
- Los anchos de éstas distribuciones podrían estimarse de la
siguiente manera.
- El número promedio de votantes por casilla fue de V_t=351.
- Si en una casilla votaran V_t ciudadanos elegidos al azar de entre toda la población (lo cual no es el caso), podríamos esperar que la probabilidad de obtener uno u otro resultado estuviera regida por la distribución binomial.
- De acuerdo a la distribución binomial, la desviación estandard esperada para cada contendiente podría estimarse como sqrt(p (1-p) V_t) donde p es la fracción total de votos obtenidos.
- Con este criterio obtenemos
Contendiente Porcentaje Desviación Teórica EPN 38.21 9.1 AMLO 31.59 8.71 JVM 25.41 8.15 - Estos resultados teóricos difieren mucho de los resultados obtenidos arriba.
- Una posible explicación para la diferencia sería que los
ciudadanos no son la unidad de voto pues quienes votan en una
casilla podrían ser familiares o amigos y por tanto tener
opiniones y preferencias comunes. Suponiendo que los votantes
llegan en grupos de tamaño T, el número de grupos que llega a
una casilla sería V_t/T y la desviación esperada para el
número de grupos sería sqrt(p q V_t/T). Por tanto, la
desviación esperada para el número de votantes sería sqrt(p q T V_t). Usando los datos de porcentaje de votación y las
desviaciónes obtenidas, podemos estimar el tamaño de los grupos
que votan como unidad por uno u otro partido.
Contendiente Porcentaje Desviación Tamaño de grupo EPN 38.21 51.56 32.1 AMLO 31.59 66.63 58.5 JVM 25.41 55.35 46.05 - La siguiente tabla trae información similar pero separada por
estado.
Estado Voto T. Grupo T. Grupo T. Grupo Total % EPN EPN % AMLO AMLO % JVM JVM 1 354 38.6 15.6 20.80 19.7 30.9 28.2 2 309 37.0 14.5 31.2 19.7 27.2 19.5 3 303 41.3 31.3 25.0 27.20 29.7 22.3 4 370 39.3 28.8 27.0 29.4 28.4 23.6 5 346 39.4 20.9 19.8 22.6 36.4 34.2 6 352 40.7 19.1 22.4 23.8 33.3 20.8 7 369 45.9 56.2 31.2 50.6 16.0 33.9 8 267 46.5 34.1 22.6 24.5 24.7 32.2 9 390 26.0 8.4 52.9 29.0 17.4 28.7 10 286 46.8 37.0 20.7 32.7 28.3 32.4 11 343 40.3 25.5 12.9 23.0 41.0 31.2 12 294 37.6 38.8 46.8 54.9 10.9 27.1 13 358 42.2 27.1 33.7 38.2 17.6 22.7 14 384 40.0 20.7 22.6 23.4 32.2 29.7 15 397 43.2 25.8 34.1 26.0 18.2 28.5 16 291 43.1 28.3 31.4 32.9 20.5 27.8 17 380 34.6 15.1 42.4 21.8 18.4 15.6 18 308 47.1 31.6 31.0 39.3 17.6 21.2 19 354 33.2 19.8 22.0 15.8 39.8 52.2 20 327 34.6 38.2 43.4 58.2 18.1 32.9 21 368 34.4 25.4 34.6 37.6 25.8 29.5 22 391 38.6 32.5 22.5 26.2 33.7 37.1 23 322 33.3 34.4 42.0 23.3 20.7 36.3 24 335 38.3 29.4 23.6 32.0 31.0 29.7 25 259 46.7 41.1 23.6 35.5 25.1 29.9 26 334 39.7 22.5 24.6 31.2 31.6 24.1 27 409 31.8 19.1 59.3 53.4 6.0 19.8 28 331 34.4 18.1 19.6 21.4 41.7 30.0 29 369 35.4 16.2 40.4 33.1 18.9 13.5 30 361 33.6 27.3 29.0 46.5 33.6 38.0 31 438 41.8 28.2 16.9 30.1 37.5 29.1 32 263 51.2 57.1 24.5 39.4 18.5 30.0 - Los estados están numerados en orden alfabético: 1. Aguascalientes, 2.Baja California, 3.Baja California Sur, 4.Campeche, 5.Coahuila, 6.Colima, 7.Chiapas, 8.Chihuahua, 9.Distrito Federal, 10.Durango, 11.Guanajuato, 12.Guerrero, 13.Hidalgo, 14.Jalisco, 15.México, 16.Michoacán, 17.Morelos, 18.Nayarit, 19.Nuevo León, 20.Oaxaca, 21.Puebla, 22.Querétaro, 23.Quintana Roo, 24.San Luis Potosí, 25.Sinaloa, 26.Sonora, 27.Tabasco, 28.Tamaulipas, 29.Tlaxcala, 30.Veracruz, 31.Yucatán, 32.Zacatecas
- Los agregados más chicos son de tamaño 8.4 para EPN en el Distrito Federal (9), 15.8 para AMLO en Nuevo León (19) y 13.5 para JVM en Tlaxcala (29).
- Los agregados más grandes son de tamaño 57.1 para EPN en Zacatecas (32) donde arrasa con 51.2% del voto, 58.3 para AMLO en Oaxaca (20) donde gana con una votación de 43.4% y 52.2 para JVM en Nuevo León (19) donde gana con 39.8%. Curiosamente, AMLO saca más votos aún en el DF con agregados de tamaño 29.0 y JVM tiene más votos en Tamaulipas con agregados de tamaño 30.0.
- No me es clara la enorme variación en los tamaños de los agregados ni su correlación con los resultados electorales. Quizás esto sea material para algún sociólogo (o sea irrelevante).
- :AEnt : Una alternativa para caracterizar distribuciones
no gaussianas como
las mostradas arriba es la entropía (sugerencia de Adrián
Carbajal @adrian_carbajal). Una forma de definirla es
calcular para cada posible número de votos i la fracción pi de
casillas que obtuvieron i votos y sumar S=-sum(pi log(pi)). Si usamos el logaritmo en base dos, obtendremos el
número de bits de información que lleva cada dato electoral en
promedio. Mis resultados son
Entropía EPN AMLO JVM Total 7.68 7.98 7.68 Urbanas 7.41 7.92 7.61 No Urbanas 7.99 7.80 7.64 - Para interpretar estos resultados, recordemos que en principio, en una casilla podría haber desde 0 votos hasta 750 votos por un candidato. Escribiendo 750 en binario obtenemos un número de 10 dígitos o bits, 1011101110. El número binario de 10 bits más grande que podemos escribir es el 1111111111, equivalente a 1023. Por lo tanto, para poder codificar cualquier número entre 0 y 750 se requieren entre 9 y 10 bits. Para ser más preciso, se requieren log(750)/log(2)=9.55 bits. Sin embargo, no todos los resultados son igualmente probables. Es muy poco probable obtener casillas con la lista nominal máxima de 750 y menos aún que un solo candidato obtenga todos los votos de esa casilla. La tabla de números mostrada arriba indica cuántos bits de información son indispensables para poder codificar sin redundancia un resultado electoral, el cual resulta ser un número entre 7.5 y 8, significativamente menor que los 9.55 bits mencionados arriba.
- No parece que las variaciones muy grandes entre la cantidad de información que tiene cada resultado electoral en la elección total ni en las elecciones segregadas en casillas urbanas y no urbanas.
- Sin embargo, la entropía es muy grande comparada con lo que esperaríamos de una distribución aleatoria de votantes distribuidos de acuerdo al resultado de las elecciones.
- Para explicar esta afirmación, en la siguiente figura se
muestra la entropía esperada para candidato de acuerdo al
porcentaje de votación promedio que obtuvo y como función de
la lista nominal.
:FEntEsp :
- La figura muestra tres curvas, la superior corresponde al porcentaje de los votos obtenidos por EPN, la central a AMLO y la de abajo a JVM. No hay diferencias muy grandes entre éstas.
- Como se vé, la entropía esperada para todos los candidatos debería rondar alrededor de 5 bits para la casilla típica con 350 electores nominales.
- ¿Por qué muestran una entropía tan grande los resultados de la elección presidencial del 2012?
- A continuación muestro unas tablas conteniendo la entropía de la
elección segregada por distrito electoral, i.e., la cantidad de
información que aporta cada dato electoral para cada
candidato cuando sabemos de qué distrito electoral se trata. Se
muestran los distritos correspondientes a la
entropía más baja y los correspondientes a la entropía más alta.
-
EPN Estado Distrito Entropía 9 22 5.87 9 1 6.05 9 4 6.11 30 10 6.12 9 25 6.15 9 16 6.15 9 6 6.15 19 4 6.17 9 13 6.17 9 14 6.19 9 19 6.21 9 15 6.23 9 2 6.24 9 27 6.25 9 3 6.25 22 1 7.47 32 3 7.48 32 2 7.48 12 5 7.49 25 3 7.5 10 1 7.51 12 1 7.52 15 36 7.54 10 3 7.55 7 2 7.58 7 5 7.6 8 9 7.63 7 8 7.65 7 1 7.78 7 3 7.9 -
AMLO Estado Distrito Entropía 11 5 5.6 11 6 5.79 11 9 5.89 8 9 5.91 28 1 5.91 11 3 5.97 8 2 6.06 26 1 6.09 28 4 6.09 11 7 6.1 25 1 6.18 5 7 6.19 14 3 6.19 19 6 6.2 14 7 6.22 20 9 7.48 30 14 7.49 20 3 7.5 7 5 7.5 7 1 7.5 12 8 7.54 12 6 7.55 20 7 7.55 27 5 7.56 9 26 7.57 12 1 7.59 12 3 7.6 27 1 7.6 20 6 7.73 12 5 7.79 -
JVM Estado Distrito Entropía 27 3 4.86 27 2 4.93 9 22 5.04 27 4 5.1 15 32 5.19 15 31 5.21 9 19 5.3 15 30 5.35 15 29 5.35 27 6 5.39 15 39 5.41 12 1 5.42 12 3 5.44 9 27 5.45 15 13 5.61 5 7 7.32 5 3 7.34 11 7 7.35 22 4 7.39 31 5 7.39 19 6 7.41 30 17 7.43 19 10 7.44 31 1 7.45 19 4 7.47 14 6 7.47 19 3 7.47 19 1 7.48 31 2 7.49 30 2 7.55 - Parece ser que los valores altos de la entropía por distrito no difieren mucho de los valores correspondientes a la elección a nivel nacional. Sin embargo, los valores bajos difieren en uno o dos bits de los valores nacionales. Por ejemplo, los resultados para JVM en el distrito 3 de Tabasco se pueden codificar con únicamente 4.86 bits, los mismos que requeriríamos para codificar un resultado de entre solo 29 posibilidades igualmente probables.
- Tal vez sea interesante profundizar en los resultados de aquellos distritos donde los resultados de uno u otro candidato tienen un contenido de información muy alejado de los resultados nacionales.
- O al revés, analizar aquellos distritos donde la entropía se aleja más de la entropía nominal mostrada en ésta figura.
-
3 Sobre las encuestas
- Es claro que la mayor parte de las encuestas publicadas durante el proceso electoral del 2012 estuvieron equivocadas, habiendo sobre-estimado la preferencia de la población por EPN en una cantidad que sobrepasó por muchas veces la incertidumbre estadística y la supuesta incertidumbre muestral de la misma encuesta.
- Por ello, es claro que, o bien las muestras no fueron elegidas adecuadamente y no fueron representativas del electorado, o hubo una manipulación de los datos.
- En todo caso, la auto-consistencia de dichas encuestas y su enorme inmutabilidad ante todo tipo de sucesos sugieren fuertemente que las fallas anteriores no fueron producto de errores inocentes, sino que obedecieron al propósito de generar la percepción de que EPN era desde tiempo atrás un ganador imbatible.
- De acuerdo a mi metaestudio, publicado en la Unión de Morelos y en mi página, nuestra manipulabilidad es m=1/2. Esto significa que al percibir que la aceptación de un idea aumenta en cierto porcentaje P, la probabilidad de que nosotros la aceptemos aumenta en m P=P/2.
- Extrapolemos dicho resultado al entorno electoral, asumiendo los riesgos que ello implica, y estimemos qué tan grande pudo ser el efecto que la manipulación de encuestas tuviera en el resultado de la elección.
- El análisis podría ser complejo, pues se realizaron muchas encuestas distribuidas a lo largo de un largo periodo durante el cual las preferencias electorales pudieron variar. Para simplificarlo, consideraré únicamente un momento antes de publicar las encuestas y un momento después. Asímismo, consideraré las preferencias electorales A antes de las encuestas, las preferencias electorales E según las encuestas, el resultado final F de acuerdo al resultado de las elecciones y el porcentaje erróneo P añadido a los datos reales para obtener el resultado publicado.
- Por definición, E=A+P, i.e., lo publicado incluye lo añadido.
- De acuerdo al metaestudio, F=A+P/2, i.e., el resultado final incluye lo inducido por las mismas encuestas, que es la mitad de lo añadido. Este resultado requiere de algunas premisas adicionales simplificadoras, aunque no suficientemente justificadas. Una de ellas es la suposición de que la publicación de una encuesta honesta no cambiaría la intención del voto, i.e., que en la iteración medición-publicación los resultados reales consisten en puntos fijos. Otra simplificación es el ignorar otros efectos que aparecen en elecciones y que quizás no estén presentes en estudios de opinión, tales y como el fenómeno del voto útil o el desencanto que anula la voluntad de votar.
- En todo caso, podemos restar las últimas dos ecuaciones para eliminar A y obtener qué tanto se añadió a las encuestas sobre el dato que pretendieron medir P=2(E-F).
- Podemos restar la primera del doble de la segunda para eliminar a P y obtener el resultado que hubiesemos tenido si no se hubiesen publicado las encuestas, o si éstas no hubiesen sido manipuladas A=2F-E.
- Tomemos como datos la supuesta ventaja de EPN sobre AMLO E=15%-20%
en múltiples encuestas y la ventaja final F=6.5% para obtener
Error Sin Encuestas Final Añadido Manipulación E F P A 20.0% 6.5% 27.0% -7.0% 15.0% 6.5% 17.0% -2.0% - De acuerdo a este cálculo, la manipulación de las encuestas consistió en sumar entre 17% y 27% a la aparente preferencia por EPN sobre AMLO, lo cual indujo un aumento de entre 8.5% y 13.5% sobre los resultados que se hubiesen obtenido de no haberse sometido al electorado a la publicación de encuestas manipuladas. Este último resultado hubiese consistido en un triunfo de AMLO sobre EPN con entre 2 y 7 puntos porcentuales de ventaja.
- Debo mencionar críticas al metaestudio y a la extrapolación acrítica de sus resultados hacia análisis electorales en el blog de Luis Fernando Areán; algunas justas, aunque algunas muestran más 'sospechosismo' que yo mismo. Discutiré mis desacuerdos conforme halle el tiempo.
4 Contribuciones
He recibido mensajes con información y análisis de la elección que no he tenido tiempo de leer/analizar/valorar. He montado dichos mensajes en ésta página. Aunque debe ser obvio, debo afirmar que no puedo garantizar su veracidad ni que sus análisis sean correctos (ni que no lo sean).
He recibido otras contribuciones que indico a continuación.
- Alejandro Marín @aleum1 estudió el comportamiento del número de votantes
urbanos y rurales según
INEGI. 'En resumen en el 2010, la población de 18 años y mas (con
derecho a votar) tiene un comportamiento de 77 % urbano y 23 %
rural, mientras que en el 2006 la población de 18 y más 78 %
urbano y 22 % rural. Es evidente no hay un movimiento brusco y se
mantiene la estructura en el 2006 y 2010.'
- Este análisis alimenta la duda, ahora más informada, sobre el aumento en la lista_nominal no urbana.
- Luis Arean @larean escribió una réplica a algunas críticas recientes del PREP.
- Jorge López escribió una contra-réplica.
- Jorge López ha desarrollado página en la que ha montado artículos de varios autores sobre temas electorales.
- Adrian Carbajal @adrian_carbajal mandó unos histogramas de número de votos por partido que muestra que el número de casillas con cero votos es mayor para AMLO.
- Jesús Ibarra hizo unos cálculos comparando casilla a casilla las votaciones totales por presidente, diputados y senadores. Uno esperaría que coincidieran entre sí y con el número total de votantes.
- El sitio defensa del voto tiene resultados sobre inconsistencias como las aquí mencionadas, pero además ¡están georeferenciadas!