[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

datos elecciones



Hola Mochan,

Mi nombre es Carlos Gomez Uribe. Soy mexicano y estoy estudiando un doctorado en ingenieria medica en Boston, en el MIT, y mi fuerte es la probabilidad. Me llego el email con los datos que procesaste y pusiste en tu pagina, y se me hicieron muy interesantes. En particular me intereso la ultima grafica, donde tienes la diferencia de votos entre Calderon y AMLO como funcion de actas procesadas. El modelo mas sencillo que se me ocurre para dicha data no corresponde para nada a lo que se observa.

Suponiendo que:
1) La suma de los votos para Calderon y Amlo (llamala N) es proporcional al numero de actas procesadas (esto es para simplificar las cosas, pero esta suposicion no es necesaria para concluir lo mismo), y que
2) El numero de votos para Calderon sigue una distribucion binomial (donde cada voto se le da a Calderon con probabilidad p1 independientemente de los votos anteriores, y p1=numero total de votos por Calderon al final del conteo/ numero total de votos para Calderon o Amlo al final del conteo, o a Amlo con probablidad p2=1-p1)


Entonces se espera que

1) en promedio, la diferencia de votos entre Calderon y Amlo crezca linalmente como funcion de el numero total de actas procesadas: promedio=N(2p1-1), donde N es el numero total de votos para Amlo y Calderon que crece linealmente con el numero de actas procesadas
2) la varianza de la diferencia de votos crezca linealmente con N tambien: 4p1(1-p1)N.


Asi que la data que muestras en esta figura deberia seguir una linear recta con fluctuaciones cada vez mas grandes. Obviamente esto no concuerda en absoluto con lo que se ve en el rango que muestras, donde la diferencia y sus fluctuaciones no crecen linealmente, sino que oscilan, como funcion del numero de actas procesadas. Seria muy interesante ver el comportamiento de las primeras 60000 actas, para ver que tan inconsistente es esa parte tambien. Tienes la data de esas actas?

Esto, solo dice que el sampleo no es binomial osea que las actas, como bien senialas, no fueron ordenadas de manera aleatoria antes de ser contadas, pero seria interesante poder explicar estos patrones sabiendo de donde procede cada acta.

Tambien, otra forma de analizar esta data es con un proceso de difusion, donde la diferencia aumenta por +1 si el siguiente voto es para Calderon o disminuye por -1 si es para AMLO, suponiendo otra vez independencia entre votos. Bajo este escenario, la diferencia que muestras es un proceso de difusion con bias (hacia Calderon), y se puede estimar la probabilidad de que la diferencia alcance los valores minimos y maximos que muestras, como funcion de tiempo. Y estoy seguro que la probabilidad de la data que muestras bajo este model tambien es bajisima.

Tienes mas data, o sabes donde puedo accesar esta data del PREP como funcion de tiempo, y con la mayor cantidad de detalles posibles? O sabes si alguien ya la tiene en un formato facil de manejar como el que tienes en tu pagina de internet?

Muchas gracias, saludos,
Carlos

PS Estoy copiando tambien a amigos y familiares que pudieran estar interesados.