[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
datos elecciones
Hola Mochan,
Mi nombre es Carlos Gomez Uribe. Soy mexicano y estoy estudiando un
doctorado en ingenieria medica en Boston, en el MIT, y mi fuerte es la
probabilidad. Me llego el email con los datos que procesaste y pusiste en
tu pagina, y se me hicieron muy interesantes. En particular me intereso la
ultima grafica, donde tienes la diferencia de votos entre Calderon y AMLO
como funcion de actas procesadas. El modelo mas sencillo que se me ocurre
para dicha data no corresponde para nada a lo que se observa.
Suponiendo que:
1) La suma de los votos para Calderon y Amlo (llamala N) es proporcional al
numero de actas procesadas (esto es para simplificar las cosas, pero esta
suposicion no es necesaria para concluir lo mismo), y que
2) El numero de votos para Calderon sigue una distribucion binomial (donde
cada voto se le da a Calderon con probabilidad p1 independientemente de los
votos anteriores, y p1=numero total de votos por Calderon al final del
conteo/ numero total de votos para Calderon o Amlo al final del conteo, o a
Amlo con probablidad p2=1-p1)
Entonces se espera que
1) en promedio, la diferencia de votos entre Calderon y Amlo crezca
linalmente como funcion de el numero total de actas procesadas:
promedio=N(2p1-1), donde N es el numero total de votos para Amlo y Calderon
que crece linealmente con el numero de actas procesadas
2) la varianza de la diferencia de votos crezca linealmente con N tambien:
4p1(1-p1)N.
Asi que la data que muestras en esta figura deberia seguir una linear recta
con fluctuaciones cada vez mas grandes. Obviamente esto no concuerda en
absoluto con lo que se ve en el rango que muestras, donde la diferencia y
sus fluctuaciones no crecen linealmente, sino que oscilan, como funcion del
numero de actas procesadas. Seria muy interesante ver el comportamiento de
las primeras 60000 actas, para ver que tan inconsistente es esa parte
tambien. Tienes la data de esas actas?
Esto, solo dice que el sampleo no es binomial osea que las actas, como bien
senialas, no fueron ordenadas de manera aleatoria antes de ser contadas,
pero seria interesante poder explicar estos patrones sabiendo de donde
procede cada acta.
Tambien, otra forma de analizar esta data es con un proceso de difusion,
donde la diferencia aumenta por +1 si el siguiente voto es para Calderon o
disminuye por -1 si es para AMLO, suponiendo otra vez independencia entre
votos. Bajo este escenario, la diferencia que muestras es un proceso de
difusion con bias (hacia Calderon), y se puede estimar la probabilidad de
que la diferencia alcance los valores minimos y maximos que muestras, como
funcion de tiempo. Y estoy seguro que la probabilidad de la data que
muestras bajo este model tambien es bajisima.
Tienes mas data, o sabes donde puedo accesar esta data del PREP como
funcion de tiempo, y con la mayor cantidad de detalles posibles? O sabes si
alguien ya la tiene en un formato facil de manejar como el que tienes en tu
pagina de internet?
Muchas gracias, saludos,
Carlos
PS Estoy copiando tambien a amigos y familiares que pudieran estar interesados.