[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ejercicio



Hola,

Les adjunto un ejercicio que hice con datos de http://2012.openprep.org/ , donde ya tienen 8.6% de casillas capturadas a partir de fotos (si les creemos, aunque uno puede checar una a una las fotos y uno se puede bajar un archivo csv con todos los datos que tienen, casilla por casilla)

Obviamente hay más sábanas del DF, y como AMLO ganó 2 a 1 a EPN, pues al hacer los %s sale AMLO con 39% y EPN con 30%.

Hice un estimado para calcular los porcentajes estado a estado de openprep (donde suponemos que hay más datos de casillas urbanas), y después los multipliqué por el número real de votantes por estado, a partir de datos del PREP. Al hacer esos cálculos y sumar los votos ponderados, sale AMLO 36% y EPN 32.6%.

Esto no es una prueba contundente, ya que en algunos estados hay menos del 2% de las sábanas capturadas, y al hacer la ponderación uno puede esperar amplias varianzas (estoy promediando datos que no son promediables decentemente). Pero por ejemplo chequen Baja California, con casi 19% de casillas, con datos de openprep ponderados sale que gana AMLO por 2 puntos, mientras que en el PREP pone a EPN arriba por 5 puntos... Los anomaleros sabrán qué tan anómalas son estas diferencias, ya que dependen de qué tanta variación haya dentro de un mismo estado. Se sabe que EPN tiene muchos más votos en casillas rurales, que son precisamente las que no están en openprep ni en fotoxcasilla, pero también donde tradicionalmente se hace más chanchullo.

Cualquier comentario es bienvenido.

Saludos,
Carlos
http://turing.iimas.unam.mx/~cgg/
@cgershen @cgg_mx @cxdig

Attachment: openprep.xlsx
Description: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet