[Cvu] traducción automática

Luis Mochan mochan en fis.unam.mx
Mar Ago 1 19:06:40 CDT 2017


Hola Karo,

On Tue, Aug 01, 2017 at 04:59:20PM -0500, karo wrote:
> Excelente Luis! Deja me ver, y por el beneficio de los demás, si te
> entiendo. La propuesta será; pedir Conacyt hacer el CVU lo mas sencillo
> posible, como dice Roberto, eliminando  secciones, rubros, datos, etc. que
> no son esenciales para Conacyt.

Hay varias peticiones mezcladas. Esta propuesta es compatible con lo
que mencionas, pero sería útil aún si (o mientras) no los acabamos de
convencer.  

> Luego, un tipo de programa de interfaz (como
> los tuyos) que puedan convertir bases de datos de nuestro trabajo ya
> existentes en linea (e.g. CV de texto sencillo, RG, Google Scholar, ORCID,
> etc.) a formato YAML.

La idea es que hay varios formatos a los que tenemos acceso. Algunos
ya tenemos guardada la información en nuestro CV individual. Algunos
tienen acceso y saben usar herramientas que les permiten en un
instante generar en línea sus listas de publicaciones. La idea es
proporcionarles a todos ellos herramientas que permitan convertir lo
que ya tienen o que pueden obtener de inmediato a un formato tan
estructurado que sea trivial convertir a las bases de datos internas
de conacyt. Para mí, y me imagino que para muchos, es mucho más fácil
hacer copy and paste a un archivo de texto, editarlo, condicionarlo y
procesarlo con un programa, que llenar campos individuales para cada
registro. Usé el ejemplo de las publicaciones, pero la idea se puede
extender a todas  listsas de actividades relevantes que eventualmente
conformen el CVU. Lo que hice con publicaciones lo podría hacer para
presentaciones en congresos, cursos impartidos, tesis dirigidas, etc.

> Nosotros, los investigadores, serán responsables a
> mandar un archivo YAML revisado y corregido manualmente s Conacyt, y se
> acabo.

Esa es una posibilidad.

Una posibilidad un poco menos conveniente para nosotros, aunque quizás
un poco más conveniente para conacyt, es que una vez revisado y
corregido, nosotros mismos (o alguien que nos apoye) genere una base
de datos intermedia entre YAML y el CVU final. También hice un
programa que hace algo por el estilo. La ventaja es que hay
herramientas poderosas para modificar la base de datos sin mucho
esfuerzo (más que conseguir quien lo sepa hacer). Por ejemplo, a
conacyt le preocupa que escribamos mal el nombre de un autor o de una
revista. Por ejemplo Luis Mochán, L. Mochán, Mochán, L.,
WL Mochán, Mochán WL, W. L. Mochán, Mochán, W. L. son todos la misma
persona. En lugar de buscar mi nombre cientos de veces a través del
sistema, con la base de datos podría hacer algo como
  UPDATE nombres SET nombrecanónico="Mochán, W. Luis" where nombre
     LIKE "%Moch%";
y ya tendría un diccionario de nombres hacia mi nombre oficial.
Lo mismo con revistas, nombres de universidades, nombres de ciudades
(sabrá alguien que el Distrito Federal no existe), etc.
De la misma manera, campos faltantes como el ISSN o el país se pueden
añadir en un paso.
   ALTER TABLE revistas ADD issn;
   ALTER TABLE revistas ADD país;
   UPDATE revistas SET issn="0031-9007" WHERE revistacanónica LIKE "Physical Review Letters"
   UPDATE revistas SET país="Estados Unidos" WHERE revistacanónica LIKE "Phys% Rev%"
Este último ejemplo le pondría el país a PRL, PRA, PRB,
etc. simultáneamente. Lo ideal es que este tipo de operaciones
masivas, que podrían afectar a muchos usuarios, las podría/debería
hacer CONACyT, pero si se niegan, hacerlo nosotros es mucho menos
doloroso que llenar formitas.

Lo que es indispensable para que lo anterior funcione, es que conacyt
acepte que puede haber registros incompletos, que se puedan completar
después.

Yo sugiero para esta segunda posibilidad usar sqlite, pues toda la
base de datos queda en un archivo que podría subirse a conacyt. No se
requiere un manejador de bases de datos y el programa se distribuye
gratuitamente para windows, mac y (desde luego) linux.

>   Si esto es el plan, creo que SI podría funcionar

Eso espero. Si yo pude hacer estos programas en dos mañanas, no dudo
que un experto en cómputo pueda hacer algo mucho más funcional y
robusto.

> si Conacyt simplifica su
> CVU y asigna gente para tener actualizado los programas de interfaz (aparte
> de ti, no creo que hay suficiente investigadores capacitados y dispuestos a
> mantener los programas de interfaz). Pero si, será un gran avance y enorme
> alivio para la comunidad científico de este país.

Yo creo que sí ha de haber gente capacitada. Mi impresión es que
cuando los desarrolladores no usan su propio software, entonces
se preocupan por el funcionamiento interno del programa, pero se
ovlidan de las interfaces con los usuarios. Además, los usuarios no
somos los clientes que siempre tienen la razón y pagamos, sino que
conacyt paga el desarrollo y nos lo entrega terminado. Por eso me
parece tan valioso el ejercicio que estamos empezando, de tener un
canalo de comunicación entre las tres partes: quienes toman las
decisiones, quienes desarrollan los sistemas y quienes los usamos. Me
sospecho que no es suficientemente apreciado esto, pero en México
puede considerarse insólito.

> 
> Notas;
> 1) Hay archivos tipo Bibtex (similar a YAML) disponibles para todos nuestros
> trabajos en revistas.

Sí. Al igual que YAML, son latosos de escribir a mano (a menos que
tengas un editor que sepa bibtex, como emacs y dicen que vi), pero se
pueden crear automáticamente con herramientas como las que
desarrollé. Me sería muy fácil generar bibtex en lugar de YAML. El
problema es que bibtex es muy específico; es sólo para
bibliografía. Por otro lado, YAML es totalmente genérico. Lo puedes
usar para serializar cualquier estructura de datos que te venga en
mente. Conacyt seguramente insistirá en requerir información más allá de nuestra
lista de publicaciones.

> 2) En cambio de ORCID, teniendo tus datos actualizado en RG ó Google Scholar
> (es automático) te da mucho visibilidad entre tu comunidad.

Sí. Yo me registré en ORCID, pero confieso no haberle sacado jugo aún.

Abrazos,
Luis

-- 

                                                                  o
W. Luis Mochán,                      | tel:(52)(777)329-1734     /<(*)
Instituto de Ciencias Físicas, UNAM  | fax:(52)(777)317-5388     `>/   /\
Apdo. Postal 48-3, 62251             |                           (*)/\/  \
Cuernavaca, Morelos, México          | mochan en fis.unam.mx   /\_/\__/
GPG: 791EB9EB, C949 3F81 6D9B 1191 9A16  C2DF 5F0A C52B 791E B9EB





Más información sobre la lista de distribución Cvu