[Cvu] PROPUESTA

Luis Mochan mochan en fis.unam.mx
Jue Jul 6 21:29:06 CDT 2017


On Thu, Jul 06, 2017 at 12:52:14PM +0200, Hanna Oktaba wrote:
> No conozco este formato
De acuerdo a wikipedia, YAML es un formato de serialización de datos
legible por humanos inspirado en lenguajes como XML, C, Python, Perl,
así como el formato para correos electrónicos especificado por el RFC
2822. YAML fue creado bajo la creencia de que todos los datos
pueden ser representados adecuadamente como combinaciones de listas,
hashes (mapeos) y datos escalares (valores simples). La sintaxis es
relativamente sencilla y fue diseñada teniendo en cuenta que fuera muy
legible pero que a la vez fuese fácilmente mapeable a los tipos de
datos más comunes en la mayoría de los lenguajes de alto nivel.   

Quizás lo más claro sería dar un ejemplo de un fragmento de mi
ridículum escrito en latex y escrito en YAML

%%%%%%% LaTeX

\subsection{Artículos de investigación en revistas periódicas}

\begin{milista}

\addtocounter{footnote}{1}\footnotetext{Con arbitraje}
\setcounter{staticfoot}{\value{footnote}}
\foo{\it  Optical Properties of Quasi-Two Dimensional Systems:
	Non Local Effects\/},
	W. Luis Mochán y Rubén Barrera,
	Physical Review B \vol23, 5707-5718, (1981).

\foo{\it  Surface Contribution to the Optical Properties of
	Non-Local Systems\/},
	W. Luis Mochán, Ronald Fuchs y Rubén G. Barrera,
	Physical Review B \vol27, 771-780  (1983).

\foo{\it  Surface Local-Field Effect\/},
	W. L. Mochán y R.G. Barrera,
	Journal de Physique (París) \vol45 C5, 207-212 (1984).

######### YAML
---
- Nombre: Mochán Backal, Wolf Luis
- Artículos:
   - Tít: Optical Properties of Quasi-Two Dimensional Systems: Non Local Effects
     Au:
         - Mochán, W. Luis
	 - Barrera, Rubén
     Rev: Physical Review B
     Vol: 23
     Pág: 5707-5718
     Año: 1981
   - Pág: 771-780
     Rev: Physical Review B
     Tít: >
         Surface Contribution to the Optical
	 Properties of
	 Non-Local Systems
     Au:
	- Mochán, W. Luis
	- Fuchs, Ronald
	-  Barrera, Rubén G.
     Rev: Physical Review B
     Vol: 27
     Año: 1983
   - Tít: Surface Local-Field Effect
     Au:
	- Mochán, W. L.
	- Barrera, R.G.
     Rev: Journal de Physique (París)
     Vol: 45 C5,
     Pág: 207-212
     Año: 1984
...
############

Como ves, son simples listas y arreglos asociativos que contienen
otras listas y arreglos y finalmente texto simple.  
Se usa anidación para indicar donde empieza y termina cada lista. Cada
elemento de una lista empieza con un guión, cada elemento de un
arreglo asociativo comienza con una palabra clave seguida por dos
puntos y por el valor correspondiente. Los valores pueden ser a su vez
una línea de texto (como los títulos arriba) o varias líneas de texto
que se pueden juntar en una sola (como el segundo título arriba), o
una lista (como las listas de autores arriba), o un arreglo asociativo...

Podría incluir además un diccionario para indicar que, por ejemplo,
Barrera, R.G. y Barrera, Rubén G. son el mismo autor, o que PRB,
Phys. Rev. B y Physical Review B son la misma revista. Los campos se
pueden presentar en cualquier orden, como muestra mi segundo artículo,
en el que comencé por la página.

Los campos irrelevantes (como el número de la revista, el país que la
edita) pueden añadirse u omitirse.

Resulta que hay herramientas para validar este tipo de archivos y para
traducirlos de manera automática a campos de una base de datos
arbitraria usando cualquier lenguaje de programación. Yo he empleado
este tipo de herramientas en perl.

Para este email hice la traducción desde LATEX a YAML a mano, pero la
mayor parte del trabajo podría automatizarse.

La selección de claves (Pág, Rev, Tít, Au, Año, etc.) es recién
inventada, aunque podrían hacerse propuestas más razonables, o incluso
podrían coexistir distintos esquemas de propuestas: Habrá quien
prefiera escribir Autor: con todas sus letras, o quien prefiera
escribir TI: en lugar de Tít: que es el esquema que usa (o usaba) el
Citation Index. También están los formatos de Orcid o el formato del
webofscience (AU para autores, AF para los nombre completos de los
autores, TI para títulos, SO para revista (SOurce), PD para mes de
publicación, PY para año de publicación, DI para doi, SN para ISSN,
etc.) Podríamos usar todos éstos. A lo mejor los humanistas quieren añadir el
ISBN. Quizás en ciencias duras queramos añadir el DOI y hasta la
página del ArXiV donde vive el pretiro.

La idea del esquema de YAML es que es fácil producirlo automáticamente
con una computadora, no es demasiado difícil escribirlo a mano, o
editarlo a mano para corregir los errores que haya cometido la
computadora y es suficientemente versátil para poder codificar la
información que queramos guardar en cualquier base de datos. Además,
cada académico podría añadir campos que considere relevantes, aunque
sean ignorados por otros como el conacyt o su propio consejo interno. 

Mi propuesta es entonces desarrollar junto con la gente de conacyt
herramientas que permitan traducir de los formatos libres de cada
investigador a este tipo de formato libre ma non troppo y a los
formatos rígidos de las bases de datos de conacyt.

Saludos,
Luis


> 
> Hanna
> 
> El 6 de julio de 2017, 1:26, Luis Mochan <mochan en fis.unam.mx> escribió:
> 
> > Hola Hanna,
> >
> > ¿Conoces el formato YAML? Creo que sería un buen candidato como
> > intermediario entre la rigidez de las bases de datos que mantiene
> > conacyt y lo currículos en formatos variados que mantenemos todos los
> > investigadores, con las ventajas de ser un formato de texto legible y
> > editable por humanos, pero suficientemente estructurado para poder ser
> > fácilmente leido y escrito por computadoras, y vaciado en bases de
> > datos. Se podrían elaborar programas ad-hoc para traducir cuanto
> > formato se nos ocurra a yaml automática o en el peor de los casos,
> > semi-automáticamente (i.e., con asistencia humana para resolver
> > ambigüedades) y sería trivial un programa que extraiga la información
> > de un archivo yaml y la vacíe en una base de datos, así como vaciarla
> > en un archivo de latex, docx o cualquier otro formato para su
> > presentación.
> >
> > ¿Qué opinan Viridiana y Flor?
> >
> >
> > Saludos,
> > Luis
> >
> >
> > On Wed, Jul 05, 2017 at 11:44:57AM -0400, Luis Mochan wrote:
> > > Gracias Hanna. Interesante que en ocasiones el sentido común quede
> > > codificado en estándares. Quizás sea razonable pedir que el
> > > software del CVU (y muchos otros) cumpla las normas de calidad
> > > aplicables, como la ISO25010 y sea certificado.
> > > Saludos,
> > > Luis
> > >
> > >
> > >
> > > On Wed, Jul 05, 2017 at 02:26:22PM +0200, Hanna Oktaba wrote:
> > > > Bien dicho Luis
> > > > Es el atributo de calidad en uso básico según el sentido común y el
> > estándar internacional ISO/IEC 25010🤓
> > > > Hanna
> > > > Enviado desde mi iPhone
> > > >
> > > > > El 04/07/2017, a las 18:09, Luis Mochan <mochan en fis.unam.mx>
> > escribió:
> > > > >
> > > > > Hola Oracio,
> > > > >> No he leído muchos emails sobre la carta a CONACyT por parte de la
> > comunidad, pero aquí les hago mis observaciones.
> > > > >> Considero que la carta debe de ser mucho más compacta y establecer
> > de forma puntual las sugerencias para la modificación del CVU2017.
> > > > > Quizás debió ser más corta, pero como expresé unos días atrás, ya con
> > > > > firmas no creo que deba modificar el contenido. Por otro lado, las
> > > > > sugerencias puntuales son demasiadas para una carta breve; esa es la
> > > > > razón para haber creado un foro de discusión, al que se invita a
> > > > > sumarse a miembros de conacyt.
> > > > >>
> > > > >> La última parte de la carta señala acertadamente que el CVU2017
> > debe de ser un resumen curricular y considero que debe de ser presentado
> > por las áreas que el mismo CONACyT ha mantenido a lo largo de los años. Es
> > éste el gran punto donde falla el CVU2017 de CONACyT: considera la misma
> > plataforma para todo miembro del Sistema de Investigadores. Considero que
> > si CONACyT modifica su actual plataforma por área facilitaría enormemente
> > la captura de datos. Con un trabajo propuesto en dos etapas, uno de resumen
> > a corto/mediano plazo y otro desglosado a largo plazo bien puede resolver
> > la gran problemática que tenemos con la actual plataforma CONACYT.
> > > > >
> > > > > Generalizando tu observación: Las bases de datos deben adaptarse a la
> > > > > comunidad de investigadores, incorporando su riqueza y diversidad, y
> > no ser la
> > > > > comunidad de investigadores la que se adapte a las bases de datos y
> > > > > sus poco flexibles catálogos.
> > > > >
> > > > > Saludos,
> > > > > Luis
> > > > >
> > > > >
> > > > >
> > > > >
> > > > >>
> > > > >> saludos,
> > > > >>
> > > > >> oracio barbosa
> > > > >> Grupo de Propiedades Opticas de la Materia
> > > > >> Centro de Investigaciones en Optica.
> > > > >
> > > > >> _______________________________________________
> > > > >> Cvu mailing list
> > > > >> Cvu en em.fis.unam.mx
> > > > >> http://em.fis.unam.mx/cgi-bin/mailman/listinfo/cvu
> > > > >
> > > > >
> > > > > --
> > > > >
> > > > >                                                                  o
> > > > > W. Luis Mochán,                      | tel:(52)(777)329-1734
> >  /<(*)
> > > > > Instituto de Ciencias Físicas, UNAM  | fax:(52)(777)317-5388
> >  `>/   /\
> > > > > Apdo. Postal 48-3, 62251             |
> >  (*)/\/  \
> > > > > Cuernavaca, Morelos, México          | mochan en fis.unam.mx   /\_/\__/
> > > > > GPG: 791EB9EB, C949 3F81 6D9B 1191 9A16  C2DF 5F0A C52B 791E B9EB
> > > > >
> > > > >
> > > > >
> > > > > _______________________________________________
> > > > > Cvu mailing list
> > > > > Cvu en em.fis.unam.mx
> > > > > http://em.fis.unam.mx/cgi-bin/mailman/listinfo/cvu
> > > >
> > > > _______________________________________________
> > > > Cvu mailing list
> > > > Cvu en em.fis.unam.mx
> > > > http://em.fis.unam.mx/cgi-bin/mailman/listinfo/cvu
> > >
> > > --
> > >
> > >                                                                   o
> > > W. Luis Mochán,                      | tel:(52)(777)329-1734     /<(*)
> > > Instituto de Ciencias Físicas, UNAM  | fax:(52)(777)317-5388     `>/   /\
> > > Apdo. Postal 48-3, 62251             |                           (*)/\/
> > \
> > > Cuernavaca, Morelos, México          | mochan en fis.unam.mx   /\_/\__/
> > > GPG: 791EB9EB, C949 3F81 6D9B 1191 9A16  C2DF 5F0A C52B 791E B9EB
> > >
> > >
> > >
> > > _______________________________________________
> > > Cvu mailing list
> > > Cvu en em.fis.unam.mx
> > > http://em.fis.unam.mx/cgi-bin/mailman/listinfo/cvu
> >
> > --
> >
> >                                                                   o
> > W. Luis Mochán,                      | tel:(52)(777)329-1734     /<(*)
> > Instituto de Ciencias Físicas, UNAM  | fax:(52)(777)317-5388     `>/   /\
> > Apdo. Postal 48-3, 62251             |                           (*)/\/  \
> > Cuernavaca, Morelos, México          | mochan en fis.unam.mx   /\_/\__/
> > GPG: 791EB9EB, C949 3F81 6D9B 1191 9A16  C2DF 5F0A C52B 791E B9EB
> >
> >
> >
> > _______________________________________________
> > Cvu mailing list
> > Cvu en em.fis.unam.mx
> > http://em.fis.unam.mx/cgi-bin/mailman/listinfo/cvu
> >
> 
> 
> 
> -- 
> Hanna J. Oktaba
> Facultad de Ciencias, UNAM
> tel. 56223899 #45797
> o 56224866

> _______________________________________________
> Cvu mailing list
> Cvu en em.fis.unam.mx
> http://em.fis.unam.mx/cgi-bin/mailman/listinfo/cvu


-- 

                                                                  o
W. Luis Mochán,                      | tel:(52)(777)329-1734     /<(*)
Instituto de Ciencias Físicas, UNAM  | fax:(52)(777)317-5388     `>/   /\
Apdo. Postal 48-3, 62251             |                           (*)/\/  \
Cuernavaca, Morelos, México          | mochan en fis.unam.mx   /\_/\__/
GPG: 791EB9EB, C949 3F81 6D9B 1191 9A16  C2DF 5F0A C52B 791E B9EB





Más información sobre la lista de distribución Cvu