¿Qué mejor manera de terminar un viernes a la noche analizando el Proyecto que el Ejecutivo presentó a la Asamblea General?
Primer paso: descargar los PDF de la página de Presidencia… que lamentablemente no eran archivos electrónicos, sino que escaneos de bastante poca calidad, aquí que…
Segundo paso: correrles OCR a todos ellos y luego…
Tercer paso: corregir un poco el texto con Word y eliminar palabras especialmente ruidosas como Artículo, Sección e Inciso que aparecen mucho en el texto y no hacen al asunto, ya que son parte de la estructura del documento.
Cuarto paso: hacer pasar ese texto por Wordle, una maravilla de la tecnología.
Quinto paso: Publicarlo! Pueden ver y compartir este link http://fdls.in/Q
Y aquí lo vemos:
¿Próximos pasos? Habría que Etiquetar cada Artículo y hacer una nube de etiquetas, porque en realidad lo anterior no dice demasiado… al menos que alguien tenga más herramientas que yo para sacar conclusiones. Y también debería haber sacado la palabra «inciso». Del texto eliminé las palabras Artículo, Sección e Inciso.
Pero…! También estaba el documento de Exposición de Motivos, que sí estaba en texto, así que también marchó al Wordle. Pueden ver y compartir este link http://fdls.in/O
Una comparación de los Motivos con el Presupuesto en sí, puede dar mucha idea de su correlación. O no.


Comentarios
Comentarios cerrados. Este archivo conserva únicamente los comentarios históricos aprobados.
Muchas gracias Matías! Lo ví pero no me había guardado el link, jeje.
te dejo el link en el que publican tu post en Observa
http://www.observa.com.uy/actualidad/nota.aspx?id=101918&sec=8
Genial! Felicitaciones