Archive for 2007

Dublin Core

Este es el primero de una serie de artículos sobre Dublin Core (DC) y metadatos. Explicaré un poco la teoría e intentaré mostrar ejemplos prácticos de su uso en Vazaar. Para realizarlo me he ayudado de una traducción al español de DC que he encontrado en RedIris y diversa documentación que he ido encontrando en [...]

Extrayendo metadatos: libextractor

Para que Vazaar sea realmente útil debe extraer un alto porcentaje de metadatos que casi haga innecesaria la interacción del usuario. Hay una entrada en el wiki dedicada al análisis de utilidades y/o bibliotecas útiles para el proyecto. Ahora estoy probando con libextractor.

Nepomuk (y II)

He estado leyendo más detenidamente acerca de Nepomuk y sus objetivos llegando a una conclusión muy clara: Nepomuk es más ambicioso que yo. Mientras que Nepomuk se centra en estructurar semánticamente un escritorio con un determinado modelo (PIMO), Vazaar es simplemente un almacen semántico de datos.

Nepomuk

Llevo unos cuantos meses vacilando sobre qué ontología debería usar para organizar y armonizar toda la estructura interna de Vazaar. No es solo el hecho de darle un identificador a un fichero y adjuntar unos cuantos metadatos ala Dublin Core sino que debería estar basado en una ontología o conjunto de ontologías que definan toda [...]

Metagoofil

Acabo de encontrar una herramienta que va a dar mas vida al proyecto. Se trata de Metagoofil. Como la misma página indica, se trata de una herramienta para obtener nformación de documentos públicos. Manos a la obra, me he descargado el script y lo he probado. Impresionant. Me he descargado en un momento cientos de [...]