Posts Tagged ‘dublincore’

Extrayendo metadatos: libextractor

Para que Vazaar sea realmente útil debe extraer un alto porcentaje de metadatos que casi haga innecesaria la interacción del usuario. Hay una entrada en el wiki dedicada al análisis de utilidades y/o bibliotecas útiles para el proyecto. Ahora estoy probando con libextractor.

Nepomuk (y II)

He estado leyendo más detenidamente acerca de Nepomuk y sus objetivos llegando a una conclusión muy clara: Nepomuk es más ambicioso que yo. Mientras que Nepomuk se centra en estructurar semánticamente un escritorio con un determinado modelo (PIMO), Vazaar es simplemente un almacen semántico de datos.

Metagoofil

Acabo de encontrar una herramienta que va a dar mas vida al proyecto. Se trata de Metagoofil. Como la misma página indica, se trata de una herramienta para obtener nformación de documentos públicos. Manos a la obra, me he descargado el script y lo he probado. Impresionant. Me he descargado en un momento cientos de [...]