JOSSER

Descrizione

JOSSER (Java Open Source Structure Extractor) è uno strumento open-source sviluppato in Java per il parsing di dump RDF di DMOZ (Open Directory Project) e l’esportazione dei dati verso database relazionali MySQL e PostgreSQL.

Il progetto è stato progettato per gestire grandi quantità di dati con efficienza e affidabilità.

Caratteristiche Principali

Struttura del Database

JOSSER genera diverse tabelle chiave:

Esempio di Configurazione

path       = c:/dmoz/
top        = Top/Computers
rchunk     = 2000000
wchunk     = 500000
driver     = com.mysql.jdbc.Driver
engine     = mysql
host       = localhost
port       = 3306
db         = dmoz

Requisiti

Collegamenti


Progetto rilasciato sotto licenza GNU GPL v2.