2011-01-29 10 views
8

Esistono modi per utilizzare i dump di dati di base gratuiti per creare un database simile a quello offerto da Freebase, ma sul proprio server? Praticamente freebase ma localmente e non attraverso l'API?Usa dati freebase sul server locale?

Immagino che sarebbe possibile creare, ma esistono già delle soluzioni? O qualsiasi soluzione alternativa per dati simili senza l'utilizzo di un'API? Non ho trovato questo per dbpedia neanche: |

+0

sei riuscito a farlo? quale soluzione hai usato? quali risorse del computer (ram, disk, cpu ...) hai bisogno? –

+0

No, non l'ho fatto: < – freakshow

risposta

1

Se è possibile esportare il database per dire valori delimitati da tabulazioni o valori separati da virgole in TXT o file di database come MDB, XLS o qualsiasi altro formato di dati altamente trasportabile, non si avranno problemi a creare il proprio database MySQL su il tuo computer usando quei dati. La cosa principale è assicurarsi di poter esportare i dati da cui è possibile ricostruire il proprio database da.

2

L'importazione dei dati in un triplice negozio a scelta non sarebbe difficile, ma avrete grandi difficoltà a ottenere risposte in un tempo ragionevole a meno che non stiate facendo qualcosa di banale.

Qualcuno ha importato l'intero set di dati in MySQL qualche anno fa: ci sono volute 2 settimane per caricare e anche query semplici come "il conteggio delle cose digitate come persona" sono durate> 1 minuto per dare una risposta. Era su un grosso hardware e il set di dati è molto più grande adesso di quanto lo fosse allora.

+0

Devi capire come sono disposti i dati di Freebase e quindi ottimizzarlo prima di caricare MySQL. Un modo è descritto qui: http://stackoverflow.com/a/12428232/756579 (carica tutto il Freebase e il tempo di risposta è frazione di secondo). –

3

io sono il creatore di :BaseKB, la prima conversione utilizzabile di Freebase to RDF.

Ci sono problemi di integrità della chiave nel dump di Freebase che rendono difficile ottenere risultati completamente corretti dal dump quad. : BaseKB ricostruisce la struttura chiave di Freebase in modo tale da mantenere l'assunzione del nome univoco. Questo è importante, perché la possibilità di scrivere query SPARQL semplici che funzionano come le query SQL dipende da questo.

In questo momento,: BaseKB esiste in due edizioni. C'è una versione gratuita che consiste di 120 milioni di fatti circa 4 milioni di argomenti (quelli di Wikipedia) e c'è una edizione "Pro" che contiene tutto.

Per quanto riguarda i problemi di prestazioni sollevati da Phillip Kendall, posso dire che si tratta principalmente di avere abbastanza RAM. Con 24 GB di RAM posso caricare la versione gratuita in un triplo negozio in un'ora. Alcune query richiedono più tempo di quanto mi piaccia, ma le prestazioni complessive della query sono buone.

Chiunque desideri utilizzare l'edizione "Pro" avrà bisogno di hardware insolitamente potente e impiegherà un notevole sforzo per far funzionare la sua catena degli strumenti.Sto lavorando con i partner in questo momento per offrire "Pro" agli utenti in modo soddisfacente.

+0

Paul, puoi espandere l'hardware necessario per eseguire Pro? Puoi espandere i partner? BaseKB si sta espandendo oltre i dati di Freebase/DBpedia? Grazie –