2009-12-30 1 views
5

Sto per scrivere alcune applicazioni di esempio e documenti di accompagnamento che confrontano le modalità di accesso alle informazioni memorizzate nei database relazionali. Per dimostrare i requisiti della vita reale, ho bisogno di includere un set di dati realistico di centinaia di migliaia di fatti.Set di dati di esempio liberamente disponibili di informazioni gerarchiche e nomi realistici

È qualcuno a conoscenza della disposizione del pubblico, set di dati gratuite di tale entità, di set di dati di nomi umani con varianza-livello umano, o gerarchici set di dati di entrambi i grandi gerarchie organizzative, o grandi gerarchico, categorizzati, cataloghi di prodotti?

Per favore, indicami la direzione giusta, se lo sei.


Parte 1, i nomi umani: http://timecenter.cs.aau.dk/software.htm

Parte 2, i dati gerarchici: Nessuna risposta ancora

+0

Cosa c'è di sbagliato nel generarlo casualmente? Sicuramente lo sforzo di massaggiare i dati per adattarsi al tuo modello sarebbe lo stesso se non più sforzo. – Joe

risposta

3
+0

Questo mi ha portato a http://dev.mysql.com/doc/#sampledb che ha molti indizi promettenti. Grazie. – mikaelhg

+0

Un ulteriore esame ha portato a http://timecenter.cs.aau.dk/software.htm che ha un database di dipendenti simulato piuttosto carino, che MySQL utilizza nei propri database di esempio. – mikaelhg

2

albero di directory del proprio PC è una grande struttura gerarchica con un sacco di fatti. Probabilmente hai qualche migliaio di "Fatti" che sono nomi di file, date di modifica, dimensioni, informazioni sul SO extra, ecc. Ecc.

Se non è abbastanza grande, cerca un server a cui puoi accedere. Quello sarà più grande.

Non abbastanza grande? Ottieni un web crawler e avvia la scansione di un grande sito web. Può essere grande quanto la pazienza di gattonare.

+0

Il semplice fatto di disporre di un certo numero di dati di collegamento nodo gerarchico non è utile allo scopo di aiutare il lettore a capire in che modo una specifica soluzione dimostrata fornisce i risultati desiderati. Per questo, i dati devono fornire al lettore un contesto gerarchico comprensibile, come una gerarchia organizzativa o la gerarchia categoriale di un catalogo di strumenti. – mikaelhg

+0

Un filesystem è un "contesto gerarchico" standard, ampiamente compreso, quasi universale. Sembra molto più universale delle organizzazioni o di un catalogo di strumenti. –