2012-03-17 7 views
5

'Devo sviluppare un software destinato a Business Analyst del supermercato "Negozi Futuri", il software esegue l'estrazione di regole di associazione sui dati transitori dati delle transazioni di vendita del supermercato e prepara la politica di attualizzazione preparando Combo . Il software si avvale degli algoritmi di data mining ovvero Apriori Algorithm. Le regole di associazione verranno visualizzate in modo user friendly per la generazione di politiche di sconto basate su regole di associazione positive. "Dataset supermercato per algoritmo Apriori

Da dove posso ottenere il set di dati del supermercato per controllare l'algoritmo Apriori che ho codificato?

+1

è questo il compito? – millimoose

risposta

6

Per ottenere un set di dati di mercato, potete andare qui:. Fimi.ua.ac.be/data/ e scaricare il set di dati di vendita al dettaglio

Si tratta di un set di dati anonimi di transazioni da un negozio belga .

e 'perfetto per il test Apriori o altre miniere e delle regole di associazione algoritmi di data mining frequente itemset.

0

Invece di cercare un set di dati del mondo reale, è necessario progettare un set di dati piccolo e specifico per ogni unità di test. Il set di dati dovrebbe fornire il presupposto minimo necessario per verificare una singola funzionalità del sistema. Ciò renderà più semplice rilevare i bug, mantenere i test nel tempo e dimostrare le capacità e i modelli di utilizzo del sistema agli altri sviluppatori.

Un esempio da un dominio diverso potrebbe essere un test per un sottosistema utente che crea e convalida gli accessi a un sito Web.

  • addsNewUser - set di dati vuoto
  • throwsExceptionForDuplicateUsername - utente singolo insieme di dati
  • correctPasswordPasses - stesso insieme di dati
  • throwsExceptionForIncorrectUsername - stesso insieme di dati
  • throwsExceptionForIncorrectPassword - stesso insieme di dati
  • throwsExceptionWhenNewUsernameExists - insieme di dati a due utente

Aggiornamento: Se è necessario un set di dati di grandi dimensioni per eseguire l'integrazione o il test delle prestazioni, si è probabilmente lasciato scrivere un programma per generare una raccolta casuale di acquisti. Dubito che i supermercati esistenti siano disposti (o in grado) a separarsi dai loro set di dati reali.

Detto questo, mentre lavoravo come contraente per un assicuratore sanitario molti anni fa (pre-HIPAA) mi è stato fornito un set di dati campione con cui lavorare. Conteneva informazioni reali sui pazienti, tra cui SSN e storia medica riservata. :(

+0

ho fatto tutto unit testing, e anche testato su piccolo insieme di dati, ora ho bisogno di un grande dati per verificarlo – blackhole

+0

@blackhole - Come da mio upd ho mangiato, ho il sospetto che tu abbia bisogno di costruirlo da solo. –