Sto facendo un progetto in classifica di notizie. Fondamentalmente il sistema classificherà gli articoli di notizie in base all'argomento predefinito (ad esempio sport, politica, internazionale). Per costruire il sistema, ho bisogno di set di dati gratuiti per addestrare il sistema.News Data Set di articoli
Finora, dopo poche ore su google e collegamenti da here, l'unico set di dati adatto che ho trovato è this. Mentre questo si spera abbastanza, penso che cercherò di trovare di più.
Si noti che i set di dati che voglio:
- Contiene articoli di notizie complete, non solo titolo
- è in inglese
- In formato .txt, non XML o db
Qualcuno può aiutarmi?
Sì, sto cercando di trovare il set di dati perché sarò occupato con il progetto, quindi cerco di ridurre le cose da fare. Inoltre, non so come scrivere uno script in Python/Perl/PHP. – Hearty