2010-08-09 10 views
7

Attualmente ho scritto un algoritmo in Ruby basato sul codice di leggibilità arc90 per estrarre un articolo da una pagina web.Qualcosa di meglio dell'alchimia rubino per estrarre parole chiave?

Ora che ho l'articolo, voglio estrarre le parole chiave e le informazioni specifiche da esso (nomi, autore, ecc)

ho sentito Alchemy è stato un grande gioiello rubino per fare questo se si consuma un sacco di risorse . Ci sono gemme migliori che posso usare per questo?

+0

Penso che la parola chiave "alchimia" si riferisca al progetto di Alchimia di Adobe, non alla Gemma di Rubino. Vedere le faq: http://stackoverflow.com/tags/alchemy/info – paleozogt

risposta

2

C'è un OpenCalais gem che fornisce funzionalità simili. Oltre all'estrazione delle entità, può anche rilevare eventi e relazioni tra entità. Non è leggero, anche se non saprei dire se è meglio o peggio dell'alchimia perché non ho usato la gemma Alchemy. Spero che questo ti aiuti.

+0

Sono andato e ho scritto la mia gemma per OpenCalais: https://github.com/RedFred7/dover_to_calais – RedFred

9

veloce, leightweight e facile da usare gioiello per l'estrazione di parole chiave da contenuti più lunghi:

https://rubygems.org/gems/highscore

lo uso in produzione, funziona come un fascino.

La domanda è un po 'più vecchia, ma lascerò questo qui per gli altri che verranno da Google per vedere questa domanda.