2014-07-21 10 views
5

Quando ho provato con Evernote clipper extension, vedo una caratteristica molto utile. Quando ho cliccato su "articolo", mi dà veramente un corretto contenuto principale della pagina. Vediamo il risultato quando ho usato Evernote Clipper con la pagina https://developer.chrome.com/extensions/api_index extract article in a pageCome rilevare il tag principale articolo come Evernote Clipper fatto

ho guardato l'articolo principale quel campo Evernote fuori, in diverse pagine, l'articolo è infatti estratto dal primo tag articolo. Comunque evernote clipper funziona ancora bene con le pagine non usa quel tipo di tag.

Mi chiedo come Evernote tagliatore può farlo? C'è qualche supporto per la libreria js per rilevare il tag principale che contiene il contenuto principale delle pagine. Potrebbe darmi alcuni consigli per farlo.

Grazie in anticipo!

risposta

6

Da quanto ne so, non c'è js lib universale per farlo. Il clipper Evernote utilizza il proprio metodo per estrarre il contenuto "interessante" da una pagina web. È possibile accedere al codice del tagliatore di Evernote per cercare di capire il processo.

sul mio Mac, il percorso per l'estensione Chrome è:

~/Library/Application Support/Google/Chrome/Default/Extensions/pioclpoplcdbaefihamjohnefbikjilc/6.2_0/

Ecco un altro strumento che funziona abbastanza più o meno lo stesso: https://www.readability.com/

È inoltre possibile controllare questa discussione: What algorithm does Readability use for extracting text from URLs?

o cercare su Google per termini come 'extractio contenuti n js lib 'per esempio. (trovato questo: https://github.com/hatena/extract-content-javascript)

Spero che questo aiuti

+0

Grazie per la vostra suggession. Dò un'occhiata al progetto "leggibilità" – yelliver