2016-06-02 30 views

risposta

2

Qui ci sono tre opzioni:

  1. Crop gli articoli più lunghi.
  2. Appoggia gli articoli più corti.
  3. Utilizzare una rete neurale ricorrente, che supporta naturalmente ingressi di lunghezza variabile.
+0

Will opzione 1 e 2 influenzano il significato originale degli articoli dopo il taglio o imbottitura? – Fiong

+0

Probabilmente il taglio avrà (non tanto imbottitura), ma hai davvero bisogno di leggere un intero articolo di notizie per averne il senso? In che modo il taglio svantaggioso dipende dal tuo compito. –

+0

Riguardo a 3, penso sia vero se si ha un problema sequenza-sequenza, come il tagging pos. Nell'etichettatura sequenziale, come l'analisi del sentimento o il rilevamento delle emozioni, credo che si debba eseguire il troncamento/riempimento in Keras per poter utilizzare l'RNN per l'etichettatura in sequenza. – pedrobisp