Ho letto documenti su LSTM e ne ho verificato le implementazioni. C'è un punto che non mi è chiaro.
Nella maggior parte dei documenti si dice che le matrici di peso dai vettori cella a porta dovrebbero essere diagonali (es: Alex pagina 5, 2013), ma non l'ho visto in nessuna implementazione.
Per esempio questo:
1 2 Un altro esempio da laboratorio mila. 3Implementazione LSTM con spioncino
Queste persone stanno implementando in modo errato o mi manca qualcosa?
Ho visto anche che nel laboratorio Mila è implementato in questo modo. Penso che le prime due implementazioni siano sbagliate. – seleucia