Ho un database SQLite che contiene seguente tipo di schema:Generazione di una matrice densa da una matrice sparsa in NumPy pitone
termcount(doc_num, term , count)
Questa tabella contiene i termini con i rispettivi conteggi nel documento. come
(doc1 , term1 ,12)
(doc1, term 22, 2)
.
.
(docn,term1 , 10)
Questa matrice può essere considerato come matrice sparsa come ogni documento contiene pochissime termini che avranno un valore diverso da zero.
Come si crea una matrice densa da questa matrice sparsa utilizzando numpy poiché devo calcolare la somiglianza tra i documenti utilizzando la somiglianza del coseno.
Questa matrice densa apparirà come una tabella che ha docid come prima colonna e tutti i termini saranno elencati come la prima riga. E le celle rimanenti conterranno i conteggi.