Ho un DataArray molto lungo di stringhe e mi piacerebbe generare un DataFrame in cui una colonna è tutte le stringhe univoche e la seconda è il numero di occorrenze. In questo momento sto facendo qualcosa comeUn modo migliore per contare il numero di occorrenze di oggetti unici?
using DataFrames
df = DataFrame()
df[:B]=[ "a", "c", "c", "D", "E"]
uniqueB = unique(df[:B])
println(uniqueB)
howMany=zeros(size(uniqueB))
for i=1:size(uniqueB,1)
howMany[i] = count(j->(j==uniqueB[i]), df[:B])
end
answer = DataFrame()
answer[:Letters] = uniqueB
answer[:howMany] = howMany
answer
ma sembra che ci dovrebbe essere un modo molto più semplice per fare questo, possibilmente con una singola linea. (So che potrei renderlo un po 'più veloce con un po' più codice cercando il risultato in ogni iterazione piuttosto che nella sorgente.) Una domanda probabilmente correlata è here ma non sembra che hist sia sovraccaricato per i bin non numerici. qualche idea?