Ho un set di timestamp e URI UNIX e sto cercando di tracciare il conteggio cumulativo delle richieste per ciascun URI. Sono riuscito a farlo per un URI alla volta utilizzando una colonna fittizia:ggplot2 e cumsum()
x.df$count <- apply(x.df,1,function(row) 1) # Create a dummy column for cumsum
x.df <- x.df[order(x.df$time, decreasing=FALSE),] # Sort
ggplot(x.df, aes(x=time, y=cumsum(count))) + geom_line()
tuttavia, che renderebbe circa 30 piazzole nel mio caso.
ggplot2 fa permettono di tracciare linee multiple in un unico plot (ho copiato questo pezzo di codice da here):
ggplot(data=test_data_long, aes(x=date, y=value, colour=variable)) +
geom_line()
Il problema è che, in questo modo, cumsum()
conterebbe avanti e avanti.
Qualcuno ha un'idea?
Potete fornire una serie di dati piccolo esempio che illustra cosa stai descrivendo? – joran
sembra un lavoro per 'plyr' o' data.table'. Dividi i dati in base all'URI e poi alla tua "cumsum" su ogni pezzo. 'Data.table (x); x [, lista (count = .I), per = URI] 'O qualcosa del genere ... – Justin