Desidero contare l'occorrenza di una stringa in una colonna di dataframe panda raggruppata.panda conteggio della stringa di conteggio del gruppo su colonna
Si supponga Ho il seguente dataframe:
catA catB scores
A X 6-4 RET
A X 6-4 6-4
A Y 6-3 RET
B Z 6-0 RET
B Z 6-1 RET
In primo luogo, voglio gruppo da catA
e catB
. E per ciascuno di questi gruppi voglio contare l'occorrenza di RET
nella colonna scores
.
Il risultato dovrebbe essere qualcosa di simile:
catA catB RET
A X 1
A Y 1
B Z 2
Il raggruppamento da due colonne è facile: grouped = df.groupby(['catA', 'catB'])
Ma che cosa è il prossimo?
questo è quindi memorizzato in modo permanente in una nuova colonna? in caso contrario, come può essere memorizzato come una nuova colonna? quello che voglio fare è che voglio solo visualizzare l'output, se il conteggio è maggiore di un certo numero. – beta
come posso cercare due stringhe diverse? così str può contenere 'RET' o' ASDF'? quindi ho bisogno di una RegEx? – beta
Usa 'x.str.contains ('RET | ASDF')' inoltre dovresti pubblicare il tuo intero requisito, aggiornare la tua domanda e mantenere la tua domanda su 1 problema per domanda invece di incrementare il tuo problema – EdChum