Esistono molte registrazioni sull'affinamento del livello [0] di un multiindice di un intervallo di livello 1. Tuttavia, non riesco a trovare una soluzione per il mio problema; cioè, ho bisogno di un intervallo del livello 1 indice per i valori dell'indice del livello [0]I panda di Python dividono il multiindice per l'indice di secondo livello (o qualsiasi altro livello)
dataframe: il primo è dalla A alla Z, il grado è da 1 a 400; Ho bisogno dei primi 2 e degli ultimi 2 per ogni livello [0] (Primo), ma non nello stesso passo.
Title Score
First Rank
A 1 foo 100
2 bar 90
3 lime 80
4 lame 70
B 1 foo 400
2 lime 300
3 lame 200
4 dime 100
io sto cercando di ottenere le ultime 2 righe per ogni indice di livello 1 con il codice qui sotto, ma fette correttamente solo per il primo [0] valore di livello.
[IN] df.ix[x.index.levels[1][-2]:]
[OUT]
Title Score
First Rank
A 3 lime 80
4 lame 70
B 1 foo 400
2 lime 300
3 lame 200
4 dime 100
Le prime 2 file ottengo scambiando gli indici, ma non riesco a farlo funzionare per le ultime 2 righe.
df.index = df.index.swaplevel("Rank", "First")
df= df.sortlevel() #to sort by Rank
df.ix[1:2] #Produces the first 2 ranks with 2 level[1] (First) each.
Title Score
Rank First
1 A foo 100
B foo 400
2 A bar 90
B lime 300
Certo che posso scambiare questo torna a ottenere questo:
df2 = df.ix[1:2]
df2.index = ttt.index.swaplevel("First","rank") #change the order of the indices back.
df2.sortlevel()
Title Score
First Rank
A 1 foo 100
2 bar 90
B 1 foo 400
2 lime 300
Ogni aiuto è apprezzato per ottenere la stessa procedura:
- Ultimi 2 file per l'indice 1 (Grado
- E un modo migliore per ottenere le prime 2 righe
Edit seguente feedback @ako:
Utilizzando pd.IndexSlice
rende veramente facile da tagliare qualsiasi indice di livello. Ecco una soluzione più generica e sotto il mio approccio passo-passo per ottenere la prima e l'ultima di due righe. Maggiori informazioni qui: http://pandas.pydata.org/pandas-docs/stable/advanced.html#using-slicers
"""
Slicing a dataframe at the level[2] index of the
major axis (row) for specific and at the level[1] index for columns.
"""
df.loc[idx[:,:,['some label','another label']],idx[:,'yet another label']]
"""
Thanks to @ako below is my solution, including how I
get the top and last 2 rows.
"""
idx = pd.IndexSlice
# Top 2
df.loc[idx[:,[1,2],:] #[1,2] is NOT a row index, it is the rank label.
# Last 2
max = len(df.index.levels[df.index.names.index("rank")]) # unique rank labels
last2=[x for x in range(max-2,max)]
df.loc[idx[:,last2],:] #for last 2 - assuming all level[0] have the same lengths.
Con le risposte intorno StackOverflow per l'indicizzazione MultiIndex Pandas, questa soluzione sembra sia il più pulito e piuttosto sottovalutato. –