2016-02-15 5 views
7

Il codice è qui sotto:Come posso vettorizzare questo per ciclo in numpy?

import numpy as np 
X = np.array(range(15)).reshape(5,3) # X's element value is meaningless 
flag = np.random.randn(5,4) 
y = np.array([0, 1, 2, 3, 0]) # Y's element value in range(flag.shape[1]) and Y.shape[0] equals X.shape[0] 
dW = np.zeros((3, 4)) # dW.shape equals (X.shape[1], flag.shape[1]) 
for i in xrange(5): 
    for j in xrange(4): 
     if flag[i,j] > 0: 
      dW[:,j] += X[i,:].T 
      dW[:,y[i]] -= X[i,:].T 

Per calcolare dW in modo più efficiente, come vettorizzare questo ciclo for?

risposta

5

Ecco come lo farei:

# has shape (x.shape[1],) + flag.shape 
masked = np.where(flag > 0, X.T[...,np.newaxis], 0) 

# sum over the i index 
dW = masked.sum(axis=1) 

# sum over the j index 
np.subtract.at(dW, np.s_[:,y], masked.sum(axis=2)) 

# dW[:,y] -= masked.sum(axis=2) does not work here 

Vedi la documentazione di ufunc.at per una spiegazione di quel ultimo commento

+1

Con valori di ripetizione del 'y' index,' - = 'può avere problemi di buffering. È qui che il 'ufunc'' .at' può aiutare. – hpaulj

+0

@hpaulj Capito, grazie – Eric

+0

Quindi la prima riga 'masked = np.where (flag> 0, X.T [..., np.newaxis], 0)' usa la trasmissione, geniale! Quindi, un modo per la vettorizzazione è aumentare la dimensione? –

-1

Si può fare questo:

ff = (flag > 0) * 1 
ff = ff.reshape((5, 4, 1, 1)) 
XX = ff * X 
[ii, jj] = np.meshgrid(np.arange(5), np.arange(4)) 
dW[:, jj] += XX[ii, jj, ii, :].transpose((2, 0, 1)) 
dW[:, y[ii]] -= XX[ii, jj, ii, :].transpose((2, 0, 1)) 

Si può ulteriormente unire e piegare queste espressioni per ottenere un one-liner ma non aggiungerà altre prestazioni.

Update # 1: Sì, mi dispiace questo non sta dando risultati corretti, ho avuto un errore di battitura nel mio check

+0

Poiché X è sempre indicizzato solo a '[x, y, x, z]', non può essere reso tridimensionale? – Eric

+0

Penso che le tue prime tre righe siano meglio digitate 'XX = np.where (flag [..., np.newaxis, np.newaxis], X, 0)' – Eric

+0

Questo non mi dà il risultato giusto – Eric

1

Ecco un approccio vectorized basata su np.add.reduceat -

# --------------------- Setup output array ---------------------------------- 
dWOut = np.zeros((X.shape[1], flag.shape[1])) 

# ------ STAGE #1 : Vectorize calculations for "dW[:,j] += X[i,:].T" -------- 
# Get indices where flag's transposed version has > 0 
idx1 = np.argwhere(flag.T > 0) 

# Row-extended version of X using idx1's col2 that corresponds to i-iterator 
X_ext1 = X[idx1[:,1]] 

# Get the indices at which we need to columns change 
shift_idx1 = np.append(0,np.where(np.diff(idx1[:,0])>0)[0]+1) 

# Use the changing indices as boundaries for add.reduceat to add 
# groups of rows from extended version of X 
dWOut[:,np.unique(idx1[:,0])] += np.add.reduceat(X_ext1,shift_idx1,axis=0).T 

# ------ STAGE #2 : Vectorize calculations for "dW[:,y[i]] -= X[i,:].T" ------- 
# Repeat same philsophy for this second stage, except we need to index into y. 
# So, that would involve sorting and also the iterator involved is just "i". 
idx2 = idx1[idx1[:,1].argsort()] 
cols_idx1 = y[idx2[:,1]] 
X_ext2 = X[idx2[:,1]] 
sort_idx = (y[idx2[:,1]]).argsort() 
X_ext2 = X_ext2[sort_idx] 
shift_idx2 = np.append(0,np.where(np.diff(cols_idx1[sort_idx])>0)[0]+1) 
dWOut[:,np.unique(cols_idx1)] -= np.add.reduceat(X_ext2,shift_idx2,axis=0).T 
+0

Grazie. Nonostante abbia linee di codice, è più facile da capire. –