2015-11-23 11 views
22

Sto cercando di definire il mio RNNCell (Echo State Network) a Tensorflow, secondo la definizione di seguito.Come posso implementare un RNN personalizzato (in particolare un ESN) in Tensorflow?

x (t + 1) = tanh (Win * u (t) + W x * (t) + WFB * y (t))

y (t) = Wout * z (t)

z (t) = [x (t), u (t)]

x è stato, u è ingresso, y è l'uscita. Win, W e Wfb non sono addestrabili. Tutti i pesi vengono inizializzati in modo casuale, ma W viene modificata in questo modo: ". Impostare una certa percentuale di elementi di W a 0, scala W per mantenere il suo raggio spettrale di sotto di 1,0

Ho questo codice per generare l'equazione

x = tf.Variable(tf.reshape(tf.zeros([N]), [-1, N]), trainable=False, name="state_vector") 
W = tf.Variable(tf.random_normal([N, N], 0.0, 0.05), trainable=False) 
# TODO: setup W according to the ESN paper 
W_x = tf.matmul(x, W) 

u = tf.placeholder("float", [None, K], name="input_vector") 
W_in = tf.Variable(tf.random_normal([K, N], 0.0, 0.05), trainable=False) 
W_in_u = tf.matmul(u, W_in) 

z = tf.concat(1, [x, u]) 
W_out = tf.Variable(tf.random_normal([K + N, L], 0.0, 0.05)) 
y = tf.matmul(z, W_out) 
W_fb = tf.Variable(tf.random_normal([L, N], 0.0, 0.05), trainable=False) 
W_fb_y = tf.matmul(y, W_fb) 

x_next = tf.tanh(W_in_u + W_x + W_fb_y) 

y_ = tf.placeholder("float", [None, L], name="train_output") 

il mio problema è duplice. in primo luogo non so come implementare questo come una superclasse di RNNCell. in secondo luogo io non so come generare un tensore W in base alle specifiche di cui sopra.

Qualsiasi aiuto su ognuna di queste domande è molto apprezzato, forse riesco a trovare un modo per preparare W, ma di sicuro non capisco come implementare il mio RNN come una superclasse di RNNCell.

risposta

10

Per dare un breve riassunto:

Cerca in codice sorgente tensorflow sotto python/ops/rnn_cell.py troppo vedere come sottoclasse RNNCell. In genere è così:

class MyRNNCell(RNNCell): 
    def __init__(...): 

    @property 
    def output_size(self): 
    ... 

    @property 
    def state_size(self): 
    ... 

    def __call__(self, input_, state, name=None): 
    ... your per-step iteration here ...