2015-12-08 4 views
8

Sto cercando di utilizzare la funzionalità di abbandono in tensorflow:Errore utilizzando dropout in tensorflow

sess=tf.InteractiveSession() 
initial = tf.truncated_normal([1,4], stddev=0.1) 
x = tf.Variable(initial) 
keep_prob = tf.placeholder("float") 
dx = tf.nn.dropout(x, keep_prob) 
sess.run(tf.initialize_all_variables()) 
sess.run(dx, feed_dict={keep_prob: 0.5}) 
sess.close() 

Questo esempio è molto simile a come si fa a the tutorial; tuttavia, io alla fine con il seguente errore:

RuntimeError: min: Conversion function <function constant at 0x7efcc6e1ec80> for type <type 'object'> returned incompatible dtype: requested = float32_ref, actual = float32 

ho qualche difficoltà a comprendere il DTYPE float32_ref, che sembra essere lo sfondo del problema. Ho anche provato a specificare dtype=tf.float32, ma ciò non risolve nulla.

Ho provato anche questo esempio, che funziona bene con float32:

sess=tf.Session() 
x=tf.Variable(np.array([1.0,2.0,3.0,4.0])) 
sess.run(x.initializer) 
x=tf.cast(x,tf.float32) 
prob=tf.Variable(np.array([0.5])) 
sess.run(prob.initializer) 
prob=tf.cast(prob,tf.float32) 
dx=tf.nn.dropout(x,prob) 
sess.run(dx) 
sess.close() 

Tuttavia, se io scaccio float64 invece di float32 ottengo lo stesso errore:

RuntimeError: min: Conversion function <function constant at 0x7efcc6e1ec80> for type <type 'object'> returned incompatible dtype: requested = float64_ref, actual = float64 

Edit:

Sembra che questo problema si presenti solo quando si utilizza il dropout direttamente su Variabile s, lavora per i segnaposto e per i prodotti di variabili e segnaposto, Esempio:

sess=tf.InteractiveSession() 
x = tf.placeholder(tf.float64) 

sess=tf.InteractiveSession() 
initial = tf.truncated_normal([1,5], stddev=0.1,dtype=tf.float64) 
y = tf.Variable(initial) 

keep_prob = tf.placeholder(tf.float64) 
dx = tf.nn.dropout(x*y, keep_prob) 
sess.run(tf.initialize_all_variables()) 
sess.run(dx, feed_dict={x : np.array([1.0, 2.0, 3.0, 4.0, 5.0]),keep_prob: 0.5}) 
sess.close() 

risposta

7

Questo è un bug nell'implementazione di tf.nn.dropout che è stato fissato in un recente impegnarsi, e saranno inclusi nella prossima release di tensorflow. Per ora, per evitare il problema, o build TensorFlow from source, o modificare il programma come segue:

#dx = tf.nn.dropout(x, keep_prob) 
dx = tf.nn.dropout(tf.identity(x), keep_prob)