tutorial machine learning guide google engine python tensorflow google-cloud-ml

machine - tensorflow python



Tensorflow falla con "No se puede obtener el elemento del feed como bytes" cuando se intenta restaurar el punto de control (3)

Estoy usando Tensorflow r0.12.

Uso google-cloud-ml localmente para ejecutar 2 trabajos de capacitación diferentes. En el primer trabajo, encuentro buenos valores iniciales para mis variables. Los guardo en un punto de control V2.

Cuando trato de restaurar mis variables para usarlas en el segundo trabajo:

import tensorflow as tf sess = tf.Session() new_saver = tf.train.import_meta_graph(''../variables_pred/model.ckpt-10151.meta'', clear_devices=True) new_saver.restore(sess, tf.train.latest_checkpoint(''../variables_pred/'')) all_vars = tf.trainable_variables() for v in all_vars: print(v.name)

Recibí el siguiente mensaje de error:

tensorflow.python.framework.errors_impl.InternalError: Unable to get element from the feed as bytes.

El punto de control se crea con estas líneas en el primer trabajo:

saver = tf.train.Saver() saver.export_meta_graph(filename=os.path.join(output_dir, ''export.meta'')) saver.save(sess, os.path.join(output_dir, ''export''), write_meta_graph=False)

De acuerdo con esta respuesta , podría provenir de la ausencia de un archivo de metadatos, pero estoy cargando el archivo de metadatos.

PD: utilizo el argumento clear_devices=True porque las especificaciones del dispositivo generadas por un lanzamiento en google-cloud-ml son bastante intrincadas y no necesito necesariamente obtener el mismo despacho.


Creo que el problema podría ser que al guardar el modelo establezca write_meta_graph = False. Como resultado, no creo que esté realmente guardando el gráfico, por lo tanto, cuando intente restaurarlo, no habrá ningún gráfico para restaurar. Intenta configurar write_meta_graph = True


El mensaje de error se debió a la ausencia del archivo llamado "punto de control" por inadvertencia.

Después de la reintroducción de este archivo en la carpeta correspondiente, parece que la carga del punto de control está funcionando.

Perdón por haber omitido este punto clave.


El mensaje de error también se debió a los errores en el archivo llamado "punto de control" por inadvertencia.

Por ejemplo, la carpeta que contiene los modelos se ha movido, pero el valor de "model_checkpoint_path:" en "punto de control" sigue siendo una ruta antigua.