python - secuencial - ¿Cómo predecir la imagen de entrada usando un modelo entrenado en Keras?

keras simple model (5)

Solo estoy empezando con keras y aprendizaje automático en general.

Entrené un modelo para clasificar imágenes de 2 clases y lo model.save() utilizando model.save() . Aquí está el código que utilicé:

from keras.preprocessing.image import ImageDataGenerator from keras.models import Sequential from keras.layers import Conv2D, MaxPooling2D from keras.layers import Activation, Dropout, Flatten, Dense from keras import backend as K # dimensions of our images. img_width, img_height = 320, 240 train_data_dir = ''data/train'' validation_data_dir = ''data/validation'' nb_train_samples = 200 #total nb_validation_samples = 10 # total epochs = 6 batch_size = 10 if K.image_data_format() == ''channels_first'': input_shape = (3, img_width, img_height) else: input_shape = (img_width, img_height, 3) model = Sequential() model.add(Conv2D(32, (3, 3), input_shape=input_shape)) model.add(Activation(''relu'')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Conv2D(32, (3, 3))) model.add(Activation(''relu'')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Conv2D(64, (3, 3))) model.add(Activation(''relu'')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Flatten()) model.add(Dense(64)) model.add(Activation(''relu'')) model.add(Dropout(0.5)) model.add(Dense(1)) model.add(Activation(''sigmoid'')) model.compile(loss=''binary_crossentropy'', optimizer=''rmsprop'', metrics=[''accuracy'']) # this is the augmentation configuration we will use for training train_datagen = ImageDataGenerator( rescale=1. / 255, shear_range=0.2, zoom_range=0.2, horizontal_flip=True) # this is the augmentation configuration we will use for testing: # only rescaling test_datagen = ImageDataGenerator(rescale=1. / 255) train_generator = train_datagen.flow_from_directory( train_data_dir, target_size=(img_width, img_height), batch_size=batch_size, class_mode=''binary'') validation_generator = test_datagen.flow_from_directory( validation_data_dir, target_size=(img_width, img_height), batch_size=batch_size, class_mode=''binary'') model.fit_generator( train_generator, steps_per_epoch=nb_train_samples // batch_size, epochs=epochs, validation_data=validation_generator, validation_steps=5) model.save(''model.h5'')

Se entrenó con éxito con una precisión de 0,98 que es bastante bueno. Para cargar y probar este modelo en nuevas imágenes, utilicé el siguiente código:

from keras.models import load_model import cv2 import numpy as np model = load_model(''model.h5'') model.compile(loss=''binary_crossentropy'', optimizer=''rmsprop'', metrics=[''accuracy'']) img = cv2.imread(''test.jpg'') img = cv2.resize(img,(320,240)) img = np.reshape(img,[1,320,240,3]) classes = model.predict_classes(img) print classes

Produce:

[[0]]

¿Por qué no daría el nombre real de la clase y por qué [[0]] ?

Gracias por adelantado.

Eso es porque estás obteniendo el valor numérico asociado con la clase. Por ejemplo, si tiene dos clases de gatos y perros, Keras los asociará con valores numéricos 0 y 1. Para obtener la asignación entre sus clases y su valor numérico asociado, puede usar

>>> classes = train_generator.class_indices >>> print(classes) {''cats'': 0, ''dogs'': 1}

Ahora ya sabes el mapeo entre tus clases e índices. Así que ahora lo que puedes hacer es

if classes[0][0] == 1: prediction = ''dog'' else: prediction = ''cat''

Puede usar model.predict() para predecir la clase de una sola imagen de la siguiente manera [doc] :

# load_model_sample.py from keras.models import load_model from keras.preprocessing import image import matplotlib.pyplot as plt import numpy as np import os def load_image(img_path, show=False): img = image.load_img(img_path, target_size=(150, 150)) img_tensor = image.img_to_array(img) # (height, width, channels) img_tensor = np.expand_dims(img_tensor, axis=0) # (1, height, width, channels), add a dimension because the model expects this shape: (batch_size, height, width, channels) img_tensor /= 255. # imshow expects values in the range [0, 1] if show: plt.imshow(img_tensor[0]) plt.axis(''off'') plt.show() return img_tensor if __name__ == "__main__": # load model model = load_model("model_aug.h5") # image path img_path = ''/media/data/dogscats/test1/3867.jpg'' # dog #img_path = ''/media/data/dogscats/test1/19.jpg'' # cat # load a single image new_image = load_image(img_path) # check prediction pred = model.predict(new_image)

En este ejemplo, una imagen se carga como una matriz numpy con forma (1, height, width, channels) . Luego, lo cargamos en el modelo y predecimos su clase, devuelto como un valor real en el rango [0, 1] (clasificación binaria en este ejemplo).

Reenviando el ejemplo por @ritiek, yo también soy un principiante en ML, quizás este tipo de formato ayude a ver el nombre en lugar de solo el número de clase.

images = np.vstack([x, y]) prediction = model.predict(images) print(prediction) i = 1 for things in prediction: if(things == 0): print(''%d.It is cancer''%(i)) else: print(''%d.Not cancer''%(i)) i = i + 1

Si alguien todavía está luchando para hacer predicciones sobre imágenes, aquí está el código optimizado para cargar el modelo guardado y hacer predicciones:

# Modify ''test1.jpg'' and ''test2.jpg'' to the images you want to predict on from keras.models import load_model from keras.preprocessing import image import numpy as np # dimensions of our images img_width, img_height = 320, 240 # load the model we saved model = load_model(''model.h5'') model.compile(loss=''binary_crossentropy'', optimizer=''rmsprop'', metrics=[''accuracy'']) # predicting images img = image.load_img(''test1.jpg'', target_size=(img_width, img_height)) x = image.img_to_array(img) x = np.expand_dims(x, axis=0) images = np.vstack([x]) classes = model.predict_classes(images, batch_size=10) print classes # predicting multiple images at once img = image.load_img(''test2.jpg'', target_size=(img_width, img_height)) y = image.img_to_array(img) y = np.expand_dims(y, axis=0) # pass the list of multiple images np.vstack() images = np.vstack([x, y]) classes = model.predict_classes(images, batch_size=10) # print the classes, the images belong to print classes print classes[0] print classes[0][0]

keras predict_classes ( docs ) produce una matriz numpy de predicciones de clase. Que en su caso modelo, el índice de neurona de activación más alta de su última capa (softmax). [[0]] significa que su modelo predijo que sus datos de prueba son de clase 0. (por lo general, pasará varias imágenes y el resultado se verá como [[0], [1], [1], [0]] )

Debe convertir su etiqueta real (por ejemplo, ''cancer'', ''not cancer'' ) en codificación binaria ( 0 para "cáncer", 1 para "no cáncer") para la clasificación binaria. Luego interpretará la salida de la secuencia de [[0]] como que tiene la etiqueta de clase ''cancer''