machine-learning - tutorial - redes neuronales convolucionales libro
¿Cómo entrenar una red neuronal con diferentes tamaños de entrada? (1)
Quiero entrenar mi red neuronal con diferentes sonidos. Sin embargo, el tamaño de cada sonido es diferente. ¿Alguien sabe cómo entrenar una red neuronal con diferentes tamaños de entrada? Gracias.
No hay forma de clasificar entradas de diferentes tamaños, pero puede transformar su señal en una secuencia de vectores de características de tamaño fijo (o en una secuencia de fragmentos de tamaño fijo del sonido original). Para un sonido usualmente empleamos MFCC o simplemente un espectrograma. Por lo tanto, debe aplicar métodos que operen en secuencias. Puede ser una red neuronal recurrente, o puede emplear una red de feed-forward y luego procesar sus resultados para cada frame de alguna manera.