para lector huellas huella funciona como celular app algoritmo classification categorization fingerprinting

classification - lector - ¿Cómo funciona la huella digital de la música(para sitios como Shazam y Lala.com)?



lector de huella digital para celular (4)

Mi gran colección de música (120 gb) contiene muchas canciones duplicadas, y he estado tratando de detectar huellas dactilares con la esperanza de detectar duplicados. ¿Y ya que soy un comandante de CS tengo mucha curiosidad por lo que se hace allí? Nada de lo que hago tiene casi la precisión de algo como Shazam o Lala.com. ¿Cómo "hash" pistas? He ejecutado un hash MD5 estándar en todos mis archivos (26,000 archivos) y encontré cientos de hashes iguales en diferentes pistas, por lo que no funciona.

Estoy más interesado en Lala.com ya que trabajan con archivos completos, a diferencia de Shazam, pero supongo que ambos usan una técnica similar. ¿Alguien puede explicar cómo generar identificadores únicos para la música?



Eche un vistazo a la página de huellas dactilares acústicas en Wikipedia. Tiene referencias para algunos documentos, así como enlaces a implementaciones (incluido el código fuente abierto fdmf ).


El artículo seminal sobre huellas digitales de audio es el trabajo de Haitsma y Kalker en 2002-03. Para cada cuadro de audio, preprocesa (diferencias entre los marcos de tiempo y las bandas de frecuencia) y luego almacena una versión binarizada del espectro del cuadro.

Este procedimiento añade robustez. Si la señal completa se desplaza en el tiempo, todavía funciona (al menos, uno puede derivar un límite inferior en la degradación del rendimiento). Es bastante robusto al ruido ambiental. Desde su inicio, ha habido muchos artículos sobre la similitud de la música de bajo nivel, por lo que no hay una respuesta única.

¿Tiene archivos absolutamente idénticos, es decir, las señales están alineadas en el tiempo, la profundidad de bits es la misma, la tasa de muestreo es la misma? Entonces pensaría que un hash como MD5 debería funcionar. Pero si alguno de esos parámetros se cambia, también lo harán los hashes. En tal caso, un procedimiento como el que se mencionó anteriormente funcionaría mejor.

Eche un vistazo a los procedimientos de ISMIR disponibles gratuitamente en línea. Cosas divertidas. http://www.ismir.net/


Hay muchos algoritmos para la toma de huellas acústicas. Algunos de los más populares son:

  1. AMG LASSO
  2. AudioID
  3. LibFooID

De hecho, libfooId es un código abierto, ¡así que puedes revisar su código en google-code!