音乐指纹如何工作(对于Shazam和Lala.com等网站)?

我的大(120gb)音乐收藏包含许多重复的歌曲,我一直在尝试指纹轨迹,希望能够检测到重复的歌曲。而且,由于我是CS专业,我很好奇那里做了什么?我没有任何事情几乎有像Shazam或Lala.com这样的准确性。他们如何“哈希”轨道?我已经在所有文件(26,000个文件)上运行了一个标准的MD5哈希,并且我发现不同轨道上有数百个相等的哈希值,因此不起作用。

我对Lala.com更感兴趣,因为他们使用完整的文件,不像Shazam,但我假设都使用类似的技术。任何人都可以解释如何为音乐生成唯一的标识符?

关于音频指纹识别的开创性论文是Haitsma和Kalker在2002-03年度的作品。对于每个音频帧,它预处理(跨时间帧和频带的差异),然后存储帧的频谱的二值化版本。

此过程增加了鲁棒性。如果整个信号在时间上移动,它仍然有效(至少可以导出性能下降的下限)。它对环境噪声非常强大。自成立以来,已经有很多关于低级音乐相似性的论文,所以没有一个单一的答案。

你有绝对相同的文件,即信号是时间对齐的,位深度是一样的,采样率是一样的吗?那么我会认为一个哈希像MD5应该工作。但是如果这些参数中有任何一个参数发生变化,那么这些参数也会改变在这种情况下,如前所述的程序会更好地工作。

请查看可免费在线的ISMIR诉讼。好玩的东西。 http://www.ismir.net/

http://stackoverflow.com/questions/2046771/how-does-music-fingerprinting-work-for-sites-such-as-shazam-and-lala-com

本站文章除注明转载外,均为本站原创或编译
转载请明显位置注明出处:音乐指纹如何工作(对于Shazam和Lala.com等网站)?