李伟
教授
个人信息Personal Information
电子邮箱:weili-fudan@fudan.edu.cn
学位:博士学位
职称:教授
学科:计算机应用技术
扫描关注
教师博客
当前位置 Welcome to Wei LI... >> 教师博客2011-6-20 数字音频指纹技术简介
发布时间:2021-04-30 点击次数:
音频压缩技术的进步以及大容量存储器的出现使得互联网上出现了以音乐为主的海量音频信息, 手工选取某首歌曲很多时候已经变得不可能, 这直接促使产生了可以进行音乐自动识别的数字音频指纹技术. 音频指纹是指可以代表一段音乐重要声学特征的基于内容的紧致数字签名, 其主要目的是建立一种有效机制来比较两个音频数据的感知听觉质量. 注意这里不是直接比较通常很大的音频数据本身, 而是比较其相应通常较小的数字指纹.大量音频数据的指纹和其相应的元数据比如歌曲名称、词曲作者、歌词等内容一起存储在一个数据库中, 并采用指纹作为相应元数据的索引[1 ]. 一个音频指纹系统通常包括两个部分: 即一个计算听觉重要特征的指纹提取算法和一个在指纹数据库中进行有效搜索的比对算法. 当要识别一段未知音频时, 首先按照指纹提取算法计算其音频特征, 然后和数据库中存储的大量音频指纹相比对从而进行识别. 一个有效的指纹提取算法和指纹比对算法能够在数据库中正确识别出可能经受各种信号处理失真的未知音频的原始版本. 若识别到对应的原始指纹, 则可提取出相应的元数据信息返回给用户. 使用音频指纹而不是音频数据本身进行检索具有以下三方面好处:因为指纹数据量相对比较小, 可以大大减少对硬盘及内存的存储要求.· 指纹来源于音频数据听觉最重要的部分, 因此在经受信号失真时仍能进行有效比对.· 指纹数据库与媒体数据库相比尺寸减小很多, 可以进行更高效的搜索.