法律状态公告日
法律状态信息
法律状态
2022-08-26
实质审查的生效 IPC(主分类):H04R 3/00 专利申请号:2022104924747 申请日:20220429
实质审查的生效
2022-08-09
公开
发明专利申请公布
技术领域
本发明涉及信号处理领域,更进一步涉及一种基于非线性动力系统的音频恢复方法及视频麦克风系统。
背景技术
传统麦克风的工作原理是将内部膜片的运动转换为电信号。隔膜被设计为容易移动与声压,以便将其运动记录和解释为音频。随着近年来科学进步的发展,人们对数据的处理更加复杂,对技术的要求也需要提高。突破传统方式进行声音恢复成为一项研究内容。20世纪70年代开始,用激光干涉实现声音恢复成为可能。1977年,GSmeets提出将激光光束照到被声音作用的物体上,被物体反射并返回到接收器,通过干涉检测来回光路的细微差别,可以由干涉仪将这些变化转化为强度的变化,并最后转换成音频信号。在随后到现在的时间里,RP Muscatell、JT Veligdan、GWilliamson等都在此基础上进行了通过激光对声音进行恢复的研究,并提出了这种技术在军事和安全部门应用于监听等领域的可能性。20世纪80年代,随着光纤通讯的成功,利用光纤实现声音的恢复也随之成为可能。1991年,DGarthe介绍了通过光纤对声音进行恢复的方法,主要是利用声波对光纤中的相位进行调制,根据反射光的相位变化,实现声音信号到光信号的转换,再经过信号处理还原成声音信号。光纤麦克风主要分为强度型和干涉型,具有优秀的抗电磁干扰性能、高灵敏度、设计简单和体积小以及高可靠性等优点,因此在航空和水下等恶劣环境的作业、医疗和军事等方面都有着不可或缺的应用。20世纪10年代,ZWang等人使用了一种简单快速的光学方法证明音频信息可以从高速相机拍摄的视频中提取。2014年,ADavis等人首次提出了“视频麦克风”的概念,就是通过对高速视频的处理提取出声音的振动信息从而实现对声音的恢复,运用方向可控的图像金字塔,将高速视频的每一帧图像进行分解,分别提取幅值和相位信息,最后进行求和,可以将声音信息提取并放大和还原出来,实现了高速摄像机拍摄对声音恢复。
目前已经有公司将通过光学方法对声音进行恢复的技术用于实际的应用,成功研制出达到实用标准的光学麦克风。以色列科学家莫蒂·塞格夫和他的团队研制出一种光学麦克风,它可以检测出人说话时声带的振动信息,将其和背景噪声分离并转化为电信号传递,人们就可以不受干扰地清楚听到电话里对面的声音消除了电话中的噪音。奥地利公司XARION公司开发并制造了一款基于激光器的光学麦克风,可以完成空气或水中的超声波测量,拥有非常平坦的频率响应,响应范围从5Hz的次声到25MHz范围的超声,其应用领域包括激光焊接、工业控制和医疗诊断等。但是现在产品整体还存在成本过高、尺寸过大等问题,需要进行进一步的改进才能进行批量生产和进入消费应用市场。
最基本类型的激光麦克风记录了反射激光器的相位,这使物体的距离调制为激光器的波长。激光多普勒振动计(LDV)通过测量反射激光器的多普勒频移来确定反射表面的速度,解决了相位包裹的模糊性。这两种类型的激光麦克风都可以恢复高质量的音频,但依赖于激光和接收器相对于具有适当反射率的表面的精确定位。2009年扎列耶夫斯基等人通过使用一个失焦的高速相机来记录反射激光的散斑模式的变化,解决了其中的一些限制。他们的工作使接收机的定位具有更大的灵活性,但仍然依赖于记录反射激光。
发明内容
根据上述提出的现有音频恢复方法应用限制过多且产品尺寸过大等技术问题,而提供一种基于非线性动力系统的音频恢复方法及视频麦克风系统。本发明可以通过房间外放置的高帧率摄像机拍摄的房间内物体的无声视频内容对房间中的声音进行还原,这在安防、监听等领域拥有着实际意义。
本发明采用的技术手段如下:
一种基于非线性动力系统的音频恢复方法,包括:
S1、获取物体与周围声源共振的高帧率视频,所述高帧率视频的频率范围为2kHz-20kHz,且用于记录物体基于共振产生的震动;
S2、基于所述高帧率视频获取单帧图像,将每幅单帧图像与二维对数交织辅助函数进行像素坐标和图像亮度的非线性交织映射,生成交织映射矩阵;
S3、将每幅单帧图像对应的交织映射矩阵降维转化为一维信息;
S4、对所述一维信息进行滤波去噪以恢复音频。
进一步地,S2中将每幅单帧图像与二维对数交织辅助函数进行像素坐标和图像亮度的非线性交织映射,生成单帧图像交织映射矩阵,包括:
机译: 基于视频信号的视频显示和基于音频信号的音频输出,包括视频/音频信号输入/输出设备和视频/音频再现设备的视频/音频设备网络以及信号再现方法
机译: 非线性动力系统及非线性动力系统的设计方法
机译: 记录介质分别具有视频索引信息和音频,视频音频和视频检索系统的管理方法和信息恢复。