心理声学模型
心理声学模型的相关文献在1996年到2022年内共计121篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、一般工业技术
等领域,其中期刊论文91篇、会议论文12篇、专利文献158203篇;相关期刊59种,包括电声技术、电子学报、电子技术应用等;
相关会议12种,包括2013电声技术国际研讨会(2013 International Symposium on ElectroAcoustic Technologies)(ISEA2013)、2011年亚太信息网络与数字内容安全会议(APCID2011)、第九届全国信息隐藏暨多媒体信息安全学术大会CIHW2010等;心理声学模型的相关文献由251位作者贡献,包括郭泽华、陈亮、何冬梅等。
心理声学模型—发文量
专利文献>
论文:158203篇
占比:99.93%
总计:158306篇
心理声学模型
-研究学者
- 郭泽华
- 陈亮
- 何冬梅
- 张雄伟
- 李云剑
- 郭立
- 高文
- 夏雨
- 张勇
- 张毓忠
- 张鸿宾
- 朱丽
- 王慧琴
- 窦维蓓
- 马鸿飞
- 侯兆荣
- 全笑梅
- 刘晋
- 刘轶
- 吴晟
- 周静雷
- 孙锐
- 尹俊勋
- 张军
- 张德运
- 张永斌
- 张秋余
- 张雪英
- 文瀚吉
- 方伟伟
- 朱晓明
- 李健炯
- 李撤雨
- 李晓明
- 李男淑
- 李鸿燕
- 杨刚
- 杨杰
- 武奕峰
- 毛峡
- 湛金童
- 潘兴德
- 焦玮
- 熊惟楚
- 王旖旎
- 王菲
- 董在望
- 蔡超时
- 许丽净
- 贾海蓉
-
-
-
邸娜;
王旖旎
-
-
摘要:
数字音频水印技术在居室电视互动应用场景中由用户发起交互请求,用户可通过对声音中水印的识别主动和在播节目建立桥接.数字音频水印的互动应用改变了传统广播电视的单向传输模式,目前正在全国各主流电视台内落地应用.本文首先介绍数字音频水印技术的基本原理,之后介绍用户在进行电视互动时客厅声场条件对音频水印的影响及其检测算法,最后介绍我院开发的数字音频水印技术的音质评价和鲁棒性测试结果,以证明该技术的可实施性.
-
-
陈亮
-
-
摘要:
音频数字水印技术在数字音频作品版权保护中的地位越来越重要,是解决数字音频作品版权问题的有效手段.提出了一种基于心理声学模型的数字水印算法,能够保证好的音频信号质量,具体实现在小波变换域中.把音频信号的小波系数嵌入到音频水印的小波低频系数中,将音频中的水印信息抽取出来,从而确认数字音频产品真正的所有权.
-
-
张涛;
张彩霞;
高新意;
赵鑫
-
-
摘要:
An adaptive audio watermarking algorithm in the hybrid domain is proposed,the scheme jointly exploiting the discrete wavelet packet transform (DWPT) and psychoacoustic model to perform large-capacity audio watermarking without introducing perceptible distortion.Firstly,each audio frame was decomposed into 26 sub-band signals by DWPT,then we apply DCT to wavelet packet coefficients of each sub-band and calculate the masking threshold.The masking threshold of each sub-band was used to seek suitable segments and positions for watermark embedding.According to the embedding strength obtained from psychoacoustic model,the algorithm adaptively control the audibility of introduced distortion for embedding the watermark.The binary image watermark was embedded into the block middle-frequency and low-frequency DCT coefficients according to quantization index modulation,the extraction was executed blindly.Experimental results show that the proposed algorithm achieves a good trade-off between robustness,imperceptibility and payload,the watermark capacity range from 576.7 bps to 689.5 bps,and the hidden watermark data is robust to additive noise,re-quantization,re-sampling,low-pass filtering,and MP3 compression.%本文结合小波包变换和心理声学模型,提出了一种自适应的混合域音频盲水印算法,在不引入明显听觉失真的前提下,实现了大容量的水印嵌入.算法首先采用小波包变换将分段音频信号分解到26个子带中,然后对每个子带的小波包系数进行离散余弦变换,计算出子带掩蔽阈值.根据子带掩蔽阈值自适应的选取水印嵌入段和水印嵌入位置,同时根据掩蔽阈值计算出的水印嵌入强度自适应地控制由水印嵌入引起的听觉偏倚.二值水印图像通过量化索引调制的方法嵌入到音频信号的中低频系数中,提取水印时不需要原始音频载体.实验结果表明本算法在水印容量、不可感知性和鲁棒性之间达到了很好的平衡,水印容量在576.7 bps到689.5 bps之间,算法对添加噪声、重新量化、重新采样、低通滤波和MP3压缩均具有很好的鲁棒性.
-
-
-
杨杰
-
-
摘要:
数字音频是高清晰度电视(HDTV)中非常重要的一环.在数字音频编解码中,心理声学模型的引入,大大降低了编解码的复杂度.对心理声学模型的基本原理及各心理声学模型在HDTV音频中的应用及其算法的详细阐述,有助于我们明确HDTV音频中心理声学模型的发展方向.
-
-
强策;
夏凌;
卿朝进;
童新
-
-
摘要:
When reconstructing speech based on compressed sensing,the sparsity of speech signal is an important factor to reconstruct speech′s quality.In order to increase the signal′s sparsity, the paper adds psychoacoustic model to speech compressed sensing,using the absolute threshold of hearing in this model.The threshold of hearing can filter out some inaudible and unwanted sig-nals,reducing the number of nonzero,increasing the signal′s sparsit,improving the quality of re-constructed speech.The experiments′results showed that the absolute threshold of hearing add-ed to the traditional speech compressed sensing,achieved better effect in speech reconstruction, and improved the performance of CS of voice signal.The number of observations are significantly reduced,so that it can greatly reduce the running time during the high compression ratio of CS .It has a great advantage in front of big data which has high quality requirements to be compresssd and reconstructed.%在基于压缩感知进行语音压缩重构时,语音信号的稀疏性是决定重构语音质量好坏的重要因素。为了增加信号稀疏度,文中加入心理声学模型中的绝对听阈,把一些人耳听不见、无用的信号过滤掉,减少信号非零值,以期达到提高重构语音质量的目的。实验表明,将绝对听阈加入到传统的语音信号压缩感知后,语音重构取得了明显效果,语音信号的 CS 性能得到改善,观测次数减少。当进行高压缩比压缩感知时,运行时间大幅度降低,这在大规模数据需要高质量压缩重构时具有很大优势。
-
-
董宁
-
-
摘要:
针对语音信息中存在着大量的冗余这一问题,采用对MP3编码器算法的几个关键模块包括心里声学模型和量化模块进行了改进与优化,由于最初版本的MP3中的心理声学模型,不仅运算复杂度高,而且模型粗糙,由其计算得到的掩蔽阈值曲线和SMR,都不够精确.因此我们通过对MP3编码器算法的改进与优化后,不仅使MP3编码器算法具有了良好的编码质量,同时又大幅度降低了运算的复杂度,从而减少了对硬件的要求,降低了系统的成本、功耗、和体积,达到了预定的设计要求.
-
-
李云红;
李小英;
周静雷;
潘杨
-
-
摘要:
传统的扬声器异常音检测方法(纯音检测)受主观因素影响会出现漏检、误判等状况,针对虚拟仪器的异常音检测技术效率低、精度低、成本高等问题,提出一种基于掩蔽效应的扬声器异常音检测方法,将异常音功率谱和掩蔽阈值比较,提取掩蔽阈值曲线以上的可闻异常音,再用相关系数进行算法有效性验证,结果表明,(0.0,0.7]参数区间的凯撒窗使激励和噪音的相关系数分别达到0.992 6和0.992 1,可实现扬声器异常音高效、高精度、易操作的检测要求.
-
-
黄寅;
赵长青;
程伟;
王旖旎;
吴小茜;
陆群
-
-
摘要:
数字水印技术作为一种信息隐藏技术已被广泛应用于广播电视和互联网流媒体中.基于该技术的音频广播监测系统可以很好地解决版权保护、错播、非法插播和干扰等问题,提高音频广播的监测效率,解决了依赖于人工监听的传统方法,保证了广播的安全播出.因此,针对广播节目内容的有效监管需求,本文阐述了一种基于单片机、CPLD和DSP的音频水印嵌入系统实现方案.
-
-
-
-
-
李云剑;
陈亮;
张雄伟
- 《第五届全国信息隐藏学术研讨会》
| 2004年
-
摘要:
提出一种基于心理声学模型的频域音频数字水印算法.首先对音频信号分段进行离散傅立叶变换(DET),再利用心理声学模型估算各段掩蔽阈值,使水印信号嵌入DFT域低频子带区时自适应处于掩蔽阈值以下,对音频品质冲击小,含水印音频信号与原始信号感知相似.实验表明本算法具有良好的不可觉察性和稳健性.
-
-
-
- 《中国电子学会电子系统工程分会第十五届信息化理论学术研讨会》
| 2008年
-
摘要:
随着信息技术的迅猛发展及广泛应用,信息资源已成为一个国家或地区的重要战略资源,对视频和音频等数字多媒体数据的保护和秘密通信也变得越来越重要.本文在分析军事信息资源特点的基础上,通过引进信息隐藏技术和数字水印,从技术上加强军事信息资源安全.详细介绍了心理声学模型和听觉的掩蔽现象,并根据人耳听觉系统的这种现象,结合音频编码技术,在时域位置上提出了基于PCM的音频水印改进算法.
-
-
-
-
陈虎;
陈书明
- 《第十届计算机工程与工艺全国学术年会》
| 2006年
-
摘要:
本文对MPEG-2 Layer3音频压缩中的核心算法——子带滤波,MDCT和量化编码进行了算法级优化,以及针对YHFT DSP开发平台的优化,大大提高了MPEG-2 Layer3压缩程序的执行速度,实现了音频文件的高速实时压缩。
-
-
陈虎;
陈书明
- 《第十届计算机工程与工艺全国学术年会》
| 2006年
-
摘要:
本文对MPEG-2 Layer3音频压缩中的核心算法——子带滤波,MDCT和量化编码进行了算法级优化,以及针对YHFT DSP开发平台的优化,大大提高了MPEG-2 Layer3压缩程序的执行速度,实现了音频文件的高速实时压缩。