首页> 中文学位 >面向虚拟环境的语音定位技术研究
【6h】

面向虚拟环境的语音定位技术研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1选题背景及应用需求

1.2语音定位方法综述

1.3国内外研究现状

1.4本文的主要工作及论文结构

第二章语音定位麦克风阵列布局研究

2.1引言

2.2语音定位的远场和近场模型

2.2.1远场模型

2.2.2近场模型

2.3麦克风布点研究

2.3.3均匀直线阵列

2.3.4均匀圆形阵列

2.3.5四元方形阵列

第三章起始点检测研究

3.1引言

3.2语音短时处理

3.3起始点检测方法研究

3.3.1短时能量分析

3.3.2短时平均过零率

3.3.3基音周期

3.3.4谱熵算法

3.3.5倒谱系数

3.4语音特征值综合法

第四章时延估计算法研究

4.1时延估计算法简介

4.2最小均方自适应滤波法

4.3广义互相关函数法

4.4相位谱法

4.5时延估计法对比实验

4.5.1谱抵消法减噪

4.5.2时延实验

第五章语音定位系统设计

5.1系统总体设计

5.2系统抗干扰处理

5.3系统实验

第六章语音在虚拟交互中的应用

6.1语音识别和语音合成的应用

6.2精密云台控制及精度标定

6.3语音交互实验

第七章结束语

致谢

参考文献

研究声阶段发表的论文

展开▼

摘要

虚拟现实中的定位技术是人机交互方式研究中的一个重要方向,目前的定位技术(如利用电磁、超生波或光电等技术)需要用户配戴传感器或色标,影响了用户对虚拟环境的真实感及沉浸感的要求。语音定位技术能有效摆脱安装在人体身上的各种传感器或接收器,并且结合语音识别和合成技术,可以实现用户与虚拟环境的多种交互方式,进一步增强了用户的沉浸感及真实感。因此,研究语音定位技术在虚拟现实人机交互中的应用具有重要的理论意义和工程应用价值。论文的主要工作包括: (1)分析了语音定位的远场和近场模型,研究了麦克风阵列的布点方式,对均匀直线阵列、均匀圆形阵列和四方形阵列进行了对比研究,确定了四方形阵列的布阵方式。 (2)研究了语音信号起始点检测的方法。对短时能量法、短时平均过零率、基音周期、熵谱算法、倒谱系数等检测方法进行了对比研究,提出了语音特征值综合法,实验证明了该方法的效果比单一特征值要好。 (3)通过对最小均方自适应滤波法、广义互相关函数法、相位谱法对比研究,确定了相位谱法作为时延估计算法。 (4)设计了语音定位的原型系统,试验验证了上述方法并取得了较好的效果。 (5)结合语音识别和语音合成技术,把语音应用到了虚拟现实的人机交互中,增强了用户的沉浸感及真实感。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号