首页> 中国专利> 一种基于深度学习的手势识别辅助交流系统

一种基于深度学习的手势识别辅助交流系统

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明涉及交流系统领域，具体涉及一种基于深度学习的手势识别辅助交流系统，包括：胸针，内载单目视觉传感器，用于实现手势交流动作视频和交流对象语音视频数据的采集，并将采集到的手势交流动作视频和交流对象语音视频数据传输至腕带；腕带，内载智能处理终端，用于实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据经语音播放模块进行播放；还用于实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据经视频播放模块进行播放。

著录项

公开/公告号CN113158736A

专利类型发明专利
公开/公告日2021-07-23

原文格式PDF
申请/专利权人景德镇学院;
展开▼

申请/专利号CN202110079374.7
发明设计人洪耀球;
展开▼

申请日2021-01-21
分类号G06K9/00(20060101);G10L13/02(20130101);G10L15/16(20060101);G10L15/26(20060101);
代理机构61244 西安汇恩知识产权代理事务所(普通合伙);
代理人张延长
地址 333000 江西省景德镇市浮梁县浮梁大道3号景德镇学院
入库时间 2023-06-19 11:57:35

说明书

技术领域

本发明涉及交流系统领域，具体涉及一种基于深度学习的手势识别辅助交流系统。

背景技术

手语是聋哑残疾人使用的语言，是一种靠动作和视觉进行交际的特殊语言。然而让大多数正常人掌握并运用手语直接与聋哑残疾人进行交流显然是不现实的。目前聋哑人与正常人之间的沟通仅仅限于以懂手语的正常人做翻译等手段，在很大程度上限制了不懂手语的正常人对聋哑残疾人的理解，给聋哑残疾人的日常生活、学习和工作带来极大的不便。

发明内容

为解决上述问题，本发明提供了一种基于深度学习的手势识别辅助交流系统，可以实现聋哑残疾人与正常人的交流。

为实现上述目的，本发明采取的技术方案为：

一种基于深度学习的手势识别辅助交流系统，包括：

胸针，内载单目视觉传感器，用于实现手势交流动作视频和交流对象语音视频数据的采集，并将采集到的手势交流动作视频和交流对象语音视频数据传输至腕带；

腕带，内载智能处理终端，用于实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据经语音播放模块进行播放；还用于实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据经视频播放模块进行播放。

进一步地，所述胸针呈纽扣状，其上配置一用于控制单目视觉传感器启闭的按钮和一用于为胸针内载的蓄电池充电的充电口。

进一步地，所述智能处理终端内载一数据处理系统，包括：

手势交流信息识别模块，用于基于DSSD_Xception_coco模型实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据；

音频交流信息识别模块，用于基于Xception模型实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据。

进一步地，所述DSSD_Xception_coco模型采用DSSD目标检测算法，用 coco数据集预训练Xception深度神经网络，然后用先前准备好的手语图像及其对应的音频数据集训练该模型，微调深度神经网络中的各项参数，最后得到合适的用于识别手势交流动作视频内载交流信息的目标检测模型。

进一步地，所述腕带上安装有一触控屏，用于输入文字信息，TMS320DM6446 处理器接收到数字信号后经过处理将信号传输给中文语音合成芯片，中文语音合成芯片将数字转化成语音信号，再经语音播放模块进行播放。

进一步地，所述数据处理系统内载：

数据分类模块，用于基于无限深度网络模型实现手势交流动作视频和交流对象语音视频数据的分类。

进一步地，所述胸针和腕带基于蓝牙模块实现通讯。

进一步地，所述胸针支持手机蓝牙连接功能，对应的配置一手机APP系统，手机APP系统内载：

数据分类模块，用于基于无限深度网络模型实现手势交流动作视频和交流对象语音视频数据的分类；

手势交流信息识别模块，用于基于DSSD_Xception_coco模型实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据进行播放；

音频交流信息识别模块，用于基于Xception模型实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据进行播放。

本发明具有以下有益效果：

能进行手语和声音文字的双向转换，转换效率和识别程度高；使得正常人和聋哑人之间可以通过本设备进行高效无障碍的交流；特别是针对不识字的聋哑人仍然有效。

附图说明

图1为实施例一种基于深度学习的手势识别辅助交流系统的结构图。

图2为本发明一种基于深度学习的手势识别辅助交流系统的系统框图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进。这些都属于本发明的保护范围。

如图1所示，本发明实施例的一种基于深度学习的手势识别辅助交流系统，包括：

本实施例中，所述胸针呈纽扣状，其上配置一用于控制单目视觉传感器启闭的按钮和一用于为胸针内载的蓄电池充电的充电口。

本实施例中，所述智能处理终端内载一数据处理系统，包括：

手势交流信息识别模块，用于基于DSSD_Xception_coco模型实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据；

音频交流信息识别模块，用于基于Xception模型实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据。

本实施例中，所述DSSD_Xception_coco模型采用DSSD目标检测算法，用coco数据集预训练Xception深度神经网络，然后用先前准备好的手语图像及其对应的音频数据集训练该模型，微调深度神经网络中的各项参数，最后得到合适的用于识别手势交流动作视频内载交流信息的目标检测模型。

本实施例中，所述腕带上安装有一触控屏，用于输入文字信息， TMS320DM6446处理器接收到数字信号后经过处理将信号传输给中文语音合成芯片，中文语音合成芯片将数字转化成语音信号，再经语音播放模块进行播放。

本实施例中，所述数据处理系统内载：

数据分类模块，用于基于无限深度网络模型实现手势交流动作视频和交流对象语音视频数据的分类。

本实施例中，所述胸针和腕带基于蓝牙模块实现通讯。

实施例2

如图2所示，本发明实施例的一种基于深度学习的手势识别辅助交流系统，包括：

手机APP系统，用于实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据进行播放；还用于实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据进行播放；

本实施例中，所述手机APP系统内载：

数据分类模块，用于基于无限深度网络模型实现手势交流动作视频和交流对象语音视频数据的分类；

手势交流信息识别模块，用于基于DSSD_Xception_coco模型实现手势交流动作视频内载交流信息的识别，并将识别的交流信息转换成音频数据进行播放；

音频交流信息识别模块，用于基于Xception模型实现交流对象音频视频数据内载交流信息的识别，并将识别到的交流信息转换成手语数据进行播放；

文本转换模块，用于基于预设的模型将录入的文本数据转换成音频数据进行播放。

本实施例中，所述胸针呈纽扣状，其上配置一用于控制单目视觉传感器启闭的按钮和一用于为胸针内载的蓄电池充电的充电口。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于深度学习的手势识别辅助交流系统 [P] . 中国专利： CN113158736A . 2021-07-23
2. 一种基于动态手势识别的手语翻译交流系统 [P] . 中国专利： CN108615009A . 2018-10-02
3. 3 DEEP LEARNING BASED REAL TIME 3D GESTURE RECOGNITION SYSTEM AND METHOD USING TEMPORAL AND SPATIAL NORMALIZATION [P] . 韩国专利： KR102079380B1 . 2020-02-19

机译：基于时间和空间归一化的基于深度学习的实时3D手势识别系统及方法
4. SYSTEM AND METHOD FOR DEEP LEARNING BASED HAND GESTURE RECOGNITION IN FIRST PERSON VIEW [P] . 美国专利： US2019107894A1 . 2019-04-11

机译：基于第一人称视角的基于深度学习的手势识别系统及方法
5. SYSTEM AND METHOD FOR DEEP LEARNING BASED HAND GESTURE RECOGNITION IN FIRST PERSON VIEW [P] . CA3016921A1 . 2019-04-07

机译：基于第一人称视角的基于深度学习的手势识别系统及方法