基于DSR和BGRU模型的聊天文本证据分类方法

张宇; 李炳龙; 李学娟; 张和禹

首页> 中文期刊> 《网络与信息安全学报》 >基于DSR和BGRU模型的聊天文本证据分类方法

基于DSR和BGRU模型的聊天文本证据分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

即时通信等社交软件产生的聊天文本内容证据数据量大且聊天内容含有“黑话”等复杂语义,数字取证时无法快速识别和提取与犯罪事件有关的聊天文本证据。为此,基于DSR(dynamic semantic representation)模型和BGRU(bidirectional gated recurrent unit)模型提出一个聊天文本证据分类模型(DSR-BGRU)。通过预处理手段处理聊天文本数据,使其保存犯罪领域特征。设计并实现了基于DSR模型的聊天文本证据语义特征表示方法,从语义层面对聊天文本进行特征表示,通过聚类算法筛选出语义词,并通过单词属性与语义词的加权组合对非语义词词向量进行特征表示,且将语义词用于对新单词进行稀疏表示。利用Keras框架构建了包含DSR模型输入层、BGRU模型隐藏层和softmax分类层的多层聊天文本特征提取与分类模型,该模型使用DSR模型进行词的向量表示组成的文本矩阵作为输入向量,从语义层面对聊天文本进行特征表示,基于BGRU模型的多层隐藏层对使用这些词向量组成的文本提取上下文特征,从而能够更好地准确理解聊天文本的语义信息,并利用softmax分类层实现聊天文本证据识别与提取目标。实验结果表明,基于DSR-BGRU的聊天文本证据分类模型能够更加准确地完成聊天记录证据的识别和提取任务,该模型能够有效地提取出聊天信息中的犯罪文本信息,取得有效的证据,并取得了92.06%的准确率,F1值为91.00%。高于其他用于文本分类的模型与方法。

著录项

来源
《网络与信息安全学报》 |2022年第2期|150-159|共10页
作者
张宇; 李炳龙; 李学娟; 张和禹;
展开▼
作者单位

信息工程大学;

河南理工大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文本语义表示; 一词多义; 文本分类; 数字取证;

相似文献

中文文献
外文文献
专利

1. 基于BGRU池的卷积神经网络文本分类模型 [J] . 周枫 ,李荣雨 . 计算机科学 . 2018,第006期
2. 融合自注意力机制的D-BGRU文本分类模型 [J] . 周末 ,宋玉蓉 ,宋波 . 微电子学与计算机 . 2021,第12期
3. 基于注意力机制和BGRU网络的文本情感分析方法研究 [J] . 尹良亮 ,孙红光 ,王超 . 无线互联科技 . 2019,第009期
4. 基于模糊K最近邻和证据理论的增量式超文本分类方法 [J] . 侯琳 ,廖明涛 ,李金库 . 微电子学与计算机 . 2009,第3期
5. 文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法 [J] . 陈可嘉 ,刘惠 . 科学技术与工程 . 2021,第029期
6. 一种基于聚类的主题模型短文本分类方法 [C] . 黄鑫 ,樊兴华 . 第十届中国Rough集与软计算、第四届中国Web智能、第四届中国粒计算联合会议 . 2010
7. 基于语义分析模型的涉毒人员聊天文本挖掘 [A] . 范馨月 . 2021

基于DSR和BGRU模型的聊天文本证据分类方法

摘要

著录项

相似文献

相关主题

期刊订阅