基于字的分布表征的汉语基本块识别

李国臣; 党帅兵; 王瑞波; 李济洪

首页> 中文期刊> 《中文信息学报》 >基于字的分布表征的汉语基本块识别

基于字的分布表征的汉语基本块识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

汉语的基本块识别是汉语句法语义自动分析中的重要任务之一.传统的方法大多数直接将汉语基本块识别任务转化成词层面的一个序列标注问题,采用CRF模型来处理.虽然,在许多评测中得到最好的结果,但基于词为标注单位,在实用中受限于自动分词系统以及汉语词特征的稀疏性.为此,该文给出了一种以字为标注单位,以字为原始输入层,来构建汉语的基本块识别的深层神经网络模型,并通过无监督方法,学习到字的C&W和word2vec两种分布表征,将其作为深层神经网络模型的字的表示层的初始输入参数来强化模型参数的训练.实验结果表明,使用五层神经网络模型,以[-3,3]窗口的字的word2vec分布袁征,其准确率、召回率和F值分别达到80.74％,73.80％和77.12％,这比基于字的CRF高出约5％.这表明深层神经网络模型在汉语的基本块识别中是有作用的.

著录项

来源
《中文信息学报》 |2014年第6期|18-25,55|共9页
作者
李国臣; 党帅兵; 王瑞波; 李济洪;
展开▼
作者单位

太原工业学院计算机工程系,山西太原030008;

山西大学计算机与信息技术学院,山西太原030006;

山西大学计算中心,山西太原030006;

山西大学计算中心,山西太原030006;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
汉语基本块; 分布表征; 深层神经网络; 序列标注;

相似文献

中文文献
外文文献
专利

1. 基于词的分布式实值表示的汉语基本块识别 [J] . 侯潇琪 ,王瑞波 ,李济洪 . 中北大学学报（自然科学版） . 2013,第005期
2. 基于词间依存的汉语基本块依存关系识别 [J] . 李丽 ,赵文娟 ,樊孝忠 . 计算机科学 . 2013,第0z2期
3. 融合分词隐层特征的汉语基本块识别 [J] . 李国臣 ,刘展鹏 ,王瑞波 . 中文信息学报 . 2016,第002期
4. 基于基本块划分的库函数快速识别技术 [J] . 邱景 . 计算机工程 . 2009,第021期
5. 基于跨基本块变换和循环分布的SLP优化技术 [J] . 索维毅 ,赵荣彩 ,姚远 . 计算机科学 . 2013,第010期
6. 基于基本块的汉语功能块自动标注 [C] . . 第四届全国学生计算语言学研讨会(SWCL-2008) . 2008
7. 基于神经网络模型的汉语基本块识别 [A] . 刘展鹏 . 2016

基于字的分布表征的汉语基本块识别

摘要

著录项

相似文献

相关主题

期刊订阅