基于字符的中文分词、词性标注和依存句法分析联合模型

郭振; 张玉洁; 苏晨; 徐金安

首页> 中文期刊> 《中文信息学报》 >基于字符的中文分词、词性标注和依存句法分析联合模型

基于字符的中文分词、词性标注和依存句法分析联合模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目前,基于转移的中文分词、词性标注和依存句法分析联合模型存在两大问题:一是任务的融合方式有待改进;二是模型性能受限于全标注语料的规模.针对第一个问题,该文利用词语内部结构将基于词语的依存句法树扩展成了基于字符的依存句法树,采用转移策略,实现了基于字符的中文分词、词性标注和依存句法分析联合模型;依据序列标注的中文分词方法,将基于转移的中文分词处理方案重新设计为4种转移动作:Shift S、Shift B、Shift M和Shift E,同时能够将以往中文分词的研究成果融入联合模型.针对第二个问题,该文使用具有部分标注信息的语料,从中抽取字符串层面的n-gram特征和结构层面的依存子树特征融入联合模型,实现了半监督的中文分词、词性标注和依存句法分析联合模型.在宾州中文树库上的实验结果表明,该文的模型在中文分词、词性标注和依存分析任务上的F1值分别达到了98.31％、94.84％和81.71％,较单任务模型的结果分别提升了0.92％、1.77％和3.95％.其中,中文分词和词性标注在目前公布的研究结果中取得了最好成绩.

著录项

来源
《中文信息学报》 |2014年第6期|1-8,17|共9页
作者
郭振; 张玉洁; 苏晨; 徐金安;
展开▼
作者单位

北京交通大学计算机与信息技术学院,北京100044;

北京交通大学计算机与信息技术学院,北京100044;

北京交通大学计算机与信息技术学院,北京100044;

北京交通大学计算机与信息技术学院,北京100044;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
联合模型; 中文分词和词性标注; 依存句法分析; 词语内部依存结构; 半监督学习;

相似文献

中文文献
外文文献
专利

1. 中文分词和词性标注联合模型综述 [J] . 赵芳芳 ,蒋志鹏 ,关毅 . 智能计算机与应用 . 2014,第003期
2. 中文分词和词性标注联合模型综述 [J] . 赵芳芳 ,蒋志鹏 ,关毅 . 智能计算机与应用 . 2014,第003期
3. 基于词性标注与分词消歧的中文分词方法 [J] . 熊健 ,翟紫姹 . 广州大学学报：自然科学版 . 2019,第5期
4. 基于粗分和词性标注的中文分词方法 [J] . 姜芳 ,李国和 ,岳翔 . 计算机工程与应用 . 2015,第006期
5. 基于序列标注的中文分词、词性标注模型比较分析 [J] . 刘一佳 ,车万翔 ,刘挺 . 中文信息学报 . 2013,第004期
6. 基于序列标注的中文分词、词性标注模型比较分析 [C] . 刘一佳 ,车万翔 ,刘挺 . 第六届全国青年计算语言学会议 . 2012
7. 基于深度学习方法的中文分词和词性标注研究 [A] . 刘振涛 . 2020

基于字符的中文分词、词性标注和依存句法分析联合模型

摘要

著录项

相似文献

相关主题

期刊订阅