中文分词模型词典融入方法比较

冯雪

首页> 中文期刊> 《计算机应用研究》 >中文分词模型词典融入方法比较

中文分词模型词典融入方法比较

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

基于统计的方法一般采用人工标注的句子级的标注语料进行训练,但是这种方法往往忽略了已有的经过多年积累的人工标注的词典信息.这些信息尤其是在面向跨领域时,由于目标领域句子级别的标注资源稀少,从而显得更加珍贵.因此,如何充分且有效地在基于统计的模型中利用词典信息是一个非常值得关注的工作.最近已有部分工作对它进行了研究,按照词典信息融入方式大致可以分为两类:一类是在基于字的序列标注模型中融入词典特征;另一类是在基于词的柱搜索模型中融入特征.对这两类方法进行比较,并进一步进行结合.实验表明,这两类方法结合之后,词典信息可以得到更充分的利用,最终无论是在同领域测试和还是在跨领域测试上都取得了更优的性能.

著录项

来源
《计算机应用研究》 |2019年第1期|8-1017|共4页
作者
冯雪;
展开▼
作者单位

北京信息科技大学计算机学院,北京100192;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
中文分词; 条件随机场; 柱搜索; 领域自适应;

相似文献

中文文献
外文文献
专利

1. 词典与统计方法结合的中文分词模型研究及应用 [J] . 蒋建洪 ,赵嵩正 ,罗玫 . 计算机工程与设计 . 2012,第001期
2. 基于序列标注的中文分词、词性标注模型比较分析 [J] . 刘一佳 ,车万翔 ,刘挺 . 中文信息学报 . 2013,第004期
3. 基于结合词典的CNN-BiGRU-CRF网络中文分词研究 [J] . 郭振鹏 ,张起贵 . 电子设计工程 . 2021,第016期
4. 基于双哈希词典机制中文分词的研究 [J] . 刘超 ,王卫东 . 信息技术 . 2016,第011期
5. 一种基于词典的中文分词改进算法 [J] . 郑木刚 ,刘木林 ,沈昱明 . 软件导刊 . 2016,第003期
6. 基于序列标注的中文分词、词性标注模型比较分析 [C] . 刘一佳 ,车万翔 ,刘挺 . 第六届全国青年计算语言学会议 . 2012
7. 中文分词中词典分词和模型分词融合的实证研究 [A] . 方婷婷 . 2019

中文分词模型词典融入方法比较

摘要

著录项

相似文献

相关主题

期刊订阅