首页> 中文会议>2010全国文档信息处理学术会议 >基于最大匹配和歧义检测的中文分词粗分方法

基于最大匹配和歧义检测的中文分词粗分方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题，在最大匹配算法基础上，采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法，提高了文本粗分的准确率，并减小了粗分结果集的规模，为进一步正确分词奠定基础。通过公共语料库数据集的实验对比，取得很好的效果。

著录项

来源
《2010全国文档信息处理学术会议》|2010年|105-108|共4页
会议地点北京
作者
李国和; 刘光胜; 吴卫江; 孙红军; 唐先明; 韩宝东;
展开▼
作者单位

中国计算机学会;

北京信息科技大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
中文分词; 粗分; 最大匹配算法; 全切分算法; 歧义检测;

相似文献

中文文献
外文文献
专利

1. 基于最大匹配和歧义检测的中文分词粗分方法 [J] . 李国和 ,刘光胜 ,吴卫江 . 北京信息科技大学学报：自然科学版 . 2010,第S2期
2. 综合最大匹配和歧义检测的中文分词粗分方法 [J] . 李国和 ,刘光胜 ,秦波波 . 计算机工程与应用 . 2012,第014期
3. 基于改进最大匹配算法的中文分词粗分方法 [J] . 周俊 ,郑中华 ,张炜 . 计算机工程与应用 . 2014,第002期
4. 基于粗分和词性标注的中文分词方法 [J] . 姜芳 ,李国和 ,岳翔 . 计算机工程与应用 . 2015,第006期
5. 基于最大匹配算法的似然导向中文分词方法 [J] . 杨贵军 ,徐雪 ,凤丽洲 . 统计与信息论坛 . 2019,第003期
6. 基于双字耦合度的中文分词交叉歧义处理方法 [C] . 王思力 ,王斌 . 第九届全国计算语言学学术会议 . 2007
7. 基于优化最大匹配的中文分词方法研究 [A] . 刘春辉 . 2009

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号