首页> 中文会议>第四届全国信息检索与内容安全学术会议 >基于可信度的中文完整词自动识别

基于可信度的中文完整词自动识别

页面导航

摘要
著录项
相似文献
相关主题

摘要

中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一.针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统.最后给出了对第二届SIGHAN(2005)北大测试集语料的各实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求.

著录项

来源
《第四届全国信息检索与内容安全学术会议》|2008年|92-101|共10页
会议地点北京
作者

展开▼
作者单位

中国中文信息学会;

清华大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP391.43;
关键词
中文分词; 自动识别; 信息检索; 识别性能;

相似文献

中文文献
外文文献
专利

1. 基于可信度的中文完整词自动识别 [J] . 王芳 ,万常选 . 中文信息学报 . 2009,第003期
2. 基于多模板匹配和可信度分析的中文文档图像关键词过滤方法 [J] . 陈界伟 ,徐蔚然 ,郭军 . 计算机应用研究 . 2005,第002期
3. 基于决策列表的中文同音词自动识别与校对 [J] . 石敏 ,高尚 . 电子设计工程 . 2015,第009期
4. 基于规则的中文时问词和数词的自动识别算法 [J] . 高霄云 ,杨建林 . 现代图书情报技术 . 2007,第003期
5. 中老年人对网络健康信息可信度认知的影响因素研究——基于信息完整性和社会认可度的差异 [J] . 顾熠男 . 东南传播 . 2020,第009期
6. 基于互信息的中文完整词自动识别模型 [C] . 王芳 ,万常选 . 第二十四届中国数据库学术会议 . 2007
7. 基于词跨度的中文文本关键词提取及在文本分类中的应用 [A] . 谢晋 . 2011

基于可信度的中文完整词自动识别

摘要

著录项

相似文献

相关主题

期刊订阅