结合词义的文本特征词权重计算方法

李明涛; 罗军勇; 尹美娟; 路林

首页> 中文期刊> 《计算机应用》 >结合词义的文本特征词权重计算方法

结合词义的文本特征词权重计算方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Most of the existing methods to compute text similarity based on Vector Space Model (VSM) use TF-IDF scores as the weights of feature terms in text, which ignores the word sense relationships among feature terms and lead to inaccurate text similarity. To improve the accuracy of text similarities calculated by methods based on VSM, a new term weight computing method by integrating word sense was proposed in this paper. Firstly, word sense similarities among feature terms were computed based on the Chinese WordNet. And then, the TF-IDF weights were revised according to the word sense similarities for the purpose of reflecting both the frequency and the word sense of feature terms in text. The experimental results on the HIT IR-lab Multi- Document Summarization Corpus show that to use the weights calculated by the proposed method can efficiently improve the differentiation among document clusters.%传统的基于向量空间模型的文本相似度计算方法,用TF-IDF计算文本特征词的权重,忽略了特征词之间的词义相似关系,不能准确地反映文本之间的相似程度.针对此问题,提出了结合词义的文本特征词权重计算方法,基于Chinese WordNet采用词义向量余弦计算特征词的词义相似度,根据词义相似度对特征词的TF-IDF权重进行修正,修正后的权重同时兼顾词频和词义信息.在哈尔滨工业大学信息检索研究室多文档自动文摘语料库上的实验结果表明,根据修正后的特征词权重计算文本相似度,能够有效地提高文本的类区分度.

著录项

来源
《计算机应用》 |2012年第5期|1355-13581365|共5页
作者
李明涛; 罗军勇; 尹美娟; 路林;
展开▼
作者单位

信息工程大学信息工程学院;

郑州450002;

信息工程大学信息工程学院;

郑州450002;

信息工程大学信息工程学院;

郑州450002;

信息工程大学信息工程学院;

郑州450002;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
文本相似度; 特征词权重; 词义相似度; Chinese WordNet;

相似文献

中文文献
外文文献
专利

1. 基于潜在语义索引的文本特征词权重计算方法 [J] . 李媛媛 ,马永强 . 计算机应用 . 2008,第006期
2. 基于文本集密度的特征词选择与权重计算方法 [J] . 吴卫华 ,袁宁 ,周劲 . 计算机与数字工程 . 2005,第003期
3. 一种基于HowNet语义计算的综合特征词权重计算方法 [J] . 孙丽莉 ,张小刚 . 统计与决策 . 2018,第18期
4. XML文档聚类中基于语义的特征词权重计算方法 [J] . 龙鹏飞 ,石奇 . 长沙理工大学学报（自然科学版） . 2015,第002期
5. 基于特征词权重的文本分类 [J] . 杨莉 ,万常选 ,雷刚 . 计算机与现代化 . 2012,第010期
6. 基于层次特征词权重的文本分类方法 [C] . 耿增民 ,贾云得 ,刘万春 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. KNN文本分类中特征词权重算法的研究 [A] . 赵小华 . 2010

结合词义的文本特征词权重计算方法

摘要

著录项

相似文献

相关主题

期刊订阅