XML文档聚类中基于语义的特征词权重计算方法

龙鹏飞; 石奇

首页> 中文期刊> 《长沙理工大学学报：自然科学版》 >XML文档聚类中基于语义的特征词权重计算方法

XML文档聚类中基于语义的特征词权重计算方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率因子"和"长度因子"的新权重方案。并在建立向量空间模型时引入LSI理论,在词条之间搭建了语义关系,减少了原词-文档矩阵中包含的噪声,聚类速度和精度都有所提高。在IEEE无类别信息数据集上试验表明,与同类相似度计算方法和聚类方法相比,本研究方法在聚类速度和效果上都有所提高和改善。

著录项

来源
《长沙理工大学学报：自然科学版》 |2015年第2期|72-77|共6页
作者
龙鹏飞; 石奇;
展开▼
作者单位

长沙理工大学计算机与通信工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;
关键词
潜在语义索引; 检索结果聚类; 权重算法; 聚类算法;

相似文献

中文文献
外文文献
专利

1. 一种基于HowNet语义计算的综合特征词权重计算方法 [J] . 孙丽莉 ,张小刚 . 统计与决策 . 2018,第18期
2. 基于潜在语义索引的文本特征词权重计算方法 [J] . 李媛媛 ,马永强 . 计算机应用 . 2008,第006期
3. 基于语义标记树的XML文档聚类研究 [J] . 潘有能 ,滕海明 . 情报学报 . 2012,第005期
4. 基于文本集密度的特征词选择与权重计算方法 [J] . 吴卫华 ,袁宁 ,周劲 . 计算机与数字工程 . 2005,第003期
5. 基于图的特征词权重算法及其在文档排序中的应用 [J] . 黄云 ,洪佳明 ,颜一鸣 . 计算机系统应用 . 2012,第006期
6. 基于潜在语义分析的权重计算方法研究 [C] . 张宏艳 ,段鹏 ,周维 . 2009年西南地区网络与信息系统学术年会 . 2009
7. 基于语义标记树的XML文档聚类研究 [A] . 滕海明 . 2011

XML文档聚类中基于语义的特征词权重计算方法

摘要

著录项

相似文献

相关主题

期刊订阅