首页> 中文期刊> 《计算技术与自动化》 >XML文档分类中特征表达方法的研究

XML文档分类中特征表达方法的研究

         

摘要

XML文档分类技术可以高效地管理海量存在的数据,XML文档同时拥有结构信息和文本信息.为充分利用XML特点,优化分类效果,在结构链接表达模型(structured link vector model,简称SLVM)的基础上,提出了一种新的特征表达方法,即P-SLVM表达模型.该模型在传统的tf*idf的权重设置方式基础上,根据特征词在类中的分布情况,对特征词权重设置进行改进,同时利用泊松分布理论、特征词所在位置等对结构单元进行加权,以更为有效地表达结构信息和内容信息.实验结果表明,在P-SLVM表达模型下进行的XML文档的分类,有更好的分类效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号