首页> 中文会议>第四届全国信息检索与内容安全学术会议 >基于网页信息结构的网页体裁聚类分析

基于网页信息结构的网页体裁聚类分析

摘要

为了改善互联网信息检索的性能和效率,越来越多的研究致力于挖掘网页自身的结构化信息.网页的版面信息是网页结构化信息的重要组成部分,网页版而信息决定了网页的体裁,而网页体裁可以帮助获得更好的信息检索结果.因此,本文提出了一种基于网页信息结构的网页版面特征提取方法,并探讨了网页版面特征的选择、模型构建、网页版面距离的计算等问题,最后试验研究了该方法在基于划分的聚类算法上的表现.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号