首页> 中文期刊>现代图书情报技术 >基于新型主题信息量化方法的Web主题信息提取研究术

基于新型主题信息量化方法的Web主题信息提取研究术

     

摘要

针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算.基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息.实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号