首页> 中文期刊> 《信息技术》 >利用改进型语义特征的Web商品信息挖掘方法

利用改进型语义特征的Web商品信息挖掘方法

         

摘要

针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法.首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的网站URL.其次,采用改进型轻量级语义特征提取方法对元素进行聚类以实现电子商店页面内商品记录的提取.最后,利用产品属性格式和产品记录结构的常识信息进行正则匹配,实现商品属性的提取.实验采用该方法提取来自不同国家的两个电子商店网站不同产品的属性,实验结果表明,提出的方法较好地兼顾了信息提取的完整性和准确性,商品信息的平均提取准确率可高达98.39%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号