首页> 外文会议>Chinese Control and Decision Conference >基于领域知识字典的Web页面主题判定方法的研究
【24h】

基于领域知识字典的Web页面主题判定方法的研究

机译:基于领域知识字典的Web页面主题判定方法的研究

获取原文

摘要

Web页面主题判定是实现Web数据集成的重要前提,是构建企业级垂直搜索引擎的关键技术,因此得到了学术界和工业界的极大关注。提出了一种基于领域知识字典的Web页面主题判定方法,该方法主要针对含有丰富半结构化数据的Web页面,分别采用向量空间模型(VSM)和支持向量机(SVM)来判断Web页面主题是否属于用户的兴趣领域。向量空间模型适用于领域知识变化快、领域知识字典需要经常更新的应用;而支持向量机模型则适用于领域知识变化慢、领域知识字典不需要经常更新的应用。研究了在半人工干预下,领域字典的更新机制,目的是保证领域字典的新鲜性和正确性。最后,通过使用来自于多领域的含有半结构化数据的Web页面对所提方法进行了性能验证,并讨论了领域知识字典对于判定结果的影响。
机译:Web页面主题判定是实现Web数据集成的重要前提,是构建企业级垂直搜索引擎的关键技术,因此得到了学术界和工业界的极大关注。提出了一种基于领域知识字典的Web页面主题判定方法,该方法主要针对含有丰富半结构化数据的Web页面,分别采用向量空间模型(VSM)和支持向量机(SVM)来判断Web页面主题是否属于用户的兴趣领域。向量空间模型适用于领域知识变化快、领域知识字典需要经常更新的应用;而支持向量机模型则适用于领域知识变化慢、领域知识字典不需要经常更新的应用。研究了在半人工干预下,领域字典的更新机制,目的是保证领域字典的新鲜性和正确性。最后,通过使用来自于多领域的含有半结构化数据的Web页面对所提方法进行了性能验证,并讨论了领域知识字典对于判定结果的影响。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号