首页> 中文会议>第二十五届中国数据库学术会议(NDBC2008) >OntoWord:一种新的Web页面语义标注方法

OntoWord:一种新的Web页面语义标注方法

摘要

对Web数据添加语义标注是实现语义Web必须解决的关键问题。现有对非结构化文档进行标注的方法一般都需要大量的数据作为训练集,并忽略了领域背景知识的作用。提出了一种新的Web数据标注方法:OntoWord,利用语言学模式和领域本体所包含的语义信息,以及WordNet提供的词汇间语义关系,进行概念实例的判定.对语言学模式进行弱匹配的策略增强了概念实例的识别能力.同时采用构造参考集的方法提高识别概念实例的准确性和完整性。并以此为基础,提出根据本体属性信息构造属性模式三元组,结合页面布局特征,对属性实例进行判定.实验结果证明了该方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号