首页> 中文学位 >基于CPN网络的Deep Web集成系统中结果模式语义标注方法
【6h】

基于CPN网络的Deep Web集成系统中结果模式语义标注方法

代理获取

目录

文摘

英文文摘

第1章 绪论

1.1 研究背景

1.2 国内外研究现状

1.3 研究内容

1.4 本文的组织结构

第2 章 研究基础

2.1 语义标注技术

2.1.1 基于本体的语义标注

2.1.2 基于启发式规则的语义标注

2.2 人工神经网络

2.2.1 自组织特征映射(SOM)

2.2.2 CPN网络

2.3 Deep Web信息集成系统概述

2.4 小结

第3 章 基于CPN网络的DEEPWEB集成系统中结果模式语义标注机制

3.1 结果模式的定义

3.1.1 Deep Web结果模式定义

3.1.2 数据类型分类

3.2 Deep Web结果模式语义标注的定义以及评价准则

3.2.1 Deep Web结果模式语义标注的定义

3.2.2 Deep Web结果模式语义标注的评价准则

3.3 基于CPN网络的DeepWeb集成系统中结果模式语义标注机制

3.4 本章小结

第4章 结果页面属性值特征的选取

4.1 结果页面信息获取

4.1.1 正文块的获取

4.1.2 数据项的抽取

4.1.3 属性值的获取

4.2 样本特征的选取

4.2.1 样本数据类型分类

4.2.2 样本特征的选取

4.2.3 样本特征选取算法

4.3 样本特征的标准化

4.4 本章小节

第5章 基于CPN网络的DEEPWEB集成系统中结果模式语义标注

5.1 经典的CPN算法

5.2 改进的CPN算法

5.2.1 Kohonen层的无导师训练学习

5.2.2 Grossberg层的有导师学习

5.2.3 算法效率分析

5.2.4 网络参数的设置

5.2.5 进一步改进CPN算法

5.3 标注算法

5.4 本章小结

第6章 实验结果分析

6.1 实验环境

6.2 实验结果分析

6.2.1 样本数量对语义标注的影响

6.2.2 CPN网络参数对学习的影响

6.2.3 在不同领域的标注情况

6.2.4 同基于本体的标注与基于语义的标注的比较

6.3 本章小结

第7 章 结论

参考文献

致谢

攻读硕士期间发表的论文

展开▼

摘要

随着Internet的普及和快速发展,Web已经成为富含多种信息资源、遍布全球的共享信息仓库,成为人们获取信息的有效手段和重要方式。而Deep Web信息门类齐全、数据量庞大,几乎无所不包,然而面对如此庞大的信息海洋,用户关心的只是其中很小的一部分信息,需要提供有效的搜索引擎或信息集成工具,帮助用户快速、准确地找到他所感兴趣的信息。
   当前Deep Web中最具代表性的就是电子商务网站,这些网站将自己后台数据库中的相关数据填充到它们的模板页面中,形成了结果页面。通过一定的技术手段,可以将结果页面中用户感兴趣的数据抽取出来。但是存在计算机无法识别抽取出来数据所具有的实际语义信息这个问题。所以需要为抽取出来的数据添加语义标签。为解决Deep Web信息集成中的语义标注问题,本文提出了一种语义标注方法。这种方法具有较高的标注全面性,而标注精度上和当前的主流算法持平。
   本文首先定义了结果模式概念,讨论了基于结果模式的Deep Web语义标注问题,提出了Deep Web语义标注的评价准则。根据观察大量的结果页面的属性值,提出七个属性值的特征,并根据计算特征的需要,提出了属性值数据类型分类模型,同时讨论了特征向量标准化的必要性。然后,通过样本的学习训练得到CPN网络,并使用CPN网络来完成语义标注。为此,本文研究了结果页面信息的获取技术、结果页面属性值的特征分析提取技术、特征向量标准化技术、使用CPN网络语义标注技术,提出了一个改进的CPN算法,该算法在结果页面的属性值提取、属性值的特征分析与计算、特征向量的标准的基础上,通过样本学习训练建立了CPN网络,然后使用CPN网络对属性值语义标注,能够减少学习时间。针对在实际的处理中会出现学习死循环问题,本文进一步对CPN网络进行了改进,有效的降低了死循环的概率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号