首页> 中文学位 >真实世界环境下的自动图像标注方法研究
【6h】

真实世界环境下的自动图像标注方法研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

第1章绪论

1.1 研究背景与研究意义

1.1.1 研究背景

1.1.2 研究意义

1.2 关键问题与研究任务

1.2.1 关键问题

1.2.2 研究任务

1.3 研究内容与结构安排

第2章 自动图像标注研究现状

2.1 总体研究状况

2.2 基于统计分类的自动图像标注方法

2.3 基于贝叶斯统计的自动图像标注方法

2.4 基于主题模型的自动图像标注方法

2.5 基于图模型的自动图像标注方法

2.6 基于搜索的自动图像标注方法

2.7 其它方法

2.8 本章小结

第3章 基于大规模学习算法的自动图像标注

3.1 引言

3.2 大规模距离尺度学习算法

3.2.1 研究动机

3.2.2 区分性距离尺度学习算法

3.2.3 大规模区分性距离尺度学习算法

3.2.4 集成距离尺度学习算法ADML Ⅰ

3.2.5 ADMLⅠ的渐进性质

3.2.6 改进的集成距离尺度学习算法ADMLⅡ

3.2.7 ADMLⅡ的渐进性质

3.2.8 时间和空间复杂度分析

3.3 大规模距离尺度学习算法实验结果

3.3.1 人工数据的实验

3.3.2 自动图像标注实验

3.4 大规模支持向量机算法

3.4.1 相关工作

3.4.2 支持向量机

3.4.3 集成线性支持向量机

3.4.4 使用不同的损失函数

3.4.5 渐进性质

3.4.6 使用Mercer核

3.4.7 考虑偏差项

3.4.8 复杂性分析

3.5 大规模支持向量机算法实验结果

3.5.1 人工数据实验

3.5.2 真实世界数据集介绍

3.5.3 集成支持向量机的性能

3.5.4 集成支持向量机的效率与可扩展性

3.6 本章小结

第4章 基于二部图加强模型的网络图像标注方法

4.1 引言

4.2 二部图加强模型框架

4.3 候选标注提取

4.3.1 初始标注提取

4.3.2 扩展标注提取

4.4 候选标注排序

4.4.1 初始标注排序

4.4.2 扩展标注排序

4.5 二部图建立与加强学习

4.5.1 二部图构建

4.5.2 加强学习算法

4.5.3 算法收敛性分析

4.5.4 与HITS算法的比较

4.6 基于BGRM的图像标注选择策略

4.6.1 Top N策略

4.6.2 阈值策略

4.6.3 改进的阈值策略

4.6.4 标注结果综合

4.7 实验结果

4.7.1 实验数据

4.7.2 实验评价

4.7.3 初始标注排序的性能

4.7.4 扩展标注排序的性能

4.7.5 最终标注的性能

4.7.6 BGRM的有效性

4.7.7 图像检索的性能

4.7.8 图像标注举例

4.8 本章小结

第5章 跨语言图像标注

5.1 引言

5.2 相关工作

5.3 跨语言图像标注框架

5.4 基于统计的图像标注模型

5.4.1 聚类

5.4.2 聚类建模

5.4.3 个人图像标注模型

5.4.4 网络图像标注模型

5.4.5 标注重排序

5.5 多语言标注融合

5.5.1 多语言标注的关系

5.5.2 多语言标注的翻译

5.5.3 多语言标注的排序

5.5.4 基于N部图模型的多语言标注融合

5.6 实验结果

5.6.1 实验设置

5.6.2 网络图像标注实验

5.6.3 个人图像标注实验

5.6.4 基于统计的图像标注方法实验

5.7 本章小结

第6章 基于优化的图像标注改善

6.1 引言

6.2 图像标注改善

6.2.1 优化模型

6.2.2 标注的语义先验概率与联合概率

6.2.3 数字优化模型

6.2.4 数字优化模型的快速算法

6.2.5 不同搜索行为的标签改善

6.3 实验结果

6.3.1 实验设置

6.3.2 有标签图像的标注改善

6.3.3 无标签图像的标注改善

6.3.4 无标签图像的标注个性化改善

6.4 本章小结

第7章 自动图像标注在图像检索中的应用

7.1 引言

7.2 图像收集与表示

7.2.1 图像数据库

7.2.2 图像表示

7.2.3 实验结果

7.3 图像排序

7.3.1 引言

7.3.2 SocialRank

7.3.3 实验结果

7.4 图像检索演示系统展示

7.5 本章小结

第8章 工作总结与未来展望

8.1 工作总结

8.2 未来展望

附录第3章定理证明

参考文献

在读期间发表的学术论文与取得的研究成果

项目资助情况

作者简历

致谢

展开▼

摘要

随着多媒体影像技术和存储技术的快速发展,互联网上图像信息呈爆炸性增长。视觉图像信息与文本信息相比,更加生动、易于理解。这些数字图像的应用非常广泛,如商业、新闻媒体、医学、教育等方面。因此,如何帮助用户快速、准确地找到需要的图像成为近年来多媒体研究的热点课题之一。而解决这一课题最重要的技术就是自动图像标注技术。
   但是,传统的自动图像标注研究主要在受限环境下进行的,例如只是针对人工收集的小规模图像数据库,基本没有考虑真实世界环境下的图像标注问题。这造成了一些传统自动图像标注方法在实际应用中遇到了很多问题,如图像标注性能不高,用户对图像标注的感受不好,无法处理大量的语义概念等等。因此,研究传统自动图像标注方法在真实世界环境下的推广,以及针对传统方法的不足研究真实世界环境下的新的自动图像标注方法,都具有重要的意义。
   本论文尝试研究真实世界环境下自动图像标注的关键问题。论文对大规模图像标注学习算法、网络图像标注、多语言环境下的图像标注和图像标注改善等问题进行了深入地研究。另外,我们设计了基于提出的真实世界环境下图像标注算法的图像检索演示系统,并研究了图像表示和像检索图排序问题,实现了真实世界环境下大规模图像数据库快速有效地检索。本文主要成果和创新之处包括以下几个方面:
   1.提出了一种基于大规模距离尺度学习算法的自动图像标注方法。首先,提出了一种区分性距离尺度学习算法。该算法通过保存数据集的局部非线性结构和利用数据的区分性信息来学习马氏距离尺度,可以改善基于K近邻方法的自动图像标注算法的性能。然后,提出了一种集成的距离尺度学习算法,使得区分性距离尺度学习算法可以通过并行或者在线的方式实现有效地训练,从而可以处理大规模数据。实验表明,集成距离尺度学习算法不仅可以提高图像标注性能,也可以大大降低标注模型的学习时间。
   2.提出了一种基于集成思想的大规模支持向量机算法实现了图像的自动标注。支持向量机是自动图像标注的常用方法。通过首先在数据子集上分别学习然后集成的思想,实现了大规模支持向量机算法。该算法可以大大提高原有支持向量机算法的可扩展性。实验表明,与常见的支持向量机算法相比,集成支持向量机算法在基本不损失性能的情况下,可以在较短时间内处理百万级的训练数据。
   3.提出了一种基于二部图加强模型的网络图像自动标注算法。如何利用网络图像的已有文本信息来帮助图像标注是网络图像标注的关键。提出的算法可以从网络图像的已有文本中提取若干单词作为候选标注,然后利用大规模图像数据扩展出更多标注,并将所有标注建模成一个二部图模型。通过在二部图模型上的加强学习算法,可以重排序已有图像标注。实验结果表明,提出的算法可以大大提高网络图像原有标注的性能。
   4.提出了一种基于统计模型的图像标注方法。通过对大规模的网络图像数据集的聚类和统计建模,实现对个人图像和网络图像快速有效地标注。实验表明,提出的算法与现有算法相比,不仅提高了标注性能,而且大大提高了图像标注速度,速度可达每秒20幅图像。
   5.提出了一种跨语言图像自动标注框架。该框架可以利用大规模的多语言网络图像数据集作为训练集,并根据用户的母语自动提供多语言的图像标注结果。该框架提出了一种同时对标注排序和翻译的多语言标注融合的算法MAF。MAF将候选标注建模成一个n-部图模型,然后通过迭代算法提高了多语言标注的性能和翻译效果。实验结果表明,跨语言图像标注框架可以提高标注性能,并且能给用户提供多语言的标注结果。
   6.提出一种基于优化模型的图像标注改善算法,并给出基于该算法的统一的图像标注框架。提出的算法同时使用了标注先验知识和标注间局部语义相关性信息,并将图像标注改善问题建模成一个0-1整数规划问题实现无参数的图像标注改善。并且,它可以通过半正定优化算法实现了快速求解。与以前的方法相比,它可以直接确定最终标注,无需任何经验(设定阈值)。实验结果表明了算法的有效性。
   7.提出了基于空间关系的图像视觉表示方法和考虑图像质量和重要性的图像静态排序算法。结合提出的自动图像标注算法,设计并实现了一个基于大规模数据库的实时图像检索演示系统。
   总之,论文对真实世界环境下自动图像标注的研究,有助于理解图像与概念之间的深层联系,帮助实现视觉信息的统一表示模型,对多媒体领域的研究具有较大的意义,对探索和发展大规模学习理论也具有一定的借鉴意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号