您现在的位置：首页> 研究主题> 图像理解

图像理解

图像理解的相关文献在1993年到2022年内共计221篇，主要集中在自动化技术、计算机技术、无线电电子学、电信技术、航空等领域，其中期刊论文151篇、会议论文15篇、专利文献288196篇；相关期刊100种，包括林业科学、中国图象图形学报、电波科学学报等；相关会议15种，包括中国自动化学会中南六省区自动化学会第28届学术年会、第十四届全国图象图形学学术会议、2007年全国模式识别学术会议等；图像理解的相关文献由473位作者贡献，包括章毓晋、谢昭、高隽等。

图像理解—发文量

期刊论文>

论文：151篇占比：0.05%

会议论文>

论文：15篇占比：0.01%

专利文献>

论文：288196篇占比：99.94%

总计：288362篇

图像理解—发文趋势图

图像理解
-研究学者

章毓晋
谢昭
高隽
危辉
吴克伟
李宁
冯文刚
娄联堂
张旭东
王建
王雪峰
舒宁
黄茜
仲顺安
何莹
余卫宇
佟磊
俞青松
冯仕堃
刘传才
刘占文
刘春年
刘晨阳
刘璐
刘茂福
匡平
吴轶轩
周海英
夏知拓
姚庆栋
孟茂梅
尚岩峰
廖晓锋
张凡
张展
张晶晶
彭启明
彭成辉
徐旭
徐江
徐聪
戴朝约
易辉
曹宇慧
李仁刚
李楚怡
杨楠
杨育彬
杨舒
林杉

图像理解
-相关主题

图像理解
-相关期刊

图像理解
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(25)
2021
(11)
2020
(7)
2019
(5)
2018
(7)
2017
(4)
2016
(10)
2015
(3)
2014
(9)
2013
(5)
2012
(3)
2011
(9)
2010
(6)
2009
(9)
2008
(9)
2007
(5)
2006
(6)
2005
(9)
2004
(8)
2003
(6)
2002
(6)
2001
(3)
2000
(6)
1999
(4)
1998
(1)
1997
(1)
1996
(1)
1995
(3)
1993
(1)

期刊

收录数据库

作者

章毓晋
(22)
谢昭
(5)
高隽
(5)
危辉
(4)
吴克伟
(4)
李宁
(4)
冯文刚
(3)
娄联堂
(3)
张旭东
(3)
王建
(3)
王雪峰
(3)
舒宁
(3)
黄茜
(3)
仲顺安
(2)
何莹
(2)
余卫宇
(2)
佟磊
(2)
俞青松
(2)
冯仕堃
(2)
刘传才
(2)
刘占文
(2)
刘春年
(2)
刘晨阳
(2)
刘璐
(2)
刘茂福
(2)
匡平
(2)
吴轶轩
(2)
周海英
(2)
夏知拓
(2)
姚庆栋
(2)
孟茂梅
(2)
尚岩峰
(2)
廖晓锋
(2)
张凡
(2)
张展
(2)
张晶晶
(2)
彭启明
(2)
彭成辉
(2)
徐旭
(2)
徐江
(2)
徐聪
(2)
戴朝约
(2)
易辉
(2)
曹宇慧
(2)
李仁刚
(2)
李楚怡
(2)
杨楠
(2)
杨育彬
(2)
杨舒
(2)
林杉
(2)

关键词

申请/权力人

;

1. 基于图像理解的吹炼阶段判断模型研究
- 张吉璇
- 摘要：炼钢时的吹炼阶段分为前期、中期和后期,在不同的阶段,炉口的火焰图像会受钢水含碳量、杂质等影响,呈现不同的颜色、纹理、形状等特征信息。论文通过机器视觉利用图像处理的技术,依据炼钢炉火焰边缘轮廓图像的角点数目来分析这些火焰特征,对吹炼阶段做出判断,减轻工人的工作任务和避免工人因为自身主观原因造成的误判。
2. 基于交互实例推荐网络的人-物交互检测方法研究
- 薛丽霞；尹凯建；汪荣贵；杨娟
- 摘要：人-物交互检测任务的目标是定位并且识别图像中人与其周围物体的交互关系。该任务的挑战在于机器无法知道人具体和哪些物体存在交互关系,现有方法大多对人和物进行完全配对来解决这个问题。与他们不同,本文提出了一种基于关系推理的交互实例推荐网络来适应人-物交互检测任务,主要想法是利用人和物体的视觉关系中潜在的交互关系来推荐人-物对。此外,本文还设计了一个跨模态信息融合模块,对不同的上下文信息根据其对检测结果的影响程度进行融合,以此提高检测精度。本文在HICO-DET和V-COCO数据集上进行了充分的实验来验证所提出的方法,结果表明,本文方法在HICO-DET和V-COCO数据集上的mAP达到了19.90%和50.3%,分别比基准网络高了4.5%和2.8%。
3. “图像理解”课程全方位双驱型建设探索研究
- 鲁斌；刘丽
- 摘要：根据研究生阶段课程理论性、实践性、应用性、技术伦理和社会责任的要求,以计算机科学与技术、软件工程专业研究生“图像理解”课程为对象,阐述了课程面向交叉学科、关键技术和学术前沿的设计理念,设计了包含图像理解核心知识和递进式思想政治建设在内的课程目标,设置了“40%知识+60%能力”、“30%讲授+70%自修”的课程结构,提出了面向关键问题求解的“四位一体”课程教学模式,力求通过一门课程的教学活动,实现学生科学研究素养和科研报国情怀的不间断培养,实现高等院校培养高素质人才培养的目标。
4. 基于林内图像的单位面积碳储量估计方法
- 王雪峰；陈珠琳；管青军；刘嘉政；王甜；袁莹
- 摘要： [目的]针对森林碳储量估算工作量大、成本高等问题,提出一种基于林内图像简洁高效且满足精度要求的单位面积森林碳储量估计方法.[方法]林分纵断面图像隐式包含林分密度和高度2类复合信息,与林地上对应的林木碳储量直接相关.以此为突破口,首先,分析林木图像分类算法,提出在全局阈值基础上结合邻域像素属性来决定焦点像素归属,以消弱因林内光线不均对图像灰度造成的影响;然后,提出一个与林木碳储量关系紧密的参数并给出其图像计算方法;最后,以该参数为自变量,建立预估模型,实现对碳储量的估计.[结果]在以焦点像素为中心的3×3的邻域内,如果有大于6个相似像素出现,则将焦点像素归为该类,这种利用与邻域像素关系以决定当前像素归属的方法具有膨胀和腐蚀双重特性,即当焦点像素处于树体内部时容易将该点归为树体,当焦点像素处于树体外部时容易将该点归为背景,相比单纯全局阈值方法更能提高林分图像分类的准确性.碳储量预估模型方面,2参数的直线方程估计精度与3参数的逻辑斯蒂模型接近;如果在普通模型基础上增加代表海拔的虚拟变量,则能使碳储量估计精度得到较大程度提高.以兴安落叶松为例,验证基于林内纵断面图像能够实现对单位面积碳储量的较高精度估计这一假设.[结论]在林木图像提取过程中,继承对称交叉熵法泛用性强、效率高的优点,同时针对该算法容易将树体内部部分像素分割成背景、树体外部部分像素归并于树体内部的缺点,采用兼顾像素邻近关系的方法对其进行改进,取得良好结果,且该算法对林内光线不均表现出迟钝特性.在基于林内图像的碳储量预估模型方面,逻辑斯蒂模型表现出良好适应性,由于考虑海拔因素能降低估计误差,因此在实际应用中有必要分海拔段进行预估.
5. 基于融合门网络的图像理解算法设计与应用
- 周自维；王朝阳；徐亮
- 摘要：为了提高图像理解(Image Captioning)的预测性能,设计了一种基于"融合门"的深度神经网络模型.该"融合门"网络模型基于编码器-解码器结构设计,是卷积神经网络与循环神经网络的融合.算法首先将输入图像通过VGGNet-16网络进行卷积,得到对应的4096维输出向量,然后将卷积后的输出向量与标注语句向量合并,作为输入向量进入改进后的"融合门"网络,最后获得新的网络输出结果.上述过程按照时间步逐次迭代,最终完成网络训练.使用权威的CI-DEr评价指标来评估该"融合门"网络的预测结果,实验结果表明,该网络的CIDEr值比"Neural Talk"网络的CIDEr值提高10.56％,其他相关的评价指标也有较大幅度提高.该网络结构不但预测指标高,而且其网络参数个数比"注意力机制"网络参数少21.1％,所需要的计算机资源更少,这使得将该网络应用在边缘计算中成为可能,对图像理解成果的推广起到关键作用.
6. 中国图像工程:2020
- 章毓晋
- 摘要：本文是关于中国图像工程的年度文献综述系列之二十六.为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,有针对性地查询有关文献,且向期刊编者和作者提供有用的参考,对2020年度图像工程相关文献进行了统计和分析.具体是从国内15种有关图像工程重要中文期刊在2020年发行的共154期上所发表的2 785篇学术研究和技术应用文献中,选取出813篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理、图像分析、图像理解、技术应用和综述评论5个大类,然后进一步分入23个专业小类(与前15年相同),并在此基础上分别进行各期刊与各类文献的统计和分析.根据对2020年统计数据的分析可以看出:图像分析方向当前得到了最多的关注,其中目标检测和识别、图像分割和边缘检测、人体生物特征提取和验证等都是研究的焦点.另外,遥感、雷达、声呐、测绘以及生物、医学等领域的图像技术开发和应用最为活跃.总的来说,中国图像工程在2020年的研究深度和广度还在继续提高和扩大,仍保持着快速发展的势头.综合26年的统计数据还为读者提供了更全面和更可信的各研究方向发展趋势的信息.
7. 中美日韩德图像理解技术发展比较——基于DII数据库的实证分析
- 陈玮；钟书华
- 摘要：以德温特数据库作为数据源,选取中美日韩德作为比较研究对象,对五国图像理解技术的总体趋势进行专利计量分析,并采用技术竞争力模型评估五国的技术竞争力。结果表明,中国在专利申请数量上遥遥领先,但在专利平均被引频次上远低于美国和日本;同时,美国几乎占据了图像理解技术的全部高被引专利。得益于海量的图像理解技术专利,中国的技术强度以微弱优势领先美国成为第一;但其技术影响指数低于期待值,远低于美日两国,反映了中国的图像理解技术多而不强的特征。日韩德在整体上的技术强度落后于中美,但在某一子技术领域各有所长。日本场景恢复技术的技术影响指数远超中韩德三国;而韩国的图像感知和解释技术专利在全球占比份额较大;德国在时空技术上的技术影响指数与专利分享指数均处于全球上游水平。为增强中国在图像理解技术领域的国际竞争力,建议中国推进图像理解技术研究向纵深发展,推动图像理解技术领域各子技术的均衡发展,加强图像理解技术领域国际合作,以及创新政府服务体系,营造技术发展良好环境。
8. 融合双注意力与多标签的图像中文描述生成方法
- 田枫；孙小强；刘芳；李婷玉；张蕾；刘志刚
- 摘要：图像描述是目前图像理解领域的研究热点. 针对图像中文描述句子质量不高的问题, 本文提出融合双注意力与多标签的图像中文描述生成方法. 本文方法首先提取输入图像的视觉特征与多标签文本, 然后利用多标签文本增强解码器的隐藏状态与视觉特征的关联度, 根据解码器的隐藏状态对视觉特征分配注意力权重, 并将加权后的视觉特征解码为词语, 最后将词语按时序输出得到中文描述句子. 在图像中文描述数据集Flickr8k-CN、COCO-CN上的实验表明, 本文提出的模型有效地提升了描述句子质量.
9. 一种运用计算机视觉和光学导航技术的采摘机器人
- 李旗；倪江南
- 摘要：为了全面提升采摘机器人的运行效率,本文基于计算机视觉结合光学导航的技术方式,实现控制系统的合理设计。在实际运行中,可以利用激光扫描与机器视觉相结合的方式,提升采摘的整体准确性与效率性,满足当下采摘机器人的使用需求。1计算机视觉在计算机视觉研究领域,主要可以分为图像处理、模式识别、图像识别、景物分析以及图像理解等诸多的技术环节。图1为计算机视觉图。
10. Scene Graph Generation Model Combining Multi-scale Feature Map and Ring-type Relationship Reasoning 北大核心 CSCD CSTPCD

1. 基于层次时间记忆算法的图像理解系统及其图像理解方法
- 中国科学院上海光学精密机械研究所
- 公开公告日期：2015.04.15
- 摘要：一种基于层次时间记忆算法的图像理解系统及其图像理解方法，该图像理解系统由层次时间记忆网络训练模块、层次时间记忆网络数据库和图像理解模块组成，其图像理解方法包括构建训练图像集P、利用训练图像集P训练层次时间记忆网络、将训练好的层次时间记忆网络存入层次时间记忆网络数据库中和利用层次时间记忆网络数据库中存储的各层次时间记忆网络对目标图像进行理解四个步骤，本发明应用了新的时间模式集学习方法和数据库技术，可以快速的将多项图像内容属性转化为自然语义描述，实现对图像的深度理解，与传统的图像理解方法相比，此方法简单实用，具有很高的实用性和灵活性。
2. 基于层次时间记忆算法的图像理解系统及其图像理解方法
- 中国科学院上海光学精密机械研究所
- 公开公告日期：2012-09-12
- 摘要：一种基于层次时间记忆算法的图像理解系统及其图像理解方法，该图像理解系统由层次时间记忆网络训练模块、层次时间记忆网络数据库和图像理解模块组成，其图像理解方法包括构建训练图像集P、利用训练图像集P训练层次时间记忆网络、将训练好的层次时间记忆网络存入层次时间记忆网络数据库中和利用层次时间记忆网络数据库中存储的各层次时间记忆网络对目标图像进行理解四个步骤，本发明应用了新的时间模式集学习方法和数据库技术，可以快速的将多项图像内容属性转化为自然语义描述，实现对图像的深度理解，与传统的图像理解方法相比，此方法简单实用，具有很高的实用性和灵活性。
3. 一种可达到图像理解水平的图像识别方法
- 顾泽苍
- 公开公告日期：2019-03-26
- 摘要：本发明涉及信息处理领域中的一种可达到图像理解水平的图像识别方法，其特征在于：是指通过机器学习获得图像中概率密度最大的复数个特征点，每一个特征点将承载包括特征点的最大概率尺度，特征点为第k个，第k个特征点到第k+1个特征点的向量值等的结构化的信息，将非结构化的图像数据进行结构化的特征记述。在图像识别时，样本图像的每一个特征点的结构化信息与通过机器学习所获得的各个图像的结构化信息的概率分布数据间的跨越欧几里德空间与概率空间的距离，以及以这个距离为依据的模糊事件概率测度，用这个尺度作为依据实现按照结构化的特征进行识别。本发明实施效果是：可实现对图像的理解，可凭借局部的图像仍然可以正确识别。
4. 神经网络训练方法、文档图像理解方法、装置和设备
- 北京百度网讯科技有限公司
- 公开公告日期：2022-03-08
- 摘要：本公开提供了一种神经网络训练方法、文档图像理解方法、装置和设备，涉及人工智能领域，具体涉及计算机视觉技术、图像处理技术、文字识别技术、自然语言处理技术和深度学习技术。训练方法包括：获取原始图像中的多个第一文本的文本综合特征；将原始图像中的至少一个原始区域进行替换，以得到包括多个第一区域的样本图像和指示每个第一区域是否是被替换的区域的真实标签；获取多个第一区域的图像综合特征；将多个第一文本的文本综合特征和多个第一区域的图像综合特征同时输入神经网络模型，以得到多个第一文本的文本表示特征；基于多个第一文本的文本表示特征，确定预测标签；以及基于真实标签和预测标签，训练神经网络模型。
5. 一种基于深度图像理解的移动应用跨平台强化学习遍历测试技术
- 南京大学
- 公开公告日期：2022-03-04
- 摘要：一种基于深度图像理解的移动应用跨平台强化学习遍历测试技术，包括交互模块，深度图像理解模块，强化学习模块。交互模块通过对apk运行中的状态进行截屏捕获，提供给深度图像理解模块，并通过强化学习模块选择动作执行，从而与移动应用进行交互。深度图像理解模块通过截屏编码器对应用当前界面截图并分析，分别生成状态和可执行动作编码后的特征向量。强化学习模块通过DQN模型分析状态、动作对的优劣，选择最佳可执行动作，实现对移动应用状态空间的高效探索。
6. 基于图像理解的飞机地面积冰检测方法、系统、终端及介质
- 中国民航大学
- 公开公告日期：2022-04-19
- 摘要：本发明属于飞机地面积冰检测技术领域，公开了基于图像理解的飞机地面积冰检测方法、系统、终端及介质。对采集的飞机地面积冰图像进行预处理并标注飞机地面积冰特性；对飞机地面积冰特性进行分类并将冰厚图像信息量化为数值，基于图像理解融合深度学习方法检测飞机地面积冰状态及属性，结合冰厚计算与冰型识别结果，搭建面向关键部位的飞机地面积冰图像理解检测系统，进行飞机地面积冰厚度与类型识别。本发明只需用相机对积冰区域采集图像，稍加图像处理，通过厚度转化算法便可得到冰厚数据，输入冰型识别模型，便可识别出积冰种类，鲁棒性好，可靠性高，响应快。本发明对保障飞机地面除冰以及旅客生命财产安全具有重大的意义。
7. 图像理解方法、装置、设备及介质
- 苏州浪潮智能科技有限公司
- 公开公告日期：2022-05-17
- 摘要：本申请公开了一种图像理解方法、装置、设备及介质，涉及人工智能领域，包括：基于训练图像对应的原始文本数据构建与训练图像对应的第一文本数据，利用简单视觉语言模型得到第二文本数据；基于训练图像、第一文本数据和第二文本数据构建图像文本对集，初始化图像理解模型；从图像文本对集中选取用作训练数据的图像文本对，利用当前的图像理解模型计算训练数据对应的模型总体损失函数值，对图像理解模型中的参数进行更新；判断当前是否满足结束条件，若否则跳转至从图像文本对集中选取用作训练数据的图像文本对的步骤，直到满足结束条件，利用当前输出的图像理解模型获取与待检测图像对应的目标文本数据。实现了能更加贴近真实应用场景的图像理解。
8. 一种基于场景图的图像理解与表达方法、系统与存储介质
- 电子科技大学
- 公开公告日期：2022-06-10
- 摘要：本发明公开一种基于视觉场景图生成的图像内容理解与表达方法、系统与存储介质，应用于图像理解与表达领域，针对现有技术存在的图像表达准确率和效率均较低的问题；本发明提出了基于关键中心点估计的视觉场景图生成方法，不使用大量目标检测锚框和后处理手段，提升了场景图生成的准确率和效率，并充分理解了图像内容本身里目标实体和实体之间、实体和属性、实体和背景之间的关系，使得图像内容表达语句更准确、更贴近图像内容本身；本发明还引入先验语料知识，补足场景图生成过程中关系谓词等词汇输出的缺失，提升了图像内容理解与表达的表达语句准确率和拟人化水平；相比于现有技术，本发明的图像表达准确率和效率均有显著的提升。
9. 一种基于人工智能的语言和图像理解集成服务系统
- 云捷计算机软件(江苏)有限责任公司
- 公开公告日期：2022-06-03
- 摘要：本发明公开了一种基于人工智能的语言和图像理解集成服务系统，包括预处理模块、计算解析模块和判断显示模块，所述预处理模块用于对扫描录入的字符内容进行解析预处理，所述计算解析模块用于识别扫描字符的语义信息和计算其特征向量的实际距离，所述判断显示模块用于判断确认字符综合计算的结果并显示，所述预处理模块与计算解析模块电连接，所述计算解析模块与判断显示模块电连接，首先将用户识别的字符文本进行预处理工作，同步建立相似的字符模板库，再通过预处理中得到的字符特征向量计算其特征向量距离，最后根据特征向量距离和与词频相关的字符通顺值综合计算字符语义值，本发明，具有识别精准和实用性强的特点。
10. 依据图像理解的垃圾桶状态识别方法及设备
- 南通商翼信息科技有限公司
- 公开公告日期：2022-10-11
- 摘要：本发明公开了一种依据图像理解的垃圾桶状态识别方法及设备，涉及图像识别领域。主要包括：对垃圾桶的灰度图像进行基于边缘的分割，并将所有分割区域中灰度方差最小的分割区域作为参考区域，以将相对于参考区域的差异程度大于预设第一阈值的分割区域的面积占比作为破碎程度指标；计算垃圾桶的顶部预设范围内的图像与其对应的标准图像的第一相似度，以及，垃圾桶的底部预设范围内的图像与其对应的标准图像的第二相似度；根据第一相似度、第二相似度以及破碎程度指标，获取垃圾桶的收容指标，以确定垃圾桶是否被装满。本发明实施例避免了人工前往垃圾桶附近对其状态进行识别，从而提高了对垃圾桶状态的识别效率，同时避免了人力的浪费。

图像理解

图像理解—发文量

图像理解—发文趋势图

图像理解-研究学者

图像理解-相关主题

图像理解-相关期刊

图像理解-相关会议

图像理解
-研究学者

图像理解
-相关主题

图像理解
-相关期刊

图像理解
-相关会议