语义分割
语义分割的相关文献在1996年到2023年内共计2896篇,主要集中在自动化技术、计算机技术、测绘学、无线电电子学、电信技术
等领域,其中期刊论文932篇、会议论文11篇、专利文献33179篇;相关期刊395种,包括农业工程学报、中国图象图形学报、计算机工程等;
相关会议11种,包括湖北省计算机学会2013年学术年会、第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)、第六届中国Rough集与软计算学术研讨会(CRSSC'2006)等;语义分割的相关文献由7707位作者贡献,包括周武杰、张勇东、焦李成等。
语义分割—发文量
专利文献>
论文:33179篇
占比:97.24%
总计:34122篇
语义分割
-研究学者
- 周武杰
- 张勇东
- 焦李成
- 庞彦伟
- 雷景生
- 孙垚棋
- 张继勇
- 李玲玲
- 程建
- 颜成钢
- 刘芳
- 许文波
- 郭雨薇
- 周全
- 杨鑫
- 柯逍
- 王磊
- 尹宝才
- 何成
- 何自芬
- 吕思嘉
- 张兆翔
- 张印辉
- 张强
- 朱磊
- 林洋洋
- 王伟
- 王海江
- 蔡登
- 陈羽中
- 刘嘉
- 古晶
- 张永军
- 杨淑媛
- 杨绿溪
- 王鑫
- 侯彪
- 刘兵
- 吕亮
- 唐旭
- 宋纯锋
- 廉士国
- 张佳
- 张健
- 张梦璇
- 张磊
- 强芳芳
- 李平
- 桑农
- 王博
-
-
秦汉;
熊凌;
肖林伟;
但斌斌
-
-
摘要:
钢包底吹氩过程中钢液表面裸露区域(即氩花)的面积可以间接反映吹入钢包中的氩气量。为了准确识别出钢水表面图像中的氩花区域,本文提出一种基于改进DeepLabv3网络的图像语义分割方法。该方法以DeepLabv3网络为基础,采用MobileNetV2作为主干特征提取网络,以降低网络的参数量和计算量;同时将原来的交叉熵损失函数替换成Focal Loss损失函数,以解决正/负样本不平衡和难/易分类样本不平衡的问题;最后在网络结构中添加通道注意力机制来提高语义分割精度。以生产现场采集的图像数据为对象进行实验,结果表明,与原始DeepLabv3相比,本文网络模型的参数量和计算量降低了约92.3%,平均交并比提升了0.82个百分点,达到92.4%,帧率提高了23.40%。
-
-
王琳;
曹艳;
邓子微;
胡炯通;
梁嘉敏;
曹晓焱;
潘文雄;
严玉玲;
孙志伟;
杨鑫;
倪东
-
-
摘要:
胎肺发育不良常会令胎儿在出生时引发严重的呼吸窘迫,甚至造成新生儿死亡.胎肺容积测量是临床上无创评估肺成熟度的一项重要手段,但现有的胎肺容积测量方法误差大、过程繁琐、耗时长且临床实用性差.本研究基于3D-nnUnet提出一种高效稳定的胎肺自动分割和测量方法,利用网络对胎肺数据的自适应,有效克服图像组织对比度低和边缘模糊问题,实现了三维超声胎肺的精确分割.针对胎肺超声图像在不同孕周差异大,以及样本数分布极不均衡的问题,提出利用困难样本聚焦和简单样本惩罚(hardmining and easy-penalized,HMEP)损失来提升模型的泛化能力和稳定性.与二维最优分割网络DeepLab V3+和3D-Unet分割结果相比,基于3D-nnUnet的分割网络性能最佳,分割准确率高达85.7%;HMEP损失能够使3D-nnUnet模型专注地学习少数困难样本,将分割准确率提升近2%;分割模型在不同孕周的数据上所测得胎肺容积和医生手动勾画的胎肺容积经一致性检验无显著的统计学差异.实验结果表明,该方法可高效实现三维超声胎肺的自动精确分割和容积测量,具有良好的稳定性和泛化能力,可避免以往胎肺容积测量方法繁琐耗时、误差较大的问题,在诊断胎肺发育状况及评估肺成熟度方面有较好的应用前景.
-
-
楚博策;
高峰;
帅通;
王士成;
陈杰;
陈金勇;
于卫东
-
-
摘要:
针对高分辨率遥感影像复杂地物分类的问题,提出了人工特征工程与深度神经网络相结合的地物分类方法。通过纹理与结构等人工设计特征提取构建多尺度特征图,采用特征图和原始图像合并构建的高维图集合作为网络输入,最大程度地丰富了输入信息量,同时增强了纹理、尺度等有利特征在网络训练过程中的主导作用。根据全卷积网络端到端的像素级分类思想,借鉴并改进DeepLab v3网络的结构设计,实现了一站式的遥感地物分类。实验结果表明,相对于采用原始图像直接作为网络输入,多尺度特征图与原始图结合的方法可以有效地凸显地物中纹理与结构的描述能力,较好地提升地物分类准确度;同时相对于传统神经网络进行图片分类的方法,设计的基于多尺度特征图集合的方法在遥感地物分类任务中具有更好的抗干扰性与准确性。
-
-
陈姝;
徐蕾;
邹北骥;
陈静
-
-
摘要:
语义分割任务是对图像进行像素级别的分类预测,其难点在于对像素级别的准确预测和物体的边缘划分.现有方法大多采用基于编解码结构的网络模型,通过下采样快速扩充网络的感受野,但连续的下采样对特征图的空间信息造成了不可逆转的损失,为此,提出一种基于语义重定位的并行网络.设计了一条全局空间路径,在保持高分辨率的情况下提取丰富的空间信息并缓解多次下采样带来的信息丢失.在另一条上下文信息提取路径中,采用一个特征提取器,通过快速下采样扩充网络的感受野.此外,设计基于物体类别的语义重定位模块弥补多次下采样造成的上下文信息缺失,使用粗分割结果中该类目标区域的所有像素分别对目标区域中的每个像素进行引导.同时,采用Dice loss缓解数据中存在的正负样本不平衡问题,以获得更好的分割性能.最后,在Cityscapes和CamVid数据集上对所提网络进行了评价.实验结果表明,与已有分割网络相比,在CamVid数据集上,SRPNet在mIoU指标上能提升3.1%,在Cityscapes数据集上,SRPNet在mIoU指标上能提升1.8%.
-
-
龚志力;
谷玉海;
朱腾腾;
石文天
-
-
摘要:
由于非结构化道路特征众多、结构复杂的特点,图像分割以及道路模型等经典算法无法满足非结构化道路识别在实际应用中的准确性和实时性要求.上述难点可通过基于深度学习的语义分割算法有效解决,采用轻量化的特征提取网络,改善特征提取网络中离散计算过多问题,优化对参数量和速度的控制,减少DeepLabv3+网络的冗余;针对非结构化道路在图像中空间和通道的分布特性,引入注意力机制对高级特征图和低级特征图处理,以提升网络对特征提取的敏感性和准确性;选用样本类别充足并具代表性且与我国路况相似性强的IDD(India Driving Dataset)非结构化道路数据集,对其中非结构化道路类别进行筛选和预处理并对网络进行训练.实验对比表明,相比于同类网络,参数量最少,准确率和快速性均处于前列;相比于改进前,网络参数量减少93.1%,识别帧率提升116.1%,精确率提高10.1%.
-
-
陆仲达;
张春达;
王丽婧;
徐凤霞
-
-
摘要:
语义分割作完成像素级的分类任务,上下文信息对分割的性能有重要的影响。为了获取更丰富的上下文信息,采用ResNet作为主干网络,设计了一个基于多维度注意模块(Multidimensional attention,MDA)和多尺度上采样模块(Multiscale upsampling,MSU)的编码器-解码器结构。多维度注意力模块计算三个维度的注意力矩阵,以获取每个位置的依赖性,同时注意力机制能自适应地捕捉图像特征。多尺度上采样模块采用并行分支来捕获图像的多尺度特征,多尺度特征聚合有效地增强了图像的上下文信息。在Cityscapes和Camvid数据集上进行的一系列实验表明,该网络能有效提升图像分割精度。
-
-
张恒;
徐长春;
刘艳丽;
廖志芳
-
-
摘要:
针对动态物体容易干扰SLAM建图准确性的问题,提出了一种新的动态环境下的RGB-D SLAM框架,将深度学习中的神经网络与运动信息相结合。首先,算法使用Mask R-CNN网络检测可能生成动态对象掩模的潜在运动对象。其次,算法将光流方法和Mask R-CNN相结合进行全动态特征点的剔除。最后在TUM RGB-D数据集下的实验结果表明,该方法可以提高SLAM系统在动态环境下的位姿估计精度,比现有的ORB-SLAM2的表现效果更好。
-
-
项建弘;
刘茁;
王霖郁;
钟瑜
-
-
摘要:
自动驾驶是目前计算机视觉任务中难度较大的一类任务,而道路场景下的语义分割是自动驾驶的核心技术之一。本文针对经典分割网络中分辨率恢复方式简单,导致细节信息不完整、目标边缘模糊的问题,提出一种基于强化语义流场的上采样方法。该方法通过学习相邻特征图之间的语义流场,使生成图语义信息更细致,边界处更清晰。同时针对道路场景中目标尺度变化处理困难、小目标难以识别的问题,提出一种新的多级特征融合方法,充分融合深层语义信息与浅层细节信息,以适应不同尺度的目标。本文采用CamVid为数据集进行实验,并进行数据增强。实验表明本文提出的两种方法均显著提升了准确度,整体网络与PSPNet、Deeplabv3+等多种模型相比,准确率更高,分割效果更接近真实值。
-
-
王汉谱;
瞿玉勇;
刘志豪;
谷旭轩;
贺志强;
彭怡书;
何伟
-
-
摘要:
图像语义分割的传统方法是依靠人工设计提取特征,用机器学习的方法进行分类,来达到分割的效果,但是过程比较复杂,且最终的分割效果也不理想。为解决该问题,提出运用深度学习的方法自动提取图像中物体特征,实现端到端训练,并提升分割精度。采用的基础网络是ResNet-50,同时采用空洞空间金字塔池化模块进行有效的特征融合,并在最后一组卷积块中使用了空洞卷积来控制感受野,以提取多尺度信息。在解码阶段采用密集上采样卷积来获得最终的输出预测图。实验表明,该方法获得mIoU值为86.185%。
-
-
杨洁洁;
杨顶
-
-
摘要:
语义分割是深度学习计算机视觉方面的核心领域,有着很深的研究价值。语义分割技术的发展在近几年趋于成熟,从传统的方法到基于卷积神经网络方法的突破,构建了端到端的语义分割深度学习神经网络算法。这些方法被用于人工智能当中,应用在无人驾驶,遥感影像检测,医疗影像研究等方面。基于对经典语义分割算法进行学习,每个经典算法都有自己的特点,值得在此一一总结阐述。文章将针对语义分割的发展,优秀算法的网络架构特色,应用的场景进行介绍,最后将对语义分割算法作小结和展望。
-
-
-
韩吉南;
窦鑫;
陈力;
彭剑;
吴毛毛;
李海峰
- 《第七届高分辨率对地观测学术年会》
| 2020年
-
摘要:
遥感影像的语义分割是遥感图像理解中一个基本任务,以深度全卷积网络为代表的技术今年取得了令人映象深刻的成果.然而,但是现有的高分辨遥感图像语义分割方法中普遍存在着明显的“椒盐现象”(单个地物内部分像素被识别为其他地物),造成这现象的主要原因是遥感地物存在类内不一致(地物标签相同但外部特征不同)与类间无差别(两个相邻的地物,标签不同但外部特征相似).针对遥感图像中类内不一致和类间无差别问题,提出一种基于全局-边界融合网络的高分遥感影像语义分割网络(GBFNet).认为造成类内不一致现象的主要原因是缺乏准确的上下文信息,因此GBFNet使用一个全局网络,通过引入图像上下文信息,增强判别特征之间的语义一致性;同时,使用边界网络,引入边界信息,以增大相邻地物之间的特征距离,缓解类间无差别现象.在Vaihingen和ISPRS Potsdam等基准数据集上的实验结果表明,GBFNet优于现有的基线方法,在mF1指标上最大提高5.2%,并且可视化分析结果表明本文提出的方法在减缓椒盐现象方面具有明显优势.
-
-
-
-
Zhang Hua;
张华
- 《湖北省计算机学会2013年学术年会》
| 2013年
-
摘要:
行人重识别技术是嫌疑目标跨摄像头的完整活动路径分析系统的核心技术,但是在被用于实际应用时面临计算复杂度高和存储开销大等问题.针对这些问题,以视频侦查应用为背景,提出一种基于空间颜色特征的行人重识别方法,建立一种在计算复杂度和性能上较均衡的行人外貌特征描述符,对外貌中直观和重要的颜色特征采用对光照具有不变性的颜色描述符进行描述,一定程度上降低了光照变化对颜色特征稳定性的影响.为了弥补颜色直方图缺少空间信息的缺陷,并提高颜色直方图对光照和姿态变化的鲁棒性,把行人团块按语义分割成躯干和腿两部分,再把每一部分细分成若干子块,然后分别计算颜色描述符,并在计算相似度时引入位置信息.实验结果显示本方法在取得接近最好性能的同时具有低计算复杂度的优点。
-
-
-
王春龙;
瞿有利
- 《第六届中国Rough集与软计算学术研讨会(CRSSC'2006)》
| 2006年
-
摘要:
虽然网页设计者一般将相关内容放在同一页面,但是网页通常包含如广告、导航栏、版权信息等与页面主题关系不大的信息,同时也可能包含多个主题.如果将整张网页作为最小不可分割的基本信息实体进行处理,会受到较多干扰;如果能对页面进行语义分割,识别出相关语义区域进行处理,可以提高网页信息获取的精度和效率.本文研究树编辑距离,Web页面语义区域划分和基于树编辑距离的页面语义区域识别。
-
-
-