主题提取
主题提取的相关文献在2000年到2022年内共计129篇,主要集中在自动化技术、计算机技术、科学、科学研究、信息与知识传播
等领域,其中期刊论文67篇、会议论文10篇、专利文献152896篇;相关期刊51种,包括环球人文地理、情报探索、情报学报等;
相关会议10种,包括2016中国计算机辅助设计与图形学会大会、SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)、第十一届全国计算语言学学术会议等;主题提取的相关文献由322位作者贡献,包括王永成、云红艳、冯博琴等。
主题提取—发文量
专利文献>
论文:152896篇
占比:99.95%
总计:152973篇
主题提取
-研究学者
- 王永成
- 云红艳
- 冯博琴
- 张秀华
- 徐亮
- 王志坚
- 肖京
- 贺英
- 金戈
- 韩客松
- 马甲林
- 于智
- 何明
- 傅向华
- 刁宇峰
- 刘安安
- 刘屹
- 卜佳俊
- 孟昭鹏
- 宋立华
- 宣一鸣
- 尹中航
- 崔海燕
- 师阳
- 庄世芳
- 张亚男
- 张文明
- 张蓓
- 张蓝姗
- 张霞
- 徐楠
- 徐欣
- 徐炜民
- 徐超
- 曹泳强
- 李正民
- 李秀霞
- 杜军平
- 林鸿飞
- 梁懿
- 段炼
- 汤颖
- 沈志勇
- 熊方
- 王哲
- 王文东
- 王晓宇
- 王灿
- 王秋琳
- 田野
-
-
谢蕾;
安璐
-
-
摘要:
突发事件爆发后网络舆情中往往产生若干热点,一些重要问题被大众忽视而形成舆情盲点。针对网络舆情热点存在局限性的问题,文章构建了突发事件情境下舆情盲点探测的方法,识别舆情发展中没有或较少得到关注的舆情盲点,从而使舆情向着更合理的方向发展,切实解决突发事件中产生的各种问题。以突发公共卫生事件为例,基于4R理论构建事件处置各阶段中应受到重视的关注点体系,获取石家庄疫情的舆情数据进行主题提取,通过比较关注点体系与舆情主题的差异来探测舆情盲点。研究发现在舆情的形成期建立预警系统、编制应急预案、定期培训属于舆情盲点。高潮期舆情盲点包括院内感染控制、物资监管、信息上报、防范境外输入、行政监督等。消散期舆情盲点包括完善法制、责任与奖惩、善后处置等。文章所提出的舆情盲点探测方法为网络舆情主题分布的科学性判断与干预策略提供量化的参考依据与方法,为事件处置提供有益借鉴。
-
-
辛明远;
刘继山
-
-
摘要:
双减政策的实施导致大量网络舆情泛滥,及时知晓舆情的演化趋势及舆论焦点,对于全面落实双减政策具有重要的意义。但目前舆情检测模型多以检测舆论的情感极性为主,未将情感极性与舆论焦点相结合。本文将LDA主题模型的主题向量嵌入BERT词向量模型中,在BERT预训练模型的基础上添加CNN卷积层,构建BERTCNN-LDA模型,以获取不同长度词更深层次的信息,从而通过结合文本中蕴含的主题信息更为准确地进行舆论情感分类任务并提取舆论文本的主题词。实验表明,BERTCNN-LDA模型较其他文本分类模型可以更好地进行情感分类任务。
-
-
刘敬涛;
李秀霞;
邵作运
-
-
摘要:
[目的/意义]提出一种基于评论主题提取和情感分析的图书评价新方法,不仅丰富了中文图书评价体系,也为其他学术成果的评价提供了一种可借鉴的思路。[方法/过程]首先,利用LDA主题模型提取图书评论的主题集;再对读者关注的主题进行NLP情感识别;然后利用模糊综合评价法实现图书的综合评价;最后以63本儿童文学图书为例进行实证研究,并通过替代计量评价方法的检验,证明了该方法的有效性。[结果/结论]该方法不仅缓解了当前图书评价方式和读者需求的错位问题,丰富了图书展示理念,也为识别优秀小众图书提供了方法借鉴。
-
-
马建红;
张烔
-
-
摘要:
企业生产一线经常会遇到各种工程难题,需要在专家的帮助下才能得到有效解决。当前的学术资源推荐系统没有深入挖掘问题与解决方案之间的潜在知识关联,无法针对某一工程问题推荐出合适的专家。针对待解决的企业工程问题推荐专家进行的系统研究如下:1)通过专家合著网络来计算专家影响力,并结合作者次序信息构成合著者之间的偏序信息,提出了融入合著者偏序信息的主题模型,即APO-ACT模型,使作者-会议-主题(ACT)模型能更好地挖掘核心专家,更适用于推荐系统;2)通过问题知识模型挖掘问题与解决方案间的潜在知识关联。融合企业创新方法案例库,针对待解决的企业工程问题文本描述,提出并实现了一种将理论、技术及实践相结合的专家推荐算法。通过实验证明,基于APO-ACT主题模型的推荐方法在保证推荐准确率的同时能够更好地挖掘核心专家,优于基于内容的推荐和基于ACT主题模型的推荐。
-
-
张家菊;
林慧苹
-
-
摘要:
现有的产品和服务质量分析常通过问卷调查或利用商品评论,但存在问卷收集难度大、商品评论中存在无效数据等问题。客服对话作为顾客与商家之间沟通的桥梁,包含了丰富的顾客意见,覆盖了从产品到服务的多个方面,然而现在利用客服对话分析产品和服务质量的研究还较少。提出了一种基于客服对话的产品和服务质量分析方法,首先结合产品特征和服务蓝图,确定产品和服务质量的评价要素,并结合重要性‒满意度分析(IPA)法定义评价要素的重要性和满意度指标;然后对客服对话进行主题提取和情感分析,定量分析产品和服务的重要性和满意度。以某消毒除菌产品淘宝旗舰店的真实客服对话为例应用了该方法,建立了18个评价要素,并基于90余万条真实的历史客服对话对评价要素的重要性和满意度进行了量化,从而分析旗舰店产品和服务的质量。最后通过对专业客服的问卷调研,验证了所提方法的有效性。
-
-
杨嘉韵;
张慧明
-
-
摘要:
[目的/意义]针对突发公共卫生事件,借助自然语言处理技术,快速挖掘舆论热点和舆情演化特征,提升政府部门的应急管理能力.[方法/过程]将新冠肺炎疫情作为研究案例,首先搜集了疫情相关的微博文本,在划分为潜伏期、爆发期、衰退期三个阶段的基础上,使用LDA主题模型和语义规则构建的方法进行主题-情感的融合分析,并结合疫情期间的新闻事件探究了网络舆情的情感演化情况和负面舆论的关注热点.[结果/结论]研究发现,关于疫情的负面情绪微博大多集中在前中期,且主要来源于对疫情信息的不确定性;而后期积极态度随国内疫情好转而成为主流.此外,民众对新冠肺炎的传播、成因、境外输入和官方信息发布等子话题的情绪起伏较大.
-
-
涂艳;
刘蕊
-
-
摘要:
从舆情分析视角,将多维度舆情信息纳入网络借贷平台风险分析范畴,针对不同类型的舆情信息采用不同文本处理方式,基于实验研究并结合内部平台基础信息指标与外部舆情信息指标,采用神经网络、支持向量机、随机森林和逻辑回归方法构建网络借贷问题平台甄别模型,验证舆情信息指标对甄别模型的性能提升作用。实验结果表明:第一,综合采用平台基础信息、运营信息和舆情信息进行网络借贷问题平台甄别,准确率更高;第二,相较于随机森林模型、支持向量机模型、逻辑回归模型而言,神经网络模型的甄别效果最佳。本研究有助于金融监管部门科学全面地了解网络借贷平台运营状况,并有针对性地开展精准化监管治理工作。
-
-
-
汤颖;
徐珊
-
-
摘要:
电影数据是一个多模态数据集,包含影片、导演和演员3种不同模态的数据,且不同模态的数据类型不同.如何从这些多类型数据中提取特征信息并进行相应的可视化,进一步通过多视图间的联动交互获得模态内部的特点与不同模态间的关系和影响是一个值得研究的问题.首先从电影数据集中提取不同类型数据的特征;其次根据不同类型的数据特点设计可视化布局,并基于Martini玻璃体叙事可视化结构设计可视化交互探索.特别针对影人关系特征,分别定义各个模态影人间的合作关系,并提出了改进的力导引算法可视化影人合作关系.实现了We b环境下的交互式多模态电影数据可视化系统MDVis,并使用豆瓣电影数据集进行用户实验和案例分析,实验结果验证了上述方法分析多模态电影数据的有效性.
-
-
曹锐;
孙美凤
-
-
摘要:
基于LDA算法原理,提出了两种对语料库提供先验知识的改进策略.一种为对语料库中特定词性的词汇进行增删以进行相对定向的主题词的提取改进;另一种是针对舆情评论文本与新闻的相关性,引入新闻主题以期提高主题提取词汇的语义表达能力.实验证明,改进对提升舆情评论文本的主题提取准确率有明显效果.
-
-
林文锋;
牛军钰
- 《第二届全国Web信息系统及其应用会议(WISA2005')》
| 2005年
-
摘要:
当前搜索引擎存在着信息过载及主题漂移的问题.主题提取是寻找与用户查询相匹配的高质量文档的过程,可以有效地解决上述问题,它也是目前Web检索领域的热点问题之一.本文通过综合利用网页的各种有用特征如页面文档内容、文档结构信息、锚文本以及链接信息等来改善Web检索的查准率,从而满足用户对高质量文档的需求.实验证明这种方法有助于改善主题提取的质量,提高用户信息检索的效率.
-
-
郭立山;
董守斌;
袁华
- 《第三届全国搜索引擎和网上信息挖掘学术研讨会》
| 2005年
-
摘要:
传统的主题提取算法存在一些已知的问题.为了更好地满足SEWM-2004中文Web检索测评中的主题提取任务要求,分析经典的基于超链接分析的主题搜索(hyperlink-induced topic search,HITS)等算法,提出了一种以站点作为查询的资源单位,并结合内容分析的主题提取算法CWT100G上的超链接分析(hyperlink analysis withinCWT100(,HAC).HAC算法首先根据网页的URL将网页按站点分组;然后在每个站内结合网页内容和站内链接关系来计算网页的权值,从而找出站内的Hub网页;接着再分析站间的链接关系进一步计算各网页的最终权值,从而找出站间的Hub网页.两组对比的实验结果表明,HAC算法能找到切合主题的更大的Hub站点。
-
-
熊方;
王晓宇
- 《第十九届全国数据库学术会议》
| 2002年
-
摘要:
随着万维网的日益普及与强大,在网络上搜寻所需的信息变得越来越重要了.诸如AltaVista,Hotbot之类的搜索引擎应运而生.典型的搜索引擎是基于文本匹配的,针对用户的查询会返回多个结果,但要从这许多结果中提取出高质量的页面,还需大量的工作.这种发现高质量页面的过程称为主题提取(topicdistillation).本文中借助基于相似度的模型,我们对ITED系统的特征进行了措述:它完全凭借对链接信息的分析,就在主题提取方面取得了很大的改善;它通过关联规则挖掘的方法,克服了HITS算法中对于相似性的扭曲;它将主题发现的过程结合到主题提取中,使用户能够搜索到更多的相关主题;井且,它以可视化的方式显示主题,方便了用户根据自己的需要选择不同的拨索层次。 在将来,除了完善现有的系统功能而外,我们也试图再进一步改善对于相似度的定义,期望可以在一步中得到有代表性的结果,而不是经过若干次的迭代。
-
-
常智明;
张帅丛;
张浩;
侯艳君
- 《2018年中国电影电视技术学会广播融媒技术专委会年会》
| 2018年
-
摘要:
标题党新闻识别算法是自然语言处理研究的重点方向,随着互联网技术的发展,在信息爆炸的时代背景下,该类问题已经成为当前读者面临的比较头疼的一个方向,河南广播网和手机APP内容面临的此类问题尤为突出.本文从自然语言处理的角度研究和探讨了基于主题提取分析的标题党识别算法和基于统计计算的标题党识别算法,提出了统计计算和潜在语义相融合的标题党识别算法,改进了标题党识别的正确率.标题党识别算法主要是包括基于词频统计的加权技术和基于潜在语义索引的两类算法.前者利用统计的手段方法,通过评估新闻标题中每个词汇在新闻正文和所有语料库中所占比例的大小来实现标题党识别.研究结果随着该词汇在文章中出现的次数和在整篇文章中所占的比例成正比例的增加,但同时会随着它在所有文档的语料库出现的频率成反比例减小,因此通过标题中词语占新闻中的重要程度判断该新闻是否是标题党新闻.后者通过提取与新闻标题相似的主题的句子和段落的比例的值,判断标题和新闻正文之间的相关性,通过和标题相似的句子的数量和该句子所在段落的数量来判断该文章是否为标题党.该结果随着与标题相似的句子和与标题相似句子的段落数的增加而成正比例增长,反之,随着在文章中相似的句子的数量减少和段落数的减少而减少.针对基于词汇统计计算TF-IDF值算法值的稀疏性和基于LSA潜在语义的句子段落算法值的难划分性,本文提出一种基于词频统计、LSA潜在语义分析相融合的一种方法,采用机器学习方式,通过将正文和标题的向量的计算结果作为特征工程的特征值及成为决策树算法的属性来进行标题党的识别,在准确率和召回率上都有了很大的提升,最终算法结果以准确率91%和召回率92%的值进行数据的识别.为进一步实现上述几种标题党识别算法存在的弊端、优点和缺点,本文以大量的标题党和非标题党新闻数据进行实验和展示,并对其进行分析和总结.
-
-
-
-
Zhu Rongjie;
朱熔洁;
Tao Yubo;
陶煜波;
Lin Hai;
林海
- 《2016中国计算机辅助设计与图形学会大会》
| 2016年
-
摘要:
评论数据对于用户去商家消费的决策起着越来越大的作用.然而,用户通常无法阅读所有的评论,获取评论中隐含的所有主题,做出正确的决策.本文针对商家的用户评论,提出了一个评论主题可视分析系统.首先,基于词性标注和Sense2Vec进行语句级别的特征向量提取,再基于特征向量提取评论数据中的主题,然后有机地结合层次图和发散堆叠柱形图,对提取的主题及其情感进行有效地组织和管理,设计了气泡图分析主题的相似性,特定主题可以通过词云和原始文本进行深入可视挖掘和分析.最后,通过案例分析证明了系统的有效性.
-
-
Zhu Rongjie;
朱熔洁;
Tao Yubo;
陶煜波;
Lin Hai;
林海
- 《2016中国计算机辅助设计与图形学会大会》
| 2016年
-
摘要:
评论数据对于用户去商家消费的决策起着越来越大的作用.然而,用户通常无法阅读所有的评论,获取评论中隐含的所有主题,做出正确的决策.本文针对商家的用户评论,提出了一个评论主题可视分析系统.首先,基于词性标注和Sense2Vec进行语句级别的特征向量提取,再基于特征向量提取评论数据中的主题,然后有机地结合层次图和发散堆叠柱形图,对提取的主题及其情感进行有效地组织和管理,设计了气泡图分析主题的相似性,特定主题可以通过词云和原始文本进行深入可视挖掘和分析.最后,通过案例分析证明了系统的有效性.
-
-
Zhu Rongjie;
朱熔洁;
Tao Yubo;
陶煜波;
Lin Hai;
林海
- 《2016中国计算机辅助设计与图形学会大会》
| 2016年
-
摘要:
评论数据对于用户去商家消费的决策起着越来越大的作用.然而,用户通常无法阅读所有的评论,获取评论中隐含的所有主题,做出正确的决策.本文针对商家的用户评论,提出了一个评论主题可视分析系统.首先,基于词性标注和Sense2Vec进行语句级别的特征向量提取,再基于特征向量提取评论数据中的主题,然后有机地结合层次图和发散堆叠柱形图,对提取的主题及其情感进行有效地组织和管理,设计了气泡图分析主题的相似性,特定主题可以通过词云和原始文本进行深入可视挖掘和分析.最后,通过案例分析证明了系统的有效性.
-
-
Zhu Rongjie;
朱熔洁;
Tao Yubo;
陶煜波;
Lin Hai;
林海
- 《2016中国计算机辅助设计与图形学会大会》
| 2016年
-
摘要:
评论数据对于用户去商家消费的决策起着越来越大的作用.然而,用户通常无法阅读所有的评论,获取评论中隐含的所有主题,做出正确的决策.本文针对商家的用户评论,提出了一个评论主题可视分析系统.首先,基于词性标注和Sense2Vec进行语句级别的特征向量提取,再基于特征向量提取评论数据中的主题,然后有机地结合层次图和发散堆叠柱形图,对提取的主题及其情感进行有效地组织和管理,设计了气泡图分析主题的相似性,特定主题可以通过词云和原始文本进行深入可视挖掘和分析.最后,通过案例分析证明了系统的有效性.