相似度计算
相似度计算的相关文献在1987年到2022年内共计710篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、信息与知识传播
等领域,其中期刊论文547篇、会议论文59篇、专利文献519267篇;相关期刊251种,包括情报学报、现代图书情报技术、现代电子技术等;
相关会议47种,包括2015全国理论计算机科学学术年会、武汉市第六届科学年会、上海市计算机学会第十届学术年会等;相似度计算的相关文献由1813位作者贡献,包括高炜、兰美辉、林鸿飞等。
相似度计算—发文量
专利文献>
论文:519267篇
占比:99.88%
总计:519873篇
相似度计算
-研究学者
- 高炜
- 兰美辉
- 林鸿飞
- 余正涛
- 李生
- 周长红
- 徐健
- 曾庆田
- 朱频频
- 段华
- 王汀
- 谌志群
- 郑德权
- 龟井俊男
- 于凤
- 公帅
- 刘志勇
- 刘经纬
- 吴立德
- 吴英杰
- 周俏丽
- 周小平
- 孙海霞
- 张敏
- 张桂平
- 张琳
- 曾文
- 朱永玲
- 李伟
- 李兵
- 李军莲
- 李月
- 武港山
- 熊锦华
- 王健
- 王小玉
- 王楠
- 王江
- 王波
- 石磊
- 肖航
- 董诚
- 蔡东风
- 袁春风
- 诸光
- 赵铁军
- 郑家恒
- 郑诚
- 陈星
- 韩国强
-
-
宋玲;
吕舜铭;
刘洪鑫;
吕强;
牛小飞;
刘新锋
-
-
摘要:
由于人类活动的复杂性和多维性,活动模式的挖掘具有很大的挑战性。本文提出了一个基于时序活动序列计算用户之间的相似度,通过聚类分析来挖掘活动模式和社会人口学模式的方法,对模式进行趋势分析。实验结果表明,提出O(p(m-p))的相似度算法,可以有效地进行聚类。在此基础上,通过时序活动图和概率密度函数(PDF)图的可视化以及统计分析,挖掘出了活动及其社会人口学模式,然后通过对连续多年的数据挖掘,获取行为及其社会人口学模式的发展趋势,以此得到了相似的活动行为具有相似的社会人口学特征的结论。
-
-
舒洪畅
-
-
摘要:
随着共享单车的广泛使用和位置数据的大量获取,为分析城市居民出行特征及理解城市功能特点提供了数据支持。本文采用空间统计的方法提取街区共享单车流动的时空特征,在此基础上提出顾及街区内和街区间单车流动时空特征的街区相似度计算模型,挖掘单车与城市功能区的关系。最后,以北京市老城区居住类型街区为实证对象,结合北京市老城区电子地图及用地布局规划图探讨了共享单车流动特征与居住街区的相互关系,并对其成因做出了简要的分析,证明了该文所提出方法的有效性。
-
-
王金水;
郭伟文;
陈俊岩;
唐郑熠
-
-
摘要:
智慧教育运用人工智能等技术来实现教育的智能化,将智慧教育应用到电气类高校教学、注册电气工程师考试和电网员工入职培训等领域,有助于学生和工作人员快速掌握电气专业知识。基于电气领域本体和自然语言处理技术,探索了电气领域主观题自动评分方法。针对通用词语相似度计算存在的不足,设计了一种融合《同义词词林》和《知网》的词语相似度方法,并结合文本的表层结构信息以及语义信息,提出了一种结合句子的词序、词形和搭配词对三种特征的电气领域主观题自动评分方法。试验表明,该方法能够有效解决传统评分算法对专业术语的识别不全面和未考虑文本中句子的语义关系等问题,有效地提升了评分结果的准确度。
-
-
祁慧敏;
张晨
-
-
摘要:
近年来,深度学习技术发展突飞猛进,在许多领域取得了显著成效。为了满足人们更快捷的问题搜索需求,为用户提供更为精准的问题答案,有必要设计基于百科知识的智能问答系统。该系统利用BERT模型提供的中文语义匹配算法,提取问句的特征向量,将句子以特征向量表示,通过计算两个句子之间语义的相似度快速寻找出置信度最高的答案,可以极大地提高问题搜索的精准度。
-
-
董星彤;
陈士宏;
陈淑鑫
-
-
摘要:
为了探索高校学生实习时提交的实践报告文本存在着重复的问题,从高校教学管理部门收集到相关文本的分类数据,结合Jieba分词工具处理文本信息,利用Word2vec词向量转换技术,表现了自然语言精准的语义分析能力。考虑到主题词抽取、概率分布情况及时间复杂度三个方面,使用Python的OS库完成批处理去重、去停用词和去非中文词,运用重要采样思想优化LDA(latent dirichlet allocation),模型,提出了新的训练模型ISLDA(importance sampling latent dirichlet allocation)抽取主题词汇,并采用余弦相似度计算重复率。更好地实现了文本查重算法模型的优化,对比两个模型的主题词类别、各词汇分布概率,结果表明新训练模型优化了主题模型,提高了计算模型训练准确率及测试文本的查重能力,较理想地实现了文本查重分析设计方法。
-
-
王毅;
李政浩;
陈星
-
-
摘要:
随着移动设备硬件技术和5G等通信技术的发展,智能应用软件不断涌现,其提供的功能已涉及人们生活和工作的方方面面。大量的Android应用在满足人们日常生活需求的同时,也使得人们需要花更多的时间来找到他们想要启动的应用程序。为了让用户快速找到他们想要启动的应用程序并执行目标功能,文中提出了一种基于用户场景的Android应用服务推荐方法。具体来说,首先对用户场景进行分析,通过可访问性服务提取用户场景中的文本信息,然后采用基于知识库的方法,计算文本信息对应的标签,最后通过相似度计算,搜索服务库中与用户场景相关的服务,并将最相关的相似服务和互补服务推荐给用户。针对“豌豆荚”Android应用商店中的10个流行应用的300个Android应用服务进行方法评估,验证了所提方法的可行性和有效性。
-
-
童星
-
-
摘要:
针对传统丢包节点检测方法存在的检测效率低、丢包节点定位精准度差、节点转发率低的问题,设计一种基于相似度计算的物联网传输流丢包节点检测方法。首先构建传感器节点分布模型,并运用二元有向图对其描述,然后根据传输关联信息熵结果创建传输任务信道分布模型;在此基础上,根据丢包节点检测的基本原理对未知分类的节点实施分类检测,并且计算出每个分类的最大似然值,最后对节点进行感测向量检测处理,并将跨度和实际节点之间的相似度作为对应的判定标准,完成丢包节点检测。仿真结果表明:与传统检测方法相比,该方法检测过程效率更高,且通过相似度计算提高了丢包节点定位的精准度,确保了较高的节点转发率,能够很好地适用于对物联网传输任务的检测。
-
-
武森;
董雅贤;
魏桂英;
高晓楠
-
-
摘要:
基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤。传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选取可靠的最近邻,影响推荐效果;现有结构相似度大多利用用户共同评分项占比度量,计算简单,受数据稀疏影响较小但区分度低。针对上述协同过滤任务中数据稀疏带来的相似度计算问题,提出一种稀疏余弦相似度。首先定义新的结构相似度——稀疏集合相似度,将用户区分为高相关用户与低相关用户,并进一步针对不同类型用户设计差异化的数值相似度计算方式,以缓解传统数值相似度在面临数据稀疏时的不足,最终综合数值相似度与结构相似度形成稀疏余弦相似度。实验结果表明,与七种相似度计算方法相比,稀疏余弦相似度解决了传统数值相似度受数据稀疏影响严重和结构相似度计算结果区分度低的问题,可更准确计算用户相似度,提升推荐效果。
-
-
邹梦苑;
樊志强;
徐珞;
刘洁;
梁万路
-
-
摘要:
随着全军顶层设计工作的开展和推进,在使用Inf-ProA框架及其配套的工具开展军事领域的架构设计工作中逐步积累并形成了一定数量的架构设计模型资产。在架构师进行模型设计时,存在着广泛地参考已有相似模型的需求。然而,现有的架构方法和工具还无法对有参考价值的相似模型进行度量和推荐。本文基于信息活动模型(IAV-1a)的基本架构设计要素,通过对可扩展语言文档以及统一建模语言模型相似性度量的研究,提出一种可用于衡量Inf-ProA信息活动过程模型相似度的方法。对信息活动过程模型的内容和结构方面进行相似性的衡量,并考虑接近模型最终设计结果上的设计相似性,利用架构设计实践经验,使得到的相似性度量结果更具有合理性。该相似性度量的结果可以用于对正在设计的模型提供一个最大化的相似匹配,对推荐给架构师来完成辅助设计具有重要意义。实验结果表明,本文提出的方法可以有效地对信息活动过程模型的相似性进行度量。
-
-
尼格拉木·买斯木江;
艾孜尔古丽·玉素甫
-
-
摘要:
为了高效提取高度集中、覆盖范围广和差异性明显的慕课网用户评论关键词,文中提出一种融合BERT和LDA⁃TextRank的关键词提取方法。实现关键词提取的第一步是获取候选关键词,在获得候选关键词之前需对爬取的课程评语进行预处理,再通过BERT模型训练得到慕课网在线评语的词向量;然后利用LDA主题模型得到候选关键词的主题分布;最后结合TextRank算法计算各主题的关系词及生成评论文本的词主题挖掘。基于此,文中利用BERT文本表示方法,能够更好地联系不同词语之间的相关性;在传统的LDA主题抽取模型的基础上结合TextRank方法,并在节点运算中通过迭代算法计算各词的得分,将权值的转移概率作为词语之间的相似度,使得关键词提取性能得到了提升。实验结果表明,与传统方法相比,所提方法的困惑程度值明显降低,证实了该方法的有效性。
-
-
ZHAO Chengding;
赵承鼎;
GUO Junjun;
郭军军;
YU Zhengtao;
余正涛;
HUANG Yuxi
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
新闻与案件的相关性分析是法律领域新闻舆情分析的重要环节,可转化为新闻文本与案件文本的相似度计算任务.借助孪生网络计算文本相似度是一种有效途径,其对平衡样本具有良好的学习能力,但在新闻与案件的相关性计算中面临文本不平衡和新闻文本冗余的问题,因此,提出了基于非对称孪生网络的新闻与案件相关性计算方法.通过计算文本中句子与标题的相似度选取与新闻标题最相关的句子表征文档,去除新闻文本中的冗余句子,利用非对称孪生网络建模,考虑到案件要素蕴含案件的关键语义信息,将案件要素作为监督信息融入到非对称孪生网络中对新闻文档和案件描述进行编码,解决新闻和案件在结构和语义上不平衡的问题,最终实现新闻与案件的相关性判断.实验表明建立的模型相比基线模型准确率提升了2.5%.
-
-
-
-
CHEN Long;
陈龙;
RAO Qi;
饶琪;
LIU Yang;
刘扬
- 《第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)》
| 2018年
-
摘要:
作为一种意合型语言,汉语由字组词的特性明显,字面义词的词义大体可由其构词结构和语素概念来表达,但对非字面义词的处理存在偏差,这也是语言深度理解中的一个棘手问题.本文从语言认知的角度出发,提出了适用于汉语词的非字面义的知识表示方式:全面发掘《现代汉语词典》中的非字面义二字词,判定它们作为隐喻或转喻现象的非字面义类型,标注其在《同义词词林》中的源域、目标域,并选取面向计算的适合的字面义词承担者.该工作首次在词汇级别上,系统地揭示了汉语隐喻和转喻现象的数量、类型及语义域映射分布状况,并且在算法框架不变的情况下,显著改进了词义相似度计算效果.这些思路、做法及语言资源建设,有望推动人文领域和计算应用等相关工作的深入开展.
-
-
-
Zeng Qi;
曾奇;
Wendong Xiao;
肖文栋;
Changguo Sun;
孙昌国
- 《2017中国智能物联系统会议》
| 2017年
-
摘要:
协同过滤算法在推荐系统中应用最广泛,其中相似度计算是该算法重要一环.为了提高相似度计算的准确性,以及更好地利用位置行为数据,本文提供了一种基于改进相似度和位置行为的协同过滤推荐算法.首先,利用日志数据离线计算出位置影响力矩阵;其次,根据用户-项目评分矩阵,得到用户对共同评分项目的评分差异,同时引入兴趣加权,计算出评分差异的加权信息熵;最后,将位置影响力矩阵信息融入到基于加权信息熵的相似度中,得到邻居用户集,进而产生推荐.通过与其他相似度计算方法比较,该算法降低了标准平均绝对误差,在一定程度上降低了数据稀疏性的影响,能更准确地计算相似度,提高了推荐质量.
-
-
-
-