首页> 中文学位 >一种面向合作关系的异质信息网络链路预测方法
【6h】

一种面向合作关系的异质信息网络链路预测方法

代理获取

目录

声明

摘要

第1章绪论

1.1研究背景及意义

1.2国内外研究现状

1.2.1链路预测研究现状

1.2.2异质信息网络研究现状

1.2.3异质信息网络链路预测研究现状

1.3论文主要研究内容

1.4论文组织结构

第2章相关理论与研究方法

2.1链路预测相关的网络概念

2.2同质信息网络链路预测方法

2.3异质信息网络链路预测方法

2.3.1多关系链路预测

2.3.2对齐异质网络链路预测

2.3.3基于元路径的异质信息网络链路预测

2.4决策树和随机森林

2.5本章小结

第3章面向合作关系的异质信息网络链路预测

3.1问题空间和合作关系预测框架

3.1.1问题描述

3.1.2合作关系预测框架

3.2元路径的选择与生成

3.3特征提取的改进

3.3.1基于元路径的特征提取

3.3.2时效性特征

3.3.3数据处理

3.4分类算法的改进

3.4.1类不平衡问题

3.4.2改进的随机森林算法

3.5面向合作关系的异质信息网络链路预测方法

3.6本章小结

第4章实验及结果分析

4.1实验环境

4.2评价指标和数据集

4.2.1链路预测评价标准

4.2.2实验数据集

4.3数据处理

4.4实验结果分析

4.4.1提取特征的有效性

4.4.2改进的随机森林算法性能

4.4.3参数调优

4.4.4实验结果及分析

4.5本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

大数据时代使得现实中的网络结构更复杂信息更丰富,作为数据挖掘领域的重要研究方向,链路预测问题的研究对象开始从同质信息网络转向异质信息网络。面向合作关系的异质信息网络链路预测通过综合利用网络中丰富的信息,提高合作关系链路预测的精确度和预测效率,为现实中各个领域的合作关系建立提供有价值的指导,具有重大的研究意义。
  现有的合作关系预测方法多是针对特定网络的,未能充分利用异质网络的丰富语义和合作关系的时效性,预测算法性能不佳。本文提出一种面向合作关系的异质信息网络链路预测方法MRF,基于异质信息网络的元路径,从特征提取与分类算法两个角度改进现有监督学习预测算法。首先根据合作网络的模式利用深度优先搜索得到用户对之间所有元路径的实例,将异质信息网络中用户节点对的元路径特征作为机器学习样本数据的属性,在元路径拓扑特征的基础上考虑基于链路熵的链接概率分数改进元路径综合特征。同时针对合作关系的时效性,将用户节点对的时效性特征用户对阶段性活跃度也作为样本属性。然后结合集成学习的思想,使用改进的随机森林分类算法构建预测模型,通过基于快速聚类的欠采样方法解决合作关系样本的类不平衡问题。调整随机森林参数,在提高预测精确度的同时减少算法运行时间。
  为评估预测方法性能,本文选择DBLP、Movielens、豆瓣电影数据三个真实的合作关系异质信息网络数据集,从AUC、正确率Accuracy、精确度Precision和召回率Recall四种评价指标的角度,实验对比本文方法与现有的异质信息网络链路预测方法。结果显示,本文提出的面向合作关系的异质信息网络链路预测方法准确度更高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号