文摘
英文文摘
声明
1绪论
1.1课题背景
1.1.1校园网特点
1.1.2校园网日志管理的复杂性
1.1.3校园网日志管理的多元性
1.1.4现有安全产品的局限性
1.2 Web日志挖掘
1.3 Web日志挖掘国内外研究现状
1.4本文研究工作简介
1.5本文组织结构
1.6小结
2相关知识简述
2.1安全审计
2.1.1安全审计概念
2.1.2安全审计的主要技术
2.1.3安全审计相关标准
2.2日志分析
2.2.1日志的概念
2.2.2日志文件系统
2.2.3日志分析
2.3 Web数据挖掘
2.3.1数据挖掘
2.3.2数据挖掘工业流程标准
2.3.3数据挖掘的类别
2.4相关数据挖掘算法
2.5小结
3校园网络日志数据的采集与日志转换
3.1校园网络日志的特点分析
3.2校园网日志的收集
3.2.1 Web服务器日志格式概述
3.2.2中间日志格式设计
3.2.3异构服务器群日志数据按策略收集及中间格式日志的转化
3.3小结
4校园网日志数据预处理
4.1 Web日志预处理的意义及步骤
4.2数据清洗
4.2.1数据清洗功能
4.2.2数据清洗方式
4.3用户识别
4.4会话识别
4.5路径补充
4.6事务识别
4.7小结
5校园网Web日志数据挖掘算法及其实现
5.1审计日志数据仓库设计
5.2Web日志数据仓库维度设计
5.3 Web日志时序聚类挖掘及实现
5.3.1聚类分析概述
5.3.2基于URL-UserID关联矩阵的用户聚类算法
5.3.3基于URL-UserID时序聚类算法MDX实现
5.3.4数据挖掘实验结果
5.4关联挖掘及实现
5.4.1关联规则挖掘定义
5.4.2关联规则的经典算法—Apriori算法
5.4.3基于URL-UserID关联矩阵的频繁访问路径发现
5.4.4基于URL-UserID关联矩阵的频繁访问路径MDX的实现
5.4.5基于URL-UserID关联矩阵的频繁访问路径MDX的实验结果
5.5本章小结
6结语
6.1本文工作总结
6.2未来研究展望
致 谢
参考文献
附录:作者在攻读硕士学位期间发表的论文