声明
摘要
第一章 绪论
1.1 研究背景与意义
1.2 本课题的历史与现状
1.2.1 垂直搜索
1.2.2 垂直搜索与综合搜索
1.2.3 问题呈述与切入点选择
1.3 本文主要研究内容
1.4 本文组织结构
第二章 相关背景知识介绍
2.1 文本分类一般过程
2.1.1 文本预处理
2.1.2 特征降维
2.1.3 文本表示
2.1.4 分类器选择
2.1.5 分类性能评价
2.2 支持向量机SVMTorch
2.3 稀疏矩阵上的SVD近似算法Lanczos
2.4 推荐一般过程
2.4.1 行推荐与列推荐
2.4.2 测试集
2.4.3 评价标准
2.5 本章小结
第三章 潜在语义检索
3.1 基于SVD的潜在语义
3.2 LSI投影模型公式
3.3 dlsi=dTUΛ-1精度问题
3.4 大稀疏矩阵上的SVD
3.5 雅克比分解
3.5.1 雅克比简介
3.5.2 LSI与PCA
3.6 经典LSI降维公式中奇异值矩阵Λ影响分析
3.7 投影模型dlsi=dTUΛl-1
3.8 正则化下的投影模型
3.9 实验验证
3.9.1 测试集和参数设置
3.9.2 总体比较
3.9.3 RSVD-1 vs.SVD-1
3.9.4 RSVD1 vs.SVD1
3.9.5 参数b
3.9.6 讨论
3.10 小结
第四章 不精确谱系模型
4.1 背景
4.2 相关工作及问题的提出
4.3 不精确谱系
4.3.1 构造类间正交趋势的初始矩阵H
4.3.2 ISA的原理
4.3.3 ISA的误差分析
4.3.4 ISA中整合形心向量
4.4 分类上的实验验证
4.4.1 测试集和实验设置
4.4.2 实验效果总览
4.4.3 LSI降维公式dlsi=dTUΛ的降维效果
4.4.4 SVD1 vs.ISA
4.4.5 ISA和EISA降维生成文档的稀疏性比较
4.4.6 性能开销
4.4.7 不同计分构造初始矩阵H对降维效果影响
4.5 小结
第五章 用错误反馈提升推荐精度
5.1 问题提出及相关工作
5.2 错误反馈机制提升推荐精度设计
5.2.1 抽取预测误差
5.2.2 预测习惯性偏差
5.2.3 FPCC算法复杂度分析
5.3 实验验证
5.3.1 试验目标
5.3.2 参与对比的实验方法
5.3.3 测试集和参数设置
5.3.4 推荐精度对比
5.3.5 结果分析与讨论
5.4 小结
第六章 有偏放大法提升列推荐精度
6.1 问题的背景
6.2 问题提出
6.3 不均衡放大技术
6.3.1 为列项CF算法设计的有偏放大法
6.3.2 预测公式分子和分母上有偏放大
6.3.3 有偏放大法原理法原理分析
6.3.4 有偏放大法中的调节器
6.3.5 有偏放大法复杂度分析
6.4 实验设计
6.4.1 试验目标
6.4.2 参与对比的实验方法
6.4.3 数据集以及实验设定
6.5 实验评估
6.5.1 推荐精度总览
6.5.2 有偏放大法与个例放大法
6.5.3 率定参数b
6.5.4 率定参数q
6.5.5 扩展性和推荐速度
6.5.6 亮点总结
6.6 结论
第七章 用半稠密算法加速稀疏向量间批次运算
7.1 传统稀疏向量间向乘
7.2 半稠密算法
7.2.1 半稠密算法
7.2.2 半稠密算法实现
7.2.3 半稠密算法的性能分析
7.2.4 半稠密算法实现方式
7.2.5 讨论
7.3 基于线程池的半稠密算法
7.3.1 线程池设计和实现
7.3.2 在线程池上的半稠密算法
7.4 MPI下基于线程池的半稠密算法
7.5 用半稠密算法加速SVMTorch
7.5.1 问题的提出和切入点的选择
7.5.2 在SVMTorch中用半稠密算法替代经典稀疏算法方案
7.5.3 实验验证半稠密算法对SVMTorch加速效果
7.5.4 参数设定
7.5.5 加速效果
7.5.6 WebKB上的效果
7.5.7 20-newsgroup上的效果
7.5.8 实验结论
7.6 用半稠密算法加速协同过滤
7.6.1 问题的提出和切入点的选择
7.6.2 实验设计
7.6.3 测试场景和数据集
7.6.4 实验验证
7.6.5 实验结论
7.7 小结
第八章 总结与展望
8.1 理论应用及效果总结
8.1.1 校园搜索
8.1.2 学习搜索
8.2 本文工作总结
8.3 展望
参考文献
致谢
个人简历、在学期间的研究成果及发表的论文