一种线性辨别分析的可扩展的近似算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Fisher线性辨别分析（FisherLinearDiscriminantAnalysis，LDA）是一种经典的用于处理分类问题的有监督的降维方法。传统的LDA算法主要面临的问题是“奇异性问题”，即当训练数据的散布矩阵（ScatterMatrix）奇异时，传统算法不再成立。近年来，研究者们提出了许多LDA的改进算法，用于处理“奇异性问题”，其中包括一些两阶段的近似算法，包括PCA+LDA算法和LDA\QR算法。这些算法首先通过一些其他降维方法将原始数据集降到一个中间维度，使得降维后的协防差矩阵不再奇异，再在降维后的数据上使用传统的LDA算法进一步降低原数据的维度。同时，传统的LDA算法由于有较高的时间复杂度，可扩展性不高，因而无法应用在大规模数据上。这些两阶段的算法，由于是传统LDA算法的一个近似，相比传统的LDA算法有较高的可扩展性。然而，目前对于这类两阶段LDA算法的有效性缺乏理论上的研究。
　　本文首先对一类两阶段的LDA算法的近似误差进行了理论分析，提出了两阶段算法近似误差的一个理论界。根据该理论结果，本文提出了一种新的两阶段的LDA算法。实验证明，该算法相较于PCA+LDA算法和LDA\QR算法，有更高的精确度。另一方面，由于本算法的主要部分是一个奇异值分解，应用近年提出的一种基于随机投影的奇异值分解算法，本算法也拥有较高的可扩展性，可用于大规模的数据上。
　　MapReduce是一个流行的分布式计算软件构架，它可以支持大规模数据的分布式处理。本文描述了本算法在MapReduce上的一种高效实现。这进一步验证了本算法的可扩展性。

著录项

作者
屠博骏;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机应用技术
授予学位硕士
导师姓名钱徽,张志华;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP274.3;
关键词
Fisher线性辨别分析法; 可扩展性; MapReduce构架; 近似算法;

相似文献

中文文献
外文文献
专利

1. 超定线性方程极大极小解的一种近似算法 [J] . 王云诚 ,于艳梅 . 经济数学 . 2002,第001期
2. 非线性方程的一种近似算法 [J] . 亢效虎 . 甘肃科学学报 . 1997,第002期
3. 一种可扩展的线性规划并行算法 [J] . 李庆华 ,李肯立 ,王多强 . 小型微型计算机系统 . 2003,第009期
4. 基于正弦分段线性近似算法的DDS频谱分析 [J] . 谭亚军 ,郑瑞锋 ,陆安江 . 贵州大学学报（自然科学版） . 2010,第002期
5. 基于概率线性判别分析的可扩展似然公式化人脸识别 [J] . 赵芳 ,马玉磊 . 科学技术与工程 . 2014,第006期
6. 一种核正交局部敏感辨别分析算法 [C] . 王庆军 ,张汝波 ,楼宋江 . 先进制造技术与工业信息学博士生学术论坛 . 2009
7. 一种网络服务可扩展性分析方法的研究及应用 [A] . 张旸 . 2014

一种线性辨别分析的可扩展的近似算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅