由于传统主动学习方法的计算量随着问题规模的增大呈指数增长,因此很难应用于大规模多类数据分类任务中.为解决该问题,设计了一种基于子抽样的主动学习(subsampling-based active learning,SBAL)算法.该算法将无监督聚类算法与传统主动学习方法整合,在二者之间增加了子抽样操作,该操作能够显著降低算法的时间复杂度,在保证实验准确率的基础上减少实验耗时,从而更加高效地处理大规模数据集的分类问题.实验结果显示,采用SBAL算法的实验性能优于传统主动学习算法,证明了所提算法可以突破传统主动学习方法不能处理大规模数据集多类别分类问题的局限性.
展开▼