首页> 外文期刊>International Journal of Multimedia & Its Applications >A Document Exploring System on LDA Topic Model for Wikipedia Articles
【24h】

A Document Exploring System on LDA Topic Model for Wikipedia Articles

机译:有关Wikipedia文章的LDA主题模型的文档探索系统

获取原文
           

摘要

A Large number of digital text information is generated every day. Effectively searching, managing and exploring the text data has become a main task. In this paper, we first present an introduction to text mining and LDA topic model. Then we deeply explained how to apply LDA topic model to text corpus by doing experiments on Simple Wikipedia documents. The experiments include all necessary steps of data retrieving, pre-processing, fitting the model and an application of document exploring system. The result of the experiments shows LDA topic model working effectively on documents clustering and finding the similar documents. Furthermore, the document exploring system could be a useful research tool for students and researchers.
机译:每天都会产生大量的数字文本信息。有效地搜索,管理和探索文本数据已成为一项主要任务。在本文中,我们首先介绍文本挖掘和LDA主题模型。然后,我们通过对简单维基百科文档进行实验,深入解释了如何将LDA主题模型应用于文本语料库。实验包括数据检索,预处理,模型拟合和文档浏览系统应用的所有必要步骤。实验结果表明,LDA主题模型在文档聚类和查找相似文档方面有效地工作。此外,文件浏览系统对于学生和研究人员可能是有用的研究工具。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号