首页> 中文期刊> 《软件导刊》 >基于LightGBM的文本关键词提取方法

基于LightGBM的文本关键词提取方法

         

摘要

为提升文本关键词提取准确率和效率,提出一种基于LightGBM的文本关键词提取方法.该方法通过TF-IDF提取候选关键词,利用Word2Vec计算词向量,并采用特征工程,对候选关键词进行特征提取,再经由LightGBM算法将关键词提取转换为二分类问题.通过实验对比TF-IDF算法、TextRank算法、LDA算法及LightGBM算法对文本关键词提取的准确率P、召回率R及F1.结果表明,当TopN取2~5时,F1平均值比最优方法提升4.8%.该方法抽取效果整体上均优于实验选取的对比方法,证明将特征工程与LightGBM融合可提升关键词抽取效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号