首页> 中国专利> 一种从文本中识别软件体系结构坏味道讨论的方法

一种从文本中识别软件体系结构坏味道讨论的方法

摘要

本发明公开了一种从文本中识别软件体系结构坏味道讨论的方法,包括以下步骤:1)对软件开发专业问答社区的问答帖进行文本爬取,构造用于识别软件体系结构坏味道讨论的数据集;2)对数据集中的文本进行精简文本内容的预处理;3)对步骤2)的文本通过自然语言处理技术提取文本特征获得处理后的特征向量数据集;4)在得到每个文本的特征后,使用训练集训练二分类器;5)训练好的各分类器对测试集中文档进行预测获得分类结果,并评估分类器识别软件体系结构坏味道的性能;6)对比结果,分析特征提取和分类器的最优组合。本发明提供了一种识别软件体系结构坏味道讨论的自动化方法,能根据设定快速获得特征提取和分类模型的最优组合。

著录项

  • 公开/公告号CN111797198A

    专利类型发明专利

  • 公开/公告日2020-10-20

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN202010539516.9

  • 发明设计人 梁鹏;鲁帆;田方超;李雪莹;

    申请日2020-06-14

  • 分类号G06F16/33(20190101);G06F16/332(20190101);G06F16/35(20190101);G06F16/951(20190101);G06F16/955(20190101);

  • 代理机构42102 湖北武汉永嘉专利代理有限公司;

  • 代理人李丹

  • 地址 430072 湖北省武汉市武昌区八一路299号

  • 入库时间 2023-06-19 08:00:20

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号