首页> 中国专利> 整合定性资料及定量资料进行稽核准则推荐的系统及方法

整合定性资料及定量资料进行稽核准则推荐的系统及方法

摘要

本发明公开了一种整合定性资料及定量资料进行稽核准则推荐的系统,用于执行下列方法:一储存模组接收供应商稽核的一进行中分析资料及储存过去已完成的一历史分析资料,所述进行中分析资料以及所述历史分析资料皆包含一稽核发现的定性资料及一供应商经营数据的定量资料;一主题模型转换模组分析所述历史分析资料的所述稽核发现,取得一主题模型概率分布,以供一特征向量模组依据所述主题模型概率分布及所述历史分析资料的所述供应商经营数据产生对应的一特征向量集合及所述进行中分析资料的一特征向量值;一归类模组决定所述特征向量值所属的所述聚类,以供一推荐模组依据所述聚类提供就一稽核准则清单预先演算的一推荐稽核准则各项。

著录项

  • 公开/公告号CN112256740A

    专利类型发明专利

  • 公开/公告日2021-01-22

    原文格式PDF

  • 申请/专利权人 王其宏;

    申请/专利号CN201910661396.7

  • 发明设计人 王其宏;

    申请日2019-07-22

  • 分类号G06F16/2457(20190101);G06Q40/00(20120101);

  • 代理机构35203 厦门市新华专利商标代理有限公司;

  • 代理人渠述华

  • 地址 中国台湾桃园市中坜区中山东路一段318巷67号

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本发明涉及自然语言处理领域,具体关于一种推荐系统及方法,尤其指整合定性资料及定量资料进行稽核准则推荐的系统及方法。

背景技术

过去在财务稽核中有如US 8,050,988 B2以及US 2006/0106686 A1就财务风险提出结构化的稽核系统与从风险面提出财务稽核的机会与建议,其他如US7885841 B2、US5765138、US7346527 B2、US2008/019546 A1、US8504412 B1等专利也包含如稽核计画与稽核项目产生的自动化。

虽有利用如自然语言处理的推荐系统过去公开或公告如US 2016/0148327 A1、US2018/0165696 A1以及CN 107807962 B,但未能考虑供应商的风险可能与其背景资讯如规模、经营绩效及运营时间等定量资讯。

发明内容

本发明的目的在于提供一种整合定性资料及定量资料进行稽核准则推荐的系统及方法,能够考虑供应商经营的背景资讯,客观地建立稽核发现与经营指标的相关性。

基于此,本发明主要采用下列技术手段,来实现上述目的。

一种整合定性资料及定量资料进行稽核准则推荐的系统,包含:一储存模组,用于接收供应商稽核的一进行中分析资料及储存过去已完成供应商稽核的一历史分析资料,所述进行中分析资料及所述历史分析资料皆包含一稽核发现的定性资料及一供应商经营数据的定量资料;一主题模型转换模组,连接所述储存模组,用于分析所述历史分析资料的所述稽核发现,以建立一主题模型或更新所述主题模型,并取得一主题模型概率分布,所述主题模型转换模组并依所述主题模型转换所述进行中分析资料的所述稽核发现;一特征向量模组,连接所述主题模型转换模组及所述储存模组,用于依据所述主题模型概率分布及所述历史分析资料的所述供应商经营数据产生对应的一特征向量集合,所述特征向量模组并用于产生对应所述进行中分析资料的一特征向量值;一归类模组,连接所述特征向量模组,用于对所述特征向量集合进行聚类分析并决定所述特征向量值所属的一聚类;一推荐模组,连接所述归类模组及所述主题模型转换模组,用于接收供应商稽核所用的一稽核准则清单,并依据所述特征向量值所属的所述聚类就相关的一主题产生对应的一推荐稽核准则各项。

进一步,所述归类模组运算所述特征向量值与各个所述聚类的重心的一距离值,以所述距离值为最小的所述聚类作为所述特征向量值所属的所述聚类。

进一步,所述供应商经营数据的定量资料至少包含一供应商人数资料、一营业额资料、一经营时间资料的任一或组合。

一种整合定性资料及定量资料进行稽核准则推荐的方法,包含:由一储存模组接收供应商稽核的一进行中分析资料及储存过去已完成供应商稽核的一历史分析资料,所述进行中分析资料及所述历史分析资料皆包含一稽核发现的定性资料及一供应商经营数据的定量资料;由一主题模型转换模组分析所述历史分析资料的所述稽核发现,以建立一主题模型或更新所述主题模型,并取得一主题模型概率分布及依所述主题模型转换所述进行中分析资料的所述稽核发现,以供一特征向量模组依据所述主题模型概率分布及所述历史分析资料的所述供应商经营数据产生对应的一特征向量集合与所述进行中分析资料的一特征向量值;以一归类模组就所述特征向量集合进行聚类分析并决定所述特征向量值所属的一聚类,以供一推荐模组接收供应商稽核所用的一稽核准则清单,并依据所述特征向量值所属的所述聚类,就相关的一主题产生对应的一推荐稽核准则各项。

进一步,所述特征向量集合运用K-平均演算法(K-means clustering)进行聚类分析。

进一步,所述归类模组运算所述特征向量值与各个所述聚类的重心的一距离值,以所述距离值为最小的所述聚类作为所述特征向量值所属的所述聚类。

进一步,聚类分析可经加权K-平均(Weighted K-means)特征选择演算降低建立聚类分析的特征向量的维数。

进一步,所述主题模型概率分布至少运用隐含狄利克雷分布(Latent DirichletAllocation,LDA)或非负矩阵分解(Non-Negative Matrix Factorization)其一建立。

进一步,所述供应商经营数据的定量资料至少包含一供应商人数资料、一营业额资料、一经营时间资料的任一或组合。

根据上述技术特征可达成以下功效:

1.稽核准则的推荐考虑供应商经营的背景资讯(如规模、经营绩效及运营时间等定量资讯),将较仅以自然语言处理推荐提供较为适合的稽核准则。

2.就过去所搜集的稽核发现的定性资讯及供应商相关的定量资讯,定期以自然语言处理及非监督学习就供应商进行聚类分析并进行特征选择,可客观地建立稽核发现与经营指标的相关性。

附图说明

图1本发明一实施例的系统方块示意图。

图2本发明另一实施例中包含建模步骤及稽核准则推荐步骤的详细流程示意图。

【符号说明】

100 系统

1 储存模组

11 进行中分析资料

111 进行中稽核发现

112 进行中供应商经营数据

12 历史分析资料

121 已完成稽核发现

122 历史供应商经营数据

2 主题模型转换模组

3 特征向量模组

30 特征向量集合

31 特征向量值

4 归类模组

40 聚类分析

5 推荐模组

50 稽核准则清单

51 推荐稽核准则各项

S10 建模步骤

S100 建模步骤的步骤一

S101 建模步骤的步骤二

S102 建模步骤的步骤三

S103 建模步骤的步骤四

S104 建模步骤的步骤五

S105 建模步骤的步骤六

S106 建模步骤的步骤七

S107 建模步骤的步骤八

S108 建模步骤的步骤九

S109 建模步骤的步骤十

S110 建模步骤的步骤十一

S111 建模步骤的步骤十二

S112 建模步骤的步骤十三

S20 稽核准则推荐步骤

S200 稽核准则推荐步骤的步骤一

S201 稽核准则推荐步骤的步骤二

S202 稽核准则推荐步骤的步骤三

S203 稽核准则推荐步骤的步骤四。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。

图1揭示本发明一实施例整合定性资料及定量资料进行稽核准则推荐的系统100,实施上可为云端系统或是单机设备,主要包含一储存模组1、一主题模型转换模组2、一特征向量模组3、一归类模组4及一推荐模组5;上述系统100是用于执行本发明另一实施例整合定性资料及定量资料进行稽核准则推荐的方法;以下,将先进一步具体说明上述整合定性资料及定量资料进行稽核准则推荐的系统:

所述储存模组1用于接收供应商稽核的一进行中分析资料11及储存过去已完成供应商稽核的一历史分析资料12;所述进行中分析资料11包含一定性资料,即一进行中稽核发现111,及一定量资料,即一进行中供应商经营数据112;所述进行中稽核发现111为稽核人员对被稽核供应商于稽核过程中所见的客观陈述,资料为文字形式,一旦稽核完成则所述进行中稽核发现111状态更新为一已完成稽核发现121;所述进行中供应商经营数据112为一数值性资料集合,可包含但不限于例如一供应商人数资料、一营业额资料、一经营时间资料等;所述进行中供应商经营数据112可以事先搜集获得,稽核完成后状态更新为一历史供应商经营数据122,历史分析资料12为所述已完成稽核发现121及所述历史供应商经营数据122的总称。

所述主题模型转换模组2连接所述储存模组1,定期就所述已完成稽核发现121更新一主题模型,以取得一主题模型概率分布。所述主题模型概率分布至少可运用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)演算法或非负矩阵分解(Non-NegativeMatrix Factorization,NMF)其一建立。所述主题模型转换模组2以最新的一主题模型,分别对所述储存模组1储存的所述已完成稽核发现121及对所述储存模组1接收的所述进行中稽核发现111进行映射转换成所述主题模型的线性组合而产生所述主题模型概率分布。

所述特征向量模组3连接所述主题模型转换模组2及所述储存模组1,将所述已完成稽核发现121的所述主题模型概率分布读入并与所述储存模组1储存的所述历史供应商经营数据122做结合运算,以产生一特征向量集合30,同时将所述进行中稽核发现111的所述主题模型概率分布读入并与所述储存模组1中的所述进行中供应商经营数据112做结合运算产生一特征向量值31。

所述归类模组4连接所述特征向量模组3,可就所述特征向量集合30利用如组内最小平方和演算法决定一最适聚类数,并以所述最适聚类数利用如K-平均演算法(K-meansclustering)将所述特征向量集合30进行聚类分析40;在进行聚类分析40时,所述特征向量集合30就所述进行中供应商经营数据112与所述已完成稽核发现121的所述主题模型概率分布进行结合运算,而一特征向量的各维对聚类分析结果的贡献与影响有异,因此归类模组4可以利用Weighted K-means进行特征选择以降低建立聚类分析40的所述特征向量的维数;并决定所述特征向量值31所属的一聚类;具体而言,所述归类模组4会通过运算所述特征向量值31与各个所述聚类的重心的一距离值,并可将所述距离值为最小的所述聚类决定为所述特征向量值31所属的所述聚类。

接着,所述推荐模组5连接所述归类模组4及所述主题模型转换模组2,用于接收供应商稽核所用的一稽核准则清单50,并依据所述归类模组4所决定的所述特征向量值31所属的所述聚类,由所述聚类重心的座标,取得相关性高的至少一主题,利用所述主题模型以词频-逆向文件频率(term frequency-inverse document frequency,tf-idf)至所述稽核准则清单50中查询传回依相关排序的各所述主题对应的一推荐稽核准则各项51。

以下实施例并结合图2,将进一步详细说明所述整合定性资料及定量资料进行稽核准则推荐的方法的详细内容,主要包含一建模步骤S10及一稽核准则推荐步骤S20。所述建模步骤S10主要是依据一储存模组中的一已完成稽核发现、一稽核准则清单及一历史供应商经营数据(例如供应商人数资料、营业额资料、经营时间资料等)进行聚类分析,可以仅执行一次,也可以是定期或不定期的更新。所述稽核准则推荐步骤S20则是可将新提供的一进行中稽核发现、一进行中供应商经营数据进行归类,以提供对应的一推荐稽核准则各项。

所述建模步骤S10包含:

一建模步骤的步骤一S100:建立一稽核事件,输入一稽核准则清单至一推荐模组,并自所述储存模组输出所有既存的一供应商的一编号及对应所述编号的所述已完成稽核发现(csv档)。

一建模步骤的步骤二S101:所述主题模型转换模组利用pandas工具读入所述建模步骤的步骤一S100所输出的所述已完成稽核发现。

一建模步骤的步骤三S102:所述主题模型转换模组利用gensim工具对所述建模步骤的步骤二S101中的所述已完成稽核发现进行分词。

一建模步骤的步骤四S103:所述主题模型转换模组以spacy工具与NLTK(NaturalLanguage Tool Kit)工具对所述建模步骤的步骤三S102中分词后的所述已完成稽核发现进行停用词移除与词根提取等前处理。要补充说明的是,上述pandas、gensim、spacy、NLTK皆为Python程式语言的自然语言或数据分析处理软件工具。

一建模步骤的步骤五S104:所述主题模型转换模组将所述建模步骤的步骤四S103处理后的所述已完成稽核发现转换至词频(term frequency)空间向量。

一建模步骤的步骤六S105:所述主题模型转换模组以隐含狄利克雷分布(LatentDirichlet Allocation,LDA)演算法对所述建模步骤的步骤五S104处理后的所述已完成稽核发现建立一主题模型并最佳化。

一建模步骤的步骤七S106:所述主题模型转换模组将所述已完成稽核发现映射成所述主题模型的一主题模型概率分布,亦即D=ΣφT,其中,D为所述已完成稽核发现,T为所述主题模型,而φ为T于D的中的概率。

一建模步骤的步骤八S107:一特征向量模组取出φ并自所述储存模组读入一定量资讯,即所述历史供应商经营数据V并作结合运算,产生一特征向量F=V+=φ,并由所有的所述特征向量F构成一特征向量集合F

一建模步骤的步骤九S108:一归类模组对所述特征向量集合F

一建模步骤的步骤十S109:就m维所述特征向量F随意给定w

一建模步骤的步骤十一S110:给定β(β>1)及k,随意给定一聚类重心Z

一建模步骤的步骤十二S111:m=p+q,依w

一建模步骤的步骤十三S112:以r个主题利用tf-idf对所述稽核准则清单查询传回依相关排序的各所述主题对应的一稽核准则各项。

所述稽核准则推荐步骤S20包含:

一稽核准则推荐步骤的步骤一S200:所述储存模组接收来自一用户端(例如智慧型手机、笔记型电脑、平板电脑等)的一进行中分析资料,所述进行中分析资料包含所述进行中供应商经营数据及所述进行中稽核发现。

一稽核准则推荐步骤的步骤二S201:所述归类模组对所述进行中分析资料的所述进行中稽核发现以已建立的所述主题模型进行映射而得D

一稽核准则推荐步骤的步骤三S202:所述归类模组以p

一稽核准则推荐步骤的步骤四S203:所述推荐模组自C

借此,使用者可于稽核现场即时上传供应商经营数据及稽核发现,其中,稽核发现经主题模型(Topic Model)转换运算后形成主题分布,并整合供应商经营数据以非监督学习(如K-means运算法)后就原先聚类进行归类后,取该类中概率较高的主题排序后,便可依序传回各主题的对应推荐稽核准则各项做为稽核机会的参考。

综合上述实施例的说明,当可充分了解本发明的操作、使用及本发明产生的功效,惟以上所述实施例仅为本发明的较佳实施例,当不能以此限定本发明实施的范围,即依本发明申请专利范围及发明说明内容所作简单的等效变化与修饰,皆属本发明涵盖的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号