首页> 中国专利> 一种使用多维评级来确定一实体的未来商业可行性的系统和方法

一种使用多维评级来确定一实体的未来商业可行性的系统和方法

摘要

一种用于确定一实体的未来商业可行性的方法及其系统包括:(a)使用一个第一预测模型,确定所述实体的未来商业可行性,所述第一个预测模型通过识别数据中的模式和关联预测属性推断得到的,从而生成一个可行性分数;(b)使用预测模型来生成一个实体对其同等群体的相对排名,从而生成一个相对可行性分数;(c)测量数据深度以量化对实体有多少了解,以此我们对可行性分数和相对可行性分数具有多少信心,从而生成一个数据深度指示器;(d)通过定义和分组实体和与其类似实体指定一公司概况,这是基于规模、业务年度、完整财务报表的可用性、以及商业交易历史而言的;(e)输出一个多维可行性评级,包括可行性分数,相对可行性分数,数据深度指示器和公司概况。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-02-02

    授权

    授权

  • 2015-02-25

    实质审查的生效 IPC(主分类):G06Q30/00 申请日:20140501

    实质审查的生效

  • 2015-01-28

    公开

    公开

说明书

背景技术

1技术领域

本发明通常涉及预测性和描述性的评分和分析。根据本发明的信息做出一个多维评级从而为 商业实体未来商业活动提供具有高度洞察力和可信度的评估。这个预测的组成包括一个公司 将会歇业、变得不积极或者在特定的时间内申请破产,例如十二个月。预测的组成是通过深 入观察业务特点,比如时间、类型和规模等,从而获得一定指示性数据做出一个可信的风险 评估。

2背景技术

本发明的可行性评级的独特性在于他是利用未经证实的或是静止的活动。下文将会进一步提 到UTC是作为目标变量而开发的模型。这是我们为了确定商业评估活动的数据而使用的例 子。UTC作为指定公司在特定时间例如十二个月内处于休眠状态,通过应用多个业务规则他 将会认定为不活跃的。这些规则包括但不限于业务上的无效地址、无法连接的电话或没有业 务。以前我们通过破产或者已经被证实歇业的信息做出这样的判断。现在我们可以通过UT C属性、方法和本发明系统我们能够识别更多的企业处于不活跃或休眠状态,即使没有信息 证明这些状况存在。因此根据本发明系统,通过UTC方法可以更早的发现企业不活跃或休 眠的状态,而不是通过残酷的失败数据。

本发明还提供了如下所述较为明显的优势。

发明内容

多维可行性评级包括多个部分;在这个例子中本发明的可行性评级被描述为四个部 分。前两个部分高度预测一个实体在接下来的十二个月内是否会消失、歇业或者变得不活跃。 第三个是深度可用数据,第四个通过员工规模对公司进行描述。

一种用于确定一实体的未来商业可行性的方法及其系统包括:(a)使用一个第一预测模 型,确定所述实体的未来商业可行性,所述第一个预测模型通过识别数据中的模式和关联预 测属性推断得到的,从而生成一个可行性分数;(b)使用预测模型来生成一个实体对其同等群 体的相对排名,从而生成一个相对可行性分数;(c)测量数据深度以量化对实体有多少了解, 因此我们对实体可行性分数和相对可行性分数具有多少信心,从而生成一个数据深度指示器; (d)通过定义和分组实体和与其类似实体指定一公司概况,这是基于规模、业务年度、完整财 务报表的可用性、以及商业交易历史而言的;(e)输出一个多维可行性评级,包括可行性分数, 相对可行性分数,数据深度指示器和公司概况。

可行性分数是在一个可行性评级中的预测分数,比如范围是从1到9,一个实体与其 他企业相比在未来的一段时间内将会歇业或变得不活跃,其中1是最低的概率,9是最高的 概率。

一个典型的相对可行性分数是在一个相对可行性评级中的预测分数,比如范围从1到 9,一个实体同其他同类型的企业模型相比未来的一段时间内将会歇业或变得不活跃,其中 1是最低的概率,9是最高的概率。

典型的数据深度指示器是一个基于数据深度指数大小的描述,比如范围是从A到M之 间。A到G表示“绩报告单”数据范围,其中A代表最高水平的预测从群体中选择的数据包 括:完整的企业身份数据比如员工数量或行业,大量的商业交易活动,全面的财务属性和附 属组织,G代表最低水平的商业数据预测。预测的数据是基本的身份数据。H到G是特殊类 别,它是A到G在遇到预先确定的风险条件时的进一步观察。

一个典型的公司情况是基于公司的得分情况的描述,比如从A到Z。A代表最大、 成立时间最长的企业,X代表最小、成立时间最短的企业。

计算机可读存储介质包含可执行计算机程序指令,执行时该指令是会导致一个处理系 统来完成一个实体的未来商业可行性的确定方法,该方法包括:(a)使用预测模型,以确定 未来的可行性的商业实体,预测模型推导通过识别数据中的模式和预测相关属性,从而生成 一个可行性分数;(b)使用预测模型来生成一个实体与其相同的群体的相对排名,从而生成 一个相对可行性分数;(d)通过定义和分组实体和与其类似实体指定一公司概况,这是基于规 模、业务年度、完整财务报表的可用性、以及商业交易历史而言的;(e)输出一个多维可行性 评级,包括可行性分数,相对可行性分数,数据深度指示器和公司概况。

一个用于确定一实体的未来商业可行性计算机系统包括:一个处理器,存储在内存中 执行以下步骤,这些步骤包括:(a)使用预测模型,以确定未来可行性的实体,导出了预测 模型识别数据中的模式和预测相关属性,从而生成一个可行性分数;b)使用预测模型来生成 一个实体与其相同的群体的相对排名,从而生成一个相对可行性分数;(c)测量数据深度以量 化对实体有多少了解,因此我们对实体在相对可行性分数和可行性分数具有多少信心,从而 生成一个数据深度指示器;(d)通过定义和分组实体和与其类似实体指定一公司概况,这是基 于规模、业务年度、完整财务报表的可用性、以及商业交易历史而言的;(e)输出一个多维可 行性评级包括可行性分数、相对可行性分数、数据深度指示器和公司概况。

一个用于确定一实体未来商业可行性计算机系统包括:一个活动信号数据库;活动信 号发生器总体包含使用多元化的数据源活动信号的数据,该数据来自对实体业务感兴趣的多 个企业;和模型生成器,该模型基于统计模型的因变量性能生成一个可行性得分,变量来源 是使用统计概率来独立创建多元化的数据。

处理器执行存储在内存中的以下步骤:(a)使用第一个预测模型,确定未来商业可行 性的实体,第一个预测模型推导通过识别数据中的模式和预测相关属性,从而生成一个可行 性分数;(b)使用第二个预测建模来生成一个实体与其相同的群体的相对排名,从而生成一个 相对可行性分数;(c)测量数据深度以量化对实体有多少了解,因此我们对实体在相对可行性 分数和可行性分数具有多少信心,从而生成一个数据深度指示器;(d)通过定义和分组实体和 与其类似实体指定一公司概况;(e)输出一个多维可行性评级,包括可行性分数,相对可行性 分数,数据深度指示器和公司概况。

信号发生器的活动包括:一个匹配的过程中找到一个匹配产生一个信号,一个日志接 收到信号,并进入到元数据;和一个整合器整合数据的元数据,从而产生活动信号数据。信 号包括至少一个信号从群体中选择包括:(a)识别元数据接收;(b)匹配一定的时间;(c)惟一 标识符341;(d)信任代码。

进一步的对象,本发明的特点和优势将理解参考以下图纸和详细描述。

附图说明

图1A本发明的技术信息用框图来表示;

图1B表示图1A中系统处理模块的框图;

图1C表示活跃性信号发生器的框图,这是图1B中的处理模块的一个组件;

图2是一个流程图,描述了评分过程根据本发明用于预测模型确定可行性评分和相对可行性 分数;

图3本发明的深度数据表;

图4本发明中用来解释公司组合情况的简介表;

图5流程图,可行性分数和深度数据分数是用来确定一个可行性的评级的四个模型,即财务 状况,成熟的贸易业务,有限的贸易业务,没有业务;

图6本发明中加权方案的例子。

具体实施例

可行性评级是一个多维的评价,为公司未来的可行性提供了一个高度有见地和可靠 的评估。可行性评级包括预测和描述部分。该预测部分预测了公司在确定的时间段内停业, 变得不活跃,或申请破产的可能性,例如在未来的12个月内。该描述部分提供了可以用来进 行一次可靠的风险和/或商业活动评估的预测数据数量的指示,以及观察商业规模测量,该测 量基于一系列特征,例如,生意的成立时间、类型和规模。生成可行性评级的典型部分是: 可行性分数:对规模的预测评级,例如,在1-9之间的范围内,一实体与其他企业相比,在 一段时间内,比如未来的12个月内,将会歇业或变得不活跃,1表示概率最低,9表示概率 最高。在统计模型的开发中,UTC129数据被用作一种组成部分到可靠的变量。UTC 129为 不活跃的和暂停的生意采集数据。交易明细135是预测模型开发中非常重要的自变量。

组合比较,例如,在1-9的范围内对规模的预测评级,一实体与其他企业相比,在一 段时间内,比如未来的12个月内,将会歇业或变得不活跃,1表示概率最低,9表示概率最 高。交易明细135被用于定义模型细分,该模型细分能够表示在同样的商业活跃性等级中的 生意的相对可行性,该商业活跃性等级例如,交易数额较低的生意。

深度数据指示器:关于规模的描述性评级,比如范围约在A到M之间。A到G表示 “成绩报告单”规模,例如,A代表具有最高水平的预测数据的生意,该预测数据包括完整 的企业简介数据,广泛的商业交易活动,全面的财务属性,而G代表最低水平的预测数据的 生意,该预测数据只包括基本的简介数据。类别,例如H到G,是特殊类别,该类别推断出 A到G的评级,该评级使使用者进一步观察到遇到预先确定的风险条件的生意。许多数据来 源用于定义数据深度指示器。在可行性评级构成、数据深度指示器的创建中,一些来源于 UTC129、贸易数据135和业务参考140的属性。

公司概况:例如,在A-Z范围内关于规模的描述性的等级,A代表规模最大成立时 间最久的公司,Z代表规模最小成立时间最短的公司。使用多个数据源定义一个典型的公司 概况,该数据源包括交易明细135,例如支付交易的数额,和业务参考140,例如业务年限。

可行性评级使用统计概率将生意分为,例如一个1-9风险评级细分。这些划分是基于 公司在一段时间内,例如未来的12个月内,歇业、变得不活跃或暂停、或申请破产的可能性。

数据深度指示器使用分数制度为数据属性分配数值,该数据属性以其提高可行性评价 的预测精度的能力为基础。预测数据属性越多,分数越多。例如,财务数据和广泛的贸易数 据可能有更高的预测指数,增加预测的稳定性。所以他们得到更高的分数,将公司放到A-M 范围中较高的位置。

一个公司概况利用细分来对生意下定义或分组,这类似于根据,例如它们的规模(员 工数量和年销售额等),它们的时间(业务年限)。

可行性评级利用生意上广泛的数据结合起来的能力,该数据包括但不限于生意活跃性 信号、详细的商业贸易经验,该商业贸易经验来源于应收账款发票水平的数据。

可行性评级使用统计模型构建技术,包括但不限于,细分分析和随后的回归分析。

典型可行性分数和组合相对使用统计概率将生意划分例如1到9之间的风险评估范 围,1表示变得不活跃的可能性最低而9表示变得不活跃的可能性最高。这些分级是以公司 在未来12个月内歇业、变得不活跃或暂停、或申请破产的可能性为基础的。

这些统计概率是使用统计模型的开发方法开发的,通过独立变量的模型、捕捉这一行 为的预测因子观察得到一个回归分析,该回归分析是公司在未来的12个月内变得不活跃或暂 停的可能性。

数据深度指示器利用分数制度,为数据属性分配一个数值,该数据属性以其提高可行 性评价的预测精度的能力为基础。预测数据属性越多,分数越多。例如,财务数据和广泛的 贸易数据可能有更高的预测指数,增加预测的稳定性。所以他们得到更高的分数,将公司放 到A-M范围中较高的位置。

一个典型的公司概况利用细分来对生意下定义或分组,这类似于根据,例如它们的规 模(员工数量和年销售额等),它们的时间(业务年限)以及完整的财务报表和商业贸易历史 的有效性。

可行性评级利用多个数据源,该数据源例如生意活跃性信号数据(ASD)160、详细的商 业支付经验、UTC 129、业务参考140,该商业支付经验采集本文所提到的交易明细135的每 月趋势,该交易明细来源于应收账户交易支付数据。例如,可行性评级预测生意的可能性关 于:

·自愿或非自愿的歇业·暂停或变得不活跃·申请破产

可行性评级的基础模型是根据观察到成千上万的的生意的特点,这些特征所具有的关系满足 上述定义的概率。

通过模型分配关于1-9之间的分数。这是将一个可得分领域分为9个不同的风险组, 其中1代表歇业、变得不活跃或申请破产概率最低的生意,9代表概率最高的生意。例如, 使用活跃的生意这个扩展的定义,我们可以预测小企业会随时间慢慢减少他们的活动,直到 他们最终不复存在。

数据深度指示器提供对生意上预测数据元素的水平的观察。它使用户理解并信任用于 评估可行性的基础数据输入。参考图3的数据深度指示器的关键部分。

一个典型公司概况的分类是在A-Z的范围内,该范围基于以下特点的组合,比如业务 年限,员工数量,年销售额以及付款交易量,例如:

·初期:成立不到5年

·正式:成立超过5年的

·较小规模:不到10员工,年销售额低于100000美元

·中等规模:10-49员工之间或年销售额100001-499999美元之间

·较大规模:大于50名雇员或大于500000美元的年销售额

·财务报表可用或不可用

·3个或更多的贸易支付参考

一个A概况的公司代表是最大的,成立最久的公司,该公司有完整的财务报表和贸易支付数 据。一个X概况的公司B代表最小的,成立时间最短的公司,该公司没有财务报表或可用的 贸易支付数据。典型的公司概况分类参考图4、附录B。

模型开发

可行性评级的预测部分是基于统计模型技术来选择和加权数据元素,该数据元素最能预测公 司歇业,不活动和破产,以及业务行为的相关方面。运算结果的模型是数学方程,由一系列 的变量和系数(权重)构成,该系数计算了每个变量。一项预测模型技术的基础是,逻辑回归 技术是否具有二进制因变量,该逻辑回归技术是已有的建模的最佳方法。

广泛的数据分析旨在确定这些变量以及计算每一个变量的合适的权重,这些变量是预 测关闭、不活跃和破产的最重要的因素。通过综合评估数据库中“良好”和“不良”业务, 定义数以百计的预测变量。

本公开文本利用了活跃性信号数据(ADS),该数据由规则驱动、数据收集和数据源的 维护系统生成。该ADS尤其有利于区分小企业的高低风险,该企业趋向于具有有限的或没有 商业贸易的历史。通过利用有商品交易历史的公司的交易付款明细,我们还增强了分数所利 用的数据深度。详细的贸易支付使用精确的数据和捕捉付款行为中每月的波动情况,并提供 预测分数。

可行性评级的评分系统和模型生成

准确地评估风险的能力是依赖于强大的基础数据元素的可用性,所以我们开发了一种评分系 统,该系统解释了预测数据的深度和未来可行性之间的关系。

典型的结果是一套模型,该套模型四个独特的记分卡构成,每个积分卡由预测数据元 素的深度驱动,如企业简介数据包括业务规模和产业、商品支付交易包括前三个月的总额, 可用于流动比率的金融数据属性,等等。

可行性分数提供了,例如1-9评级,该评级以这四个模型的总和为基础。一个投资组 合相对提供了,例如1-9评级,该评级基于单独的模型细分。提供了两种视角能够更好地理 解与企业所有领域相关的风险,以及同一模型细分中生意的风险。有一个模型系统,能够通 过关注特定的总体更好地分离的“良好”和“不良”。它还提供了可能的最有预测力的分数, 该分数在可用的数据优化。因此,可行性评级为改良后的风险管理决定,提供了带有细分计 分卡的最大风险区分力。下面的表1,提供了基于时间样本的“不良”率(歇业率等)

表1基于可行性得分的预计歇业率

可行性得分 合计百分比 歇业率(不良率) 9 1% 65% 8 8% 42% 7 14% 27% 6 30% 13% 5 14% 7% 4 14% 5% 3 15% 3% 2 4% 2% 1 0.3% 0.2%

每个可行性评分都有“不良率”的数据,该不良率可以与平均水平相对比。例如,以上表1 显示,1%的公司取得了9分,65%在未来12个月预计将歇业,变得不活跃,或内申请破产。 这意味着,企业的可行性得分更有可能比一般的变坏9(65/14=5)约5倍,更有可能比的可 行性得分为1企业(65/0.2=325)变坏325倍。

深度数据指示器组件捕捉信息的能力,该信息关于公司并用于创建可行性得分。可行 性的能力可以根据模型的准确性和分选进行测量。但是在风险建模有许多实例,其中模型可 以有很高的精度,但它不在确定良好和不良上表现良好。为了成功进行风险分析,区分良好 和不良是非常重要的。因此,基于建模的这个特定方面,数据深度指示器或分数还用于生成 可行性评级。有许多标准很好地定义统计数据,例如柯尔莫哥罗夫-斯米尔诺夫、基尼指数、 分散、ROC等,该统计数据捕捉多元统计模型的分离能力。目前的发明家已经使用主成分分 析方法在一个指示器或分数上结合了所有这些统计数据。这些分数终于用于为每一种规模的 公司创建一个权重,该权重重量用于计算可行性的得分。

具有多个因变量的回归分析的权重方案

当多个二进制因变量通过利用“或”调节,例如所有不良=不良1或不良2或不良3,组合成 一个因变量,。具有最高不良率的不良定义控制并影响其他因素。在这个应用中,不良率1= 0.22%,不良率2=0.32%,不良率3=0.12%。没有加权回归分析模型不良率2将会比不良率 1和不良率3更准确。

方法:

为了确保回归模型将在所有三个不良率定义上良好地运作,加权不良率和加权不良率的数量 将被设置,以便每个不良率定义根据计数和利率平等。创建一组最终权重,以确保整体计数 和不良率将与原始数据组相同,以相对非加权样本确保适当的拦截值和P统计、。下面是一系 列的表,给出了加权方案中实际使用的数量和权重。

第一步是增加加权不良率1和不良率3到不良率2的数值。不良率1和不良率2及不 良率3之间是互斥的,但不良率2和不良率3之间有重叠。由于一个不良率可能被当成不良 率2和不良率3,必须应用第二个权重,该权重会降低不良率2的数量而不是不良率3。最后, 应用第三个不良率使整体不良率和计数回到最初的未加权的数据组(参见图6)。图1是一个系 统100的框图,用于本出公开的技术的使用。系统100包括(a)计算机105,(b)数据源145-1 和145-2到145-n,统称为数据源,该系统通过计算机105连接到网络150。

网络150是一个数据通信网络。网络150可能是一个私有网络或公共网络,并可能包 括:(a)个人区域网络,如,包括一个房间;(b)一个局域网,例如,包括建筑等;(c)校园区 域网络,例如,包括校园;(d)城域网,例如,覆盖一个城市;(e)广域网占地面积,链接在 城市、地区、国界;(f)互联网。通信是通过网络150进行的通过电子信号和光学信号。

数据源145是一个实体、组织,或提供信息的过程,即数据业务。数据源145的例子 包括商业注册,电话簿,应收账款发票程度的付款数据,和其他业务的业务询问。

计算机105处理数据源145中的数据,同时处理这里指定的UTC数据129,应收账款 数据130,交易明细135和业务参考数据140,并生成指定为活动信号数据(ASD)160和分数 165的数据。

应收账款130从一个多元化的企业为其他企业提供的商品、服务或信贷的业务中产生。 关于相关企业的应收账款130从产品或服务的供应商及相关公司获得。例如,假设公司B是 商品或服务的供应商公司。公司B将显示一个应收账款到期金额。在实践中,可能会有许多 公司提供商品或服务的公司,公司应收账款数据包括许多公司应收账款数据。

交易明细135相关公司的其他数据,并可能来源于应收账130。交易明细135的例子 包括在过去六个月到期的账户数量以及所欠的总量。

业务参考数据140,描述了一个生意。例如,对于一个主体业务,业务参考数据140 将包括一个唯一标识符的主体业务,业务信息、财务报表和传统的贸易数据。。数据通用编号 系统(DUNS)数量可以作为这样一个唯一的标识符。业务信息包括员工数量,业务年限,行业 等,如零售,业务分类在该行业中。财务报表是财务信息,如速动比率,即(流动资产-存货)/ 流动负债,负债总额。传统贸易数据信息,如逾期30天以上的数量,数量付款逾期30天以 上的经验,和令人满意的支付经验数量。

ASD 160是关于公司的信息,该信息源自数据源145中的数据。一般来说ASD 160表 示一个公司与其他相关公司在同一水平上的推进活跃性。

分数165是一个可行性评级。

交易明细135,业务参考140,ASD 160和分数165都存储在一个或多个数据库中。 该一个或多个数据库可以被配置为一个单一的存储设备,或作为具有多个独立存储设备的分 布式存储系统。尽管在系统100的一个或多个数据库显示为直接结合到计算机105,他们可 以远离计算机105并通过网络150连接到计算机105。

计算机105包括一个用户界面110、处理器115,内存120结合处理器115。尽管在此 显示的计算机105是一个独立的设备,它并不局限于此,而是可以被结合到分布式处理系统 中的其他设备(图中未显示)。用户界面110包括一个输入设备,如键盘或语音识别子系统,使 用户能够向处理器115传递信息和命令选择。

用户界面110还包括一个输出设备,例如显示器或打印机,或语音合成器。光标控制, 如鼠标、操纵杆或跟踪器,使用户能够操纵显示器上的光标,向处理器115传递额外的信息 交流和命令选择。处理器115配置有逻辑电路的电子设备,该逻辑电路响应并执行指令。内 存120是一个实实在在的计算机可读存储设备,该设备由计算机程序编码。在这方面,内存 120存储了数据和指令,即,程序代码,为了控制处理器115的运作,该数据和指令可由控 制处理器115读出和执行。内存120可以在随机存取存储器(RAM)、硬盘、只读存储器(ROM) 或它们的组合中实施。内存120的一个组件是处理模块125。

处理模块125是一个指令模块,可以被处理器115读出,并且控制处理器115进行生 意评分,即通过行为不良的概率评估生意,该概率被转化成不良分数,即分数165。处理模 块125输出结果到用户界面110,也可以通过网络150直接输出到远程设备(没有显示)。在 当前文件中,我们描述了处理模块125执行的操作或其后续处理。然而,实际上是由计算机 10操作的,更具体地说是处理器115。

使用术语“模块”在此表示一个函数运算,可以体现作为一个独立的组件或作为一个 多个附属组件的集成配置。因此,处理模块125可以作为一个单一的模块或相互合作的多个 模块被执行。此外,尽管文中所述处理模块125是被安装在内存120中,并且因此在软件执 行,但是它可以在任何的硬件(如电子电路)、固件、软件或它们的组合中被执行。

尽管指出的处理模块125已经加载到内存120中,它可以被配置在存储设备199上, 用于后续加载到内存120中。存储设备199是一个实实在在的计算机可读存储介质,在其上 存储了处理模块125。存储设备199的例子包括光盘、磁带,只读存储器,光学存储介质, 硬盘或多个并行的硬盘驱动器组成的内存单元,一级一个通用串行总线(USB)闪存驱动器。另 外,存储设备199可以是随机存取存储器,或其它类型的电子存储设备,位于远程存储系统 中,并通过网络150连接到计算机105。

实践中数据源145,应收账款130,交易明细135和业务参考数据140将包含数据代 表很多,例如数以百万计的数据项。因此,在实践中,一个人无法处理的数据,但相反,需 要计算机,例如计算机105。图IB是处理模块125的框图。处理模块125包括几个下属模 块,即一个活跃性信号数据(ASD)发生器205,应收账户(A/R)处理210,模型生成器215, 评分过程220。简而言之:(a)ASD发生器205分析数据源145中的数据,并产生ASD 160, 正如上面提到的,关于主体业务,表明与其他同行相比有关主体业务的处理活跃性水平; (b)A/R处理210分析主体业务供应商的应收账款数据130,产生权重,关于他们债务的付款 的主体业务是否状况良好或者在账单的偿付方面行为不良;(c)模型生成器215处理各种业务 数据,是ASD 160以及A/R处理210的加权,以及以A/R处理210为基础的加权,生成 一个模型用于业务的评分;(d)评分过程220利用模型生成器215的模型,以产生分数165。

每一个ASD发生器205,A/R处理210,模型生成器215,评分过程220将进一步详 细地描述如下。

图1c是ASD发生器205的框图,,正如上面提到的,分析数据源145的数据,并产 生ASD160。ASD发生器205包含一个匹配过程305,一个记录过程310,和一个整合器315。 数据源145,如前所述,是实体,组织,或程序,提供了信息,即有关业务的数据。数据的 格式不是特别相关于操作系统100,但是为了示例,我们将假定数据被组织成记录。描述符 301是这种记录的例子,并包含数据,该数据描述了公司的各个方面,例如,姓名、地址和 电话号码。在实践中,描述符301可以包括许多这样的方面。

匹配过程305,从数据源145接收或以其他方式获得描述符301,描述符301匹配数 据业务参考数据140中的数据。业务参考数据140,正如上面提到的,是描述了一个公司数 据。业务参考数据140被组织成记录。记录340,是一个代表性的例子。记录340包括一个 唯一的标识符341,业务信息342、财务报表343,和传统的贸易数据344。此处使用的匹配 意味着在数据存储设备中搜索数据,例如数据库中搜索记录,最佳匹配给定的查询。因此, 匹配过程305搜索业务参考数据140,以找到最佳匹配描述符301的数据。一个最佳匹配不 一定是正确匹配,因此,一旦找到一个匹配,匹配过程305还提供了一个信任代码,该代码 表示匹配的信任代码的水平是正确的。例如,信任代码可以表示匹配几乎是绝对正确的,并 且信任代码可以表明这场匹配有一个相对较低的可能性是正确的。

匹配过程305,一旦找到一个匹配,产生一个信号306,其中包括:(a)识别的源数 据接收;(b)一段时间(包括日期)的匹配;(c)唯一的标识符341;(d)信任代码。

记录过程310接收信号306,输入到一个日志中,此处指定为元数据320。表2列出 了一些示例性的元数据320。

表二

示例性的元数据320

例如,表2第1行显示匹配过程305产生第一信号,即信号1,表明305匹配过程,在时间 t0,与数据源145–2到业务参考数据140中的一个描述符301相匹配。匹配表明,描述符 301涉及由唯一标识符00000001标识的业务,和匹配信任代码2。在实践中,元数据320将 包含数百万行数据。

整合器315整合元数据320中的数据以产生ASD 160。更具体地说,整合器315考虑了在一 段时间内的元数据320,即,时间312,并且对于每一个唯一的标识符,该标识符维持了总共 5个信号,以及信任代码大于或等于阈值313的匹配总数。因此,主题业务,ASD 160包括, 唯一的标识符330,大量的信号335和信任代码(CC)匹配336。信号335的数量是特定唯一标 识符的信号的总数,该唯一标识符在时间312中被匹配。CC匹配336是那些具有不少于阈值 313的信任代码的匹配。例如,参考表2,假设时间312定义了从t0到t4的一段时间,并且 阈值313定义阈值3。表3为ASD160列出了相应的数据。

表3

典型的ASD 160数据

表3显示,从t0到t4的一段时间,为唯一标识符00000001,总共有3个信号(见表1,信号1, 3,4),而这三个信号中的两个是为了匹配,该匹配具有大于或等于3的信任代码(见表2、3 和4行)。虽然表3没有显示,ASD 160可以包括其他来源于信号306的信息,例如数据源145 的识别,该数据源导致最大数量的匹配,该匹配具有大于或等于阈值313的信心代码。在实 践中,时间312具有能使ASD发生器20收集大量事件的时间长度,比如12个月。因此, ASD 160将包括很多,例如数百万行的数据。

图2是一个可行性评级评分过程的流程图,在此被指定为方法200。方法200从步骤 202开始。在步骤202,计算机805接收数据库840,为公司记录评分。在步骤204中,公 司通过实体匹配过程。在步骤206中,匹配的公司转到步骤208。在步骤210不匹配的记录 会得到零分在步骤212中,数据被附加到图1列出的记录数据源中的数据。在步骤214中检 查公司的可用性和排除规则。在步骤216中,基于记录记录数据并评估模型选择。模型选择 取决于数据的可用性及其深度。例如,如果记录从财务报表中有足够的信息,它将通过FN 部分。如果记录没有有形贸易活跃性,它将通过NT部分和基于企业统计结构,智能引擎信 号或其他可用的数据被评估。在步骤218,记录将会通过赋值点,该赋值点每个数据源中预 测因子的值。预测因子的选择是基于合格记录部分。

在评分过程中,步骤220,记录的点以得分和数据深度维度相加。记录前三个部分被 评分。

接下来,在步骤222中,公司经过一系列的查询来检查业务调整,包括,但不限于, 特殊的类别,例如,高风险情况或歇业。评级基于公司分类的特殊类别调整。调整规则有限 关注有关可行性的已知信息的总体影响。基于步骤222的结果,在步骤224中进行最终评分 并分配评级部分的赋值。如果公司没有资格获得任何调整,它获得的分数与在步骤220中获 得的一样。如果公司有资格调整分数,它保留从步骤222开始获得的分数。在最终得分模块, 步骤224中定义评级的人口部分。图3是一个对可行性评级的数据深度部分的描述。图4 是一个对可行性评级的公司概况部分的描述。图5是一个方法的描述,通过该方法记分卡的 四个部分被用于产生可行性评级。模块502中选择企业标识记录以进行评分。数据元素被附 加到记录。在步骤504的过程中,模型选择、记录经过一系列的查询来确定应该经过哪些模 型段。在这种特殊情况下,公司具有财务报表中的数据,该数据使它能够通过FN模型(步骤 506)。步骤508–514总结每个数据源中的可行性和数据深度点,从而生成一个可行性分数 516,和数据深度分数518。

在步骤520中,为人口部分赋值。基于可行性分数516中的得分点计算可行性评分和 投资组合比较。在步骤522中为两个可行性部分进行可行性到评级的映射。在步骤514中, 数据深度的得分点被映射到数据深度评级。在步骤526中,基于特殊类别调整记录,其中可 能包括,但不限于,歇业或高度风险的情况。在这个例子中,记录不符合任何调整和进步到 步骤528。在步骤528中,呈现出最终可行性评级或输出给用户。记录项目分别在骤520,522 和524中进行评分。图6显示了第一个部分的值—可行性评分,这里以评级规模1-9为例。 由不良率决定每个类别的中断。评级值越高,业务的风险更大。用户将尽量避免“不良”的 生意。生意不太可能是可行的,同时也不是最终避免良好的生意。在这个例子中显示,整体 不良率是19.9%。不使用这个解决方案生意会最终在他们的投资组合中以19.9%不良率终止。 通过使用该公开文本的方法,用户可以避免具有较高不良率的部分9和8高,并且规避做风 险更大的记录部分的生意。该公开文本的可行性评级的使用案例有很多—从风险评估以供应 链分析到预先筛选的市场使用或改进的目标。

例如,一家大银行试图扩大其贷款组合。使用该公开文本的可行性评级,该行发现, 这种可行性评级确定了响应率高于传统评级系统四倍的部分。

尽管我们根据我们的公开文本展示并描述了几个实施例,要清楚地了解对于本领域的 技术人员来说同样的实施例可能有许多变化。因此,我们不希望限制显示和描述的细节,而 打算在附加的权利要求范围内显示所有更改和修改。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号