首页> 中国专利> 一种基于客户群体特征的商户竞合关系分析的方法和装置

一种基于客户群体特征的商户竞合关系分析的方法和装置

摘要

本发明实施例涉及数据挖掘领域,尤其涉及一种基于客户群体特征的商户竞合关系分析的方法和装置,用于提高分析商户竞合关系的准确性。本发明实施例中,统计出多条客户交易记录对应的多个客户标识,对多个客户标识进行分类获得N个客户集合;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据上述内容确定第一商户和第二商户之间的竞争关系。

著录项

  • 公开/公告号CN106779843A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 中国银联股份有限公司;

    申请/专利号CN201611161103.1

  • 发明设计人 王臻;何朔;刘国宝;何东杰;王琪;

    申请日2016-12-15

  • 分类号G06Q30/02;

  • 代理机构北京同达信恒知识产权代理有限公司;

  • 代理人黄志华

  • 地址 200135 上海市浦东新区含笑路36号

  • 入库时间 2023-06-19 02:19:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-11

    授权

    授权

  • 2017-06-23

    实质审查的生效 IPC(主分类):G06Q30/02 申请日:20161215

    实质审查的生效

  • 2017-05-31

    公开

    公开

说明书

技术领域

本发明实施例涉及数据挖掘领域,尤其涉及一种基于客户群体特征的商户竞合关系分析的方法和装置。

背景技术

现有技术中,由于商户只能通过自身的销售系统获取单一的自身商户的客户信息,因此无法用客户交易信息来全面分析与其它商户的竞合关系。

目前,可通过问卷调查等方式来了解商户自身在本行业的位置和竞合关系,但是通过此方式前期投入大,如需要投入大量的人力和物力,而且得到的结果可信度比较低。但是随着人们消费观念的逐步更新,刷卡或电子支付越来越受到客户的青睐,在很多商户中,刷卡或电子支付占很大的比重。

综上,亟需一种基于客户群体特征的商户竞合关系分析的方案,用于提高分析商户竞合关系的准确性。

发明内容

本发明实施例提供了一种基于客户群体特征的商户竞合关系分析的方法和装置,用于提高分析商户竞合关系的准确性。

本发明实施例提供一种基于客户群体特征的商户竞合关系分析的方法,包括:获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。

可选地,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;可选地,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合,包括:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。

可选地,根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系,包括:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。

可选地,根据相似度确定确定第一商户和第二商户之间的竞争关系,包括:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。

可选地,在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系,包括:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。

可选地,获取M个商户对应的多条客户交易记录,包括:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。

本发明实施例提供一种一种基于客户群体特征的商户竞合关系分析的装置,包括:获取单元,用于获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;统计单元,用于统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;处理单元,用于根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。

可选地,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;处理单元,用于:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。

可选地,处理单元,用于:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。

可选地,还包括处理单元,用于:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。

可选地,处理单元,用于:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。

可选地,获取单元,用于:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;

处理单元,用于:对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。

由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。

图1为本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的方法流程示意图;

图2为本发明实施例提供的另一种基于客户群体特征的商户竞合关系分析的方法流程示意图;

图3为本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1示例性示出了本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的方法流程示意图,如图2所示,该基于客户群体特征的商户竞合关系分析的方法包括以下步骤:

步骤101,获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;

步骤102,统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;

步骤103,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;

步骤104,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;

步骤105,根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。

由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。

可选地,本发明实施例中获取M个商户对应的多条客户交易记录,包括:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。

可选地,为了保证获得的交易记录的可靠性,将获得的交易记录中数据进行筛选,去除无效的客户交易记录,无效的交易记录包括交易记录标识为失败的交易记录、交易记录标识为存在欺诈的交易记录、交易记录标识为套现的交易记录。

可选地,本发明实施例中,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合,包括:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。

可选地,客户的消费信息包括客户的卡号、消费金额、消费所在的商户标识,消费时间,购买的产品、产品的单价、购买的数量、消费的总金额等信息;根据客户交易属性信息的特点,可以将客户进行分类;可选地,可以将客户分为不经常变化的数据集合,反映客户的一些基本属性信息的集合,如客户的自然属性的集合;也可以将客户分为随时间变化的数据集合,主要是客户与商户之间进行交易或其他交互所积累的数据,这些交易记录详细记录了客户和商户之间的整个交易过程,反映了客户的消费习惯等信息,可以为客户消费属性。本发明实施例中,将客户分为N个集合时,既包括客户的自然属性,又包括客户的消费属性,比如,首先从客户的交易属性信息中提取客户的消费属性特征作为聚类的向量,对客户聚类,然后应用特征提取方法从客户交易属性信息中选择客户的自然属性作为分类变量;将客户交易属性中随时间变化的特征聚类的结果与客户的自然属性相结合对客户进行分类。可选地,分类包括聚类,以及一般的分类方法,聚类能帮助市场分析人员从客户交易记录中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征;如此,由于在客户的分类过程中包含了大量的客户交易记录,因此,可提高分类的全面性。

可选地,根据客户的交易属性信息的趋势、平均值、方差、偏度、峰度来描述客户的交易属性,如此,既降低了数据分析的维度,又描述了交易属性的统计特征;结合统计的客户的交易属性特征和客户的自然属性特征,获得客户的特征矩阵X,其中,特征矩阵的每一行代表一个客户的交易属性信息,每一列代表一个特征属性。

可选地,趋势特征是交易属性较常用的特征,反映了客户消费的长期变化趋势,可采用公式(1)计算获得:

在公式(1)中,xi表示客户第i次消费的消费时间,yi表示客户第i次消费的消费金额,n表示客户消费的次数;μ表示趋势特征;i表示第i次进行消费,取值为大于等于1的整数。

可选地,平均值反映了客户购买产品消费的金额,可采用公式(2)计算获得:

在公式(2)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数,Г表示平均值,i表示第i次进行消费,取值为大于等于1的整数。

可选地,方差反映了客户购买产品的波动程度,可采用公式(3)计算获得:

在公式(3)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数,σ表示方差,即客户购买产品的波动程度,i表示第i次进行消费,取值为大于等于1的整数。

可选地,偏度衡量数据的分布相对于中心点是否看起来一致,即交易的值相对于平均值的对称程度,可采用公式(4)计算获得:

在公式(4)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数;μ表示趋势特征,σ表示方差,S表示偏度,即客户购买产品的波动程度,i表示第i次进行消费,取值为大于等于1的整数。

可选地,峰度是数据分布集中趋势的高峰的形状,这里表示交易属性的数据分布相对于正态分布来讲是平坦还是具有尖峰,如果数据分布具有高的峰度系统,则通常会在君子附近有明显的尖峰,并且以较高的速度下降,峰度对于标准正态分布是3,因此,峰度系数可用公式(5)计算:

在公式(5)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数;μ表示趋势特征,σ表示方差,K表示峰度,i表示第i次进行消费,取值为大于等于1的整数。

可选地,频次表示客户消费的频率,可采用公式(6)计算:

在公式(6)中,Tt表示客户第i次消费的开始日期,Ts表示客户第i次消费的结束日期,n表示客户消费的次数,i表示第i次进行消费,取值为大于等于1的整数。

为了不使个别特征统治聚类结果,消除由于特征取值范围不同造成的影响,对上述特征进行标准化,按公式(7)进行标准化:

在公式(7)中,X表示每个特征,Y表示进行标准化后的特征,σ表示方差,μ表示趋势特征.

可选地,对标准化之后的数据使用特征降维(Principal Component Analysis,简称PCA)进行降维,形成客户特征矩阵X;之后使用K-Means算法将客户分为N个集合,即获得N个客户群体g1,g2,g3…..gn,由于K-Means算法接收输入量K,然后将n个数据划分为K个聚类以便使得获得的聚类满足:统一聚类中的对象相似度较高,而不同聚类中的对象相似度较低,即群体g1,g2,g3…..gn,群体内的特征非常接近,但群与群之间的特征差异非常大;上述分群操作包括但不限于此。

可选地,根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系,包括:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。

可选地,假设获取的M个商户为商户i、商户j、商户k,根据商户i、商户j、商户k中的多条客户交易记录的交易属性信息。获得3个客户群,分别客群体g1,客户群体g2,客户群体g3,统计商户i中的客户数量在客户群体g1中客户数量的占比,用表示,商户i中的客户数量在客户群体g2中客户数量的占比,用表示,商户i中的客户数量在客户群体g2中客户数量的占比,用表示;使用同样的方法统计出商户j中的客户数量在客群体g1,客户群体g2,客户群体g3中的客户数量的占比,分别用表示;商户k中的客户数量在客在客群体g1,客户群体g2,客户群体g3中的客户数量的占比,分别用表示;获得的占比构成占比矩阵R,占比矩阵R中的每一行表示同一个商户的客户数量在不同的群体中的客户数量占的比例,每一列表示不同的商户的客户数量在同一个客户群中客户数量的占比;

可选地,根据占比矩阵确定出每个商户的总占比,商户i的总占比向量为:商户j的总占比向量为:商户k的总占比向量为:

可选地,根据总的占比向量确定出任意两个商户的相似度,使用向量余弦相似度来衡量,根据向量余弦相似度公式:

在公式(8)中,Si,j表示商户i和商户j的相似度,表示商户i的总占比向量,表示商户j的总占比向量。

其中,余弦值Si,j的值越接近1,表明的夹角越接近零度,也就是越接近,夹角等于零的时候,两个向量完全一样,因此,余弦值Si,j越大越相似。

可选地,对每两个商户使用余弦相似度公式计算出相似度后,可转化为相似度矩阵S。

可选地,对于相似度的计算包括使用余弦相似度公式计算,但不限于此,比如,可以使用Tanimoto系数计算:

在公式(9)中,Si,j表示商户i和商户j的相似度,表示商户i的总占比向量,表示商户j的总占比向量;

其中,Ti,j的范围[0,1],完全相同的时候为Ti,j=1,没有相似的为Ti,j=0,越接近1相似度越高。

可选地,根据相似度确定确定第一商户和第二商户之间的竞争关系,包括:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。

可选地,根据业务需求,确定相似度第一阈值,根据任意两个商户之间的相似度阈值和是否属于同一行业,可以确定出两个商户之间是否为竞争关系,或者合作关系。

可选地,根据结果真值表来确定两个商户之间的竞合关系,表1为结果真值表:

表1:结果真值表:

相似度是否大于第一阈值是否属于同一行业预计竞合关系竞争关系合作关系合作关系未知

可选地,在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系,包括:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。

可选地,在确定任意两个商户之间为竞争关系之后,根据根据业务需求,确定出第二阈值,比较两个商户之间的相似度与第二阈值的大小关系,在确定两个商户之间的相似度大于第二阈值的情况下,说明两个商户之间存在强竞争关系,如此,通过自动的方式方便快捷的获取到商户间竞合关系,为商户做出决策时提供了可靠的数据支持。

可选地,为了便于展示结果,将相似度按照如下公式二值化:

在公式(10)中,Si,j表示商户i和商户j的相似度,K为第二阈值;通过二值化的方式,可更加方便的展示商户间的竞合关系。

需要说明的一点是:上述针对基于客户群体特征的商户间竞合关系的分析过程的说明仅是示例性和解释性的,并不用于限定本发明。

为了更清楚的介绍上述方法流程,图2示例性示出了本发明实施例提供的另一种基于客户群体特征的商户竞合关系分析的方法。该分析方法可以在银联的后台系统进行分析,而且基于客户群体特征分析商户竞合关系,可提高分析商户竞合关系的准确性和全面性。基于客户群体特征的商户竞合关系分析的过程见下述内容。

如图2所示,该方法包括:

步骤201,接收输入的查询指令;其中,查询指令包括查询时间段,待查询的M个商户标识;

步骤202,获取待查询的M个商户;

步骤203,获取预设时间段内M个商户中每个商户对应的所有客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;

步骤204,对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录;

步骤205,统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;

步骤206,根据多条客户交易记录中每条客户交易记录的交易属性信息,获取客户交易的消费频次、均值、趋势、方差、偏度、峰度;

步骤207,根据客户交易的消费频次、均值、趋势、方差、偏度、峰度;使用K-Means算法对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;

步骤208,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;

步骤209,根据计算出的第一数量在该客户集合的所有客户标识的数量中的第一占比,确定出第一商户的第一总占比;以及计算出的第二数量在该客户集合的所有客户标识的数量中的第二占比,确定出第二商户的第二总占比;

步骤210,根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;

步骤211,判断第一商户和第二商户是否满足相似度大于第一阈值且属于同一行业,若均满足,则执行步骤212;若至少一个满足,则执行步骤213

步骤212,确定第一商户和第二商户为竞争关系;

可选地,在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系。

步骤213,确定第一商户和第二商户为合作关系或者不确定第一商户和第二商户之间的竞合关系;

可选地,第一商户和第二商户之间若满足相似度大于第一阈值或者属于同一行业两个条件中的任一个,则可确定第一商户和第二商户之间为合作关系,若不满足相似度大于第一阈值且不属于同一行业两个条件,则第一商户和第二商户之间的竞合关系为未知;

可选地,在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;

可选地,在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系;

步骤214,在步骤212之后,判断第一商户和第二商户和相似度是否大于第二阈值,若是,则执行步骤215;若否,则执行步骤216;

步骤215,确定第一商户和第二商户为强竞争关系;

步骤216;确定第一商户和第二商户为普通竞争关系;

可选地,在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系;

可选地,在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;

可选地,对M个商户的竞合关系进行可视化处理;即将M个商户的竞合关系以图形或者图像的形式展示出来。

从上述内容可以看出:本发明实施例中,由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。

图3示例性示出了本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的装置的结构示意图。

基于相同构思,本发明实施例提供一种基于客户群体特征的商户竞合关系分析的装置,如图3所示,一种基于客户群体特征的商户竞合关系分析的装置300包括获取单元301、统计单元302和处理单元303。其中:

获取单元,用于获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;统计单元,用于统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;处理单元,用于根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。

可选地,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;处理单元,用于:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。

可选地,处理单元,用于:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。

可选地,还包括处理单元,用于:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。

可选地,处理单元,用于:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。

可选地,获取单元,用于:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;

处理单元,用于:对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。

从上述内容可以看出:本发明实施例中,由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。

本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号