公开/公告号CN112396479A
专利类型发明专利
公开/公告日2021-02-23
原文格式PDF
申请/专利权人 成都晓多科技有限公司;
申请/专利号CN202110073933.3
申请日2021-01-20
分类号G06Q30/02(20120101);G06F16/36(20190101);
代理机构51217 成都睿道专利代理事务所(普通合伙);
代理人薛波
地址 610000 四川省成都市天府新区兴隆街道湖畔路西段123号
入库时间 2023-06-19 10:00:31
技术领域
本发明涉及电子商务技术领域,具体而言,涉及一种基于知识图谱的服饰搭配推荐方法及系统。
背景技术
目前,服装的搭配主要还是靠人来完成,虽然由人来完成服装组合配置能解决一部分的服装搭配问题,但是这无疑是一件费时且难度较大的工作,同时要求配置人员具有专业搭配知识。因此,如何自动的生成相对合理的商品搭配组合成为目前亟待解决的问题。现有的智能服装搭配推荐方法主要有两种形式:1)基于数据挖掘;2)基于深度学习模型。其中,基于数据挖掘的方法从用户的购买历史中挖掘频繁共现的商品,将这种频繁共现的商品作为搭配商品,例如”T恤和牛仔裤”。该方法是在历史订单数据中进行挖掘,方法简单有效。但对于新上市的商品,该方法无法获得其搭配商品。基于深度学习的方法采用神经网络分别提取两个商品的特征向量然后计算其向量的搭配概率。这类方法的关键在于特征的提取,目前的研究中主要存在三种方法:通过图片提取特征、通过标题提取特征和结合两种方式提取特征。但是,现有方法仍然易受外部噪声的影响,降低了匹配准确率。
发明内容
本发明的目的在于提供一种基于知识图谱的服饰搭配推荐方法及系统,用以实现提高服饰搭配推荐准确率的技术效果。
第一方面,本发明提供了一种基于知识图谱的服饰搭配推荐方法,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱;
通过TransH模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
获取查询商品的标题表示向量
根据所述标题表示向量
根据所述注意力向量
进一步地,所述方法还包括:通过目标函数对所述TransH 模型进行优化,其中目标函数为:
式中,
进一步地,所述注意力向量
式中,
进一步地,所述注意力向量
式中,
进一步地,所述注意力向量
式中,
进一步地,所述搭配概率的计算方式为:
式中,
进一步地,所述方法还包括:利用构建的训练数据集进行训练,最小化交叉熵损失函数
式中,
进一步地,所述数据集至少包括中文数据集和英文数据集。
第二方面,本发明提供了一种基于知识图谱的服饰搭配推荐系统,包括:
知识图谱构建模块,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱;
知识图谱表示学习模块,用于通过TransH 模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
商品表示向量获取模块,用于获取查询商品的标题表示向量
注意力分析模块,用于根据所述标题表示向量
搭配推荐模块,根据所述注意力向量
本发明能够实现的有益效果是:本发明提供的基于知识图谱的服饰搭配推荐方法通过构建的知识图谱进行表示学习,得到知识图谱中各个商品的实体表示向量和类别表示向量;然后通过注意力模型对获取到的查询商品的标题表示向量、候选商品的标题表示向量以及知识图谱中候选商品的实体表示向量和类别表示向量进行计算,得到查询商品的标题表示向量与候选商品各类表示向量的匹配概率;然后通过该匹配概率再进一步分析得到查询商品与候选商品的搭配概率,并将搭配概率最高的商品推荐给客户,提高了服饰搭配推荐的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种基于知识图谱的服饰搭配推荐方法流程示意图;
图2为本发明实施例提供的一种基于知识图谱的服饰搭配推荐系统拓扑结构示意图。
图标:10-服饰搭配推荐系统;100-知识图谱构建模块;200-知识图谱表示学习模块;300-商品表示向量获取模块;400-注意力分析模块;500-搭配推荐模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参看图1,图1为本发明实施例提供的一种基于知识图谱的服饰搭配推荐方法流程示意图。
经申请人研究发现,近年来随着深度学习的发展,出现了许多基于深度学习的方法,其主要思路是采用神经网络分别提取两个商品的特征向量然后计算其向量的搭配概率。这类方法的关键在于特征的提取,目前的研究中主要存在三种方法:通过图片提取特征,通过标题提取特征和结合两种方式提取特征。但是现有的各种方法的进行服装搭配时易受外部噪声的影响,降低了准确率。所以本发明实施例提供了一种基于知识图谱的服饰搭配推荐方法,其具体内容如下所述。
步骤S101,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱。
在一种实施方式中,商品以及商品的类别信息构成了商品的基本知识图谱,该图谱中体现了商品间关系;例如两个商品属于同一类,则这个两个商品在知识图谱中会与同一个节点相连接,这两个商品应当具有更高的相似度。同时,用户的购买记录可以体现商品的另一种关系——用户与商品的关系,例如商品总是被某些用户共同购买则这两个商品可能具有某种相同的特征,其相似度也应当更高。因此,本发明提供的实施例按照用户、商品、类别三个实体以及购买和属于两种关系构建商品知识图谱。其中,“购买”关系表示用户与商品之前的关系,而“属于”关系是商品与类别的关系。
步骤S102,通过TransH模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量。
在TransH 模型中,实体和关系被表示为低维稠密向量。本发明把知识图谱表示为三元组(
式中,
通过TransH 模型对商品知识图谱进行表示学习,即可得到商品知识图谱嵌入矩阵
通过上述方式,一个实体在不同的关系下拥有不同的表示,解决了知识图谱中的一对多和多对一的关系问题。
步骤S103,获取查询商品的标题表示向量
在一种实施方式中,本发明提供的实施例通过双向LSTM获取查询商品以及候选商品的标题表示向量;其中,查询商品的标题表示向量为
具体地,标题表示向量
假定某查询商品q的标题长度为n,其词向量表达式为:
其中,
最终,通过concatenate函数处理每个
通过双向LSTM编码后,该查询商品q的标题表示矩阵表示为:
式中,
步骤S104,根据所述标题表示向量
在一种实施方式中,注意力向量
式中,
在一种实施方式中,注意力向量
式中,
在一种实施方式中,注意力向量
式中,
步骤S105,根据所述注意力向量
在一种实施方式中,搭配概率的计算方式为:
搭配概率的计算方式为:
式中,
在一种实施方式中,本发明实施例提供的方法还包括利用构建的训练数据集进行训练,最小化交叉熵损失函数
式中,
进一步地,为了提高服装搭配的适用范围,训练数据集至少可以包括中文数据集和英文数据集。通过上述方式,可以进一步提高服装的匹配准确率。
示例性地,本发明实施例选用Taobao数据集和Amazon数据集进行训练,Taobao数据集为中文数据集,其数据主要来自于淘宝网。数据集包括专家标记的搭配数据、商品的信息(包括商品标题,图片,类别等)和用户的购买历史数据。在构建知识图谱时我们选择了有多次购买记录的用户。Amazon数据集为英文数据集,其数据来自于亚马逊购物网站,本发明实施例用该数据集中的‘Also Bought’数据作为搭配商品的来源,将出现在某商品
表1
在对商品知识图谱进行表示学习时,从用户历史订单中过滤掉只有少量(小于3次)购买记录的用户,最终生成实体和三元组的情况如表2所示。在此三元组的基础上,本发明采用TransH 模型训练工具生成实体的知识图谱嵌入向量,设定向量维度
表2
从人工标记的搭配数据集中生成商品的搭配关系,同时随机的选择未在该商品搭配商品集中的商品作为负样本,负样本与正样本的比例为50:50。然后按照80:10:10的比例将整个数据划分为训练集、测试集和验证集。在模型训练中采用Adam优化器,以及0.001的学习率,词向量维度,
为了更全面的比较,本发明实施例选择了2类方法作为基线模型:基于图片搭配匹配方法和基于标题的搭配匹配方法。
(1)基于商品图片的方法:
CNN-Image-CM:该模型是一个基于孪生卷积神经网络的端到端的分类模型,采用Google Net作为Taobao数据集的特征提取网络;在Amazon数据集上使用Alex Net作为特征提取网络。
(2)基于商品标题的方法
DCNN-Title-CM: 该方法将两个商品标题送入孪生多层动态卷积网络,该网络采用宽卷积和k-max pooling方法提取特征,再将两个商品的特征映射到新的样式空间计算搭配概率。
TextCNN-Title-CM: 该方法采用TextCNN方法用于提取商品标题文字特征,再将两个商品的特征映射到新的样式空间计算搭配概率。
CNN-Title-CM: 通过孪生卷积神经网络来提取搭配的两个商品的标题特征,然后将特征映射到样式空间,最终计算搭配概率。
LSTM-Title-CM:该方法通过孪生的LSTM来提取标题特征再映射到样式空间计算搭配概率。
通过上述多种方法与本发明的方法进行处理得到的结果如表3所示。
表3
从上述内容可以看出,本发明提供的基于知识图谱的服饰搭配推荐方法在推荐的准确性更高。
请查看图2,图2为本发明实施例提供的一种基于知识图谱的服饰搭配推荐系统拓扑结构示意图。
本发明实施例还提供了一种基于知识图谱的服饰搭配推荐系统10,用于实现上述的方法,包括:
知识图谱构建模块100,获取用户历史订单数据和商品类别信息,并根据用户历史订单数据和商品类别信息构建商品知识图谱;
知识图谱表示学习模块200,用于通过TransH 模型对商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
商品表示向量获取模块300,用于获取查询商品的标题表示向量
注意力分析模块400,用于根据标题表示向量
搭配推荐模块500,根据注意力向量
综上所述,本发明实施例提供一种基于知识图谱的服饰搭配推荐方法及系统,包括获取用户历史订单数据和商品类别信息,并根据用户历史订单数据和商品类别信息构建商品知识图谱;通过TransH模型对商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;获取查询商品的标题表示向量
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
机译: 一种基于多准则粗糙-模糊方法的基于用户偏好的推荐方法和系统
机译: 一种基于第二用户的观看活动向第一用户推荐媒体资产以包括在第二用户的播放列表中的方法和系统
机译: 一种基于另一媒体资产的内容向用户推荐媒体资产的方法和系统