法律状态公告日
法律状态信息
法律状态
2022-05-24
授权
发明专利权授予
2022-03-08
实质审查的生效 IPC(主分类):H04W 4/029 专利申请号:2022100469413 申请日:20220117
实质审查的生效
技术领域
本发明涉及人物画像刻画技术领域,更具体的,涉及一种结合知识图谱的人物画像刻画方法、系统和可读存储介质。
背景技术
随着手机信令数据的大规模出现,可以通过移动大数据中蕴含的丰富的信息,包括移动用户的出行活动信息。来研究用户出行的轨迹信息。
通过将信令数据与POI数据和GIS数据结合,可以构建融合行政区划和场景信息的知识图谱,这样就可以进一步掌握用户的活动共性。通过发现并掌握移动用户的活动共性,可以服务于城市规划、旅游开发、交通建设等领域;通过用户的个性化活动信息,可用于对缺乏全局信息的用户进行身份推测。
发明内容
本发明的目的是提供一种结合知识图谱的人物画像刻画方法、系统和可读存储介质,可以基于知识图谱匹配用户的移动轨迹对其进行画像,以此得到多个用户对应的知识图谱场景信息,进而可以判断某用户与其他用户之间的亲疏关系,从而可以对用户画像进行更加细致的描述与场景显现。
本发明第一方面提供了一种结合知识图谱的人物画像刻画方法,包括以下步骤:
采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群;
识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱;
基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像;
基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像。
本方案中,所述采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群,具体包括:
基于移动运营商的信令数据采集对应所述用户的所述轨迹数据;
基于所述轨迹数据获取对应所述用户在预设时间内驻留过的各目标基站;
将各所述目标基站进行集合,得到所述用户驻留的所述基站群。
本方案中,所述识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱,具体包括:
根据各所述预设基站的经纬度得到所述坐标数据,其中,所述目标基站位于各所述预设基站的范围内;
结合预设的POI数据以及GIS数据,将每个所述预设基站与其所在地的物理场景进行匹配以得到各所述预设基站对应的所述场景数据;
基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱。
本方案中,所述基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱,具体包括:
以行政地名作为所述知识图谱的实体;
以地名与地名间的隶属关系作为所述知识图谱的相互关系;
将所述POI数据以及所述GIS数据作为所述场景信息添加到所述知识图谱中完成所述知识图谱的构建。
本方案中,所述基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像,具体包括:
提取所述轨迹数据中与所述知识图谱中各所述基站对应的所述场景信息;
将所述基站群用所述场景信息进行直观显示,以识别所述用户的所述空间画像。
本方案中,所述基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像,具体包括:
待所述知识图谱构建完成后,定义基层实体为子节点;
基于子节点以及所述相互关系识别父节点,其中,只有所述子节点没有所述父节点的所述实体定义为根节点,只有所述父节点没有所述子节点的所述实体定义为叶子节点;
获取全部节点中记录的信令轨迹数量与总轨迹数量的比值以得到所述用户对应的所述人物画像。
本发明第二方面还提供一种结合知识图谱的人物画像刻画系统,包括存储器和处理器,所述存储器中包括结合知识图谱的人物画像刻画方法程序,所述结合知识图谱的人物画像刻画方法程序被所述处理器执行时实现如下步骤:
采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群;
识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱;
基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像;
基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像。
本方案中,所述采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群,具体包括:
基于移动运营商的信令数据采集对应所述用户的所述轨迹数据;
基于所述轨迹数据获取对应所述用户在预设时间内驻留过的各目标基站;
将各所述目标基站进行集合,得到所述用户驻留的所述基站群。
本方案中,所述识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱,具体包括:
根据各所述预设基站的经纬度得到所述坐标数据,其中,所述目标基站位于各所述预设基站的范围内;
结合预设的POI数据以及GIS数据,将每个所述预设基站与其所在地的物理场景进行匹配以得到各所述预设基站对应的所述场景数据;
基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱。
本方案中,所述基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱,具体包括:
以行政地名作为所述知识图谱的实体;
以地名与地名间的隶属关系作为所述知识图谱的相互关系;
将所述POI数据以及所述GIS数据作为所述场景信息添加到所述知识图谱中完成所述知识图谱的构建。
本方案中,所述基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像,具体包括:
提取所述轨迹数据中与所述知识图谱中各所述基站对应的所述场景信息;
将所述基站群用所述场景信息进行直观显示,以识别所述用户的所述空间画像。
本方案中,所述基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像,具体包括:
待所述知识图谱构建完成后,定义基层实体为子节点;
基于子节点以及所述相互关系识别父节点,其中,只有所述子节点没有所述父节点的所述实体定义为根节点,只有所述父节点没有所述子节点的所述实体定义为叶子节点;
获取全部节点中记录的信令轨迹数量与总轨迹数量的比值以得到所述用户对应的所述人物画像。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括机器的一种结合知识图谱的人物画像刻画方法程序,所述结合知识图谱的人物画像刻画方法程序被处理器执行时,实现如上述任一项所述的一种结合知识图谱的人物画像刻画方法的步骤。
本发明公开的一种结合知识图谱的人物画像刻画方法、系统和可读存储介质,可以基于知识图谱匹配用户的移动轨迹对其进行画像,以此得到多个用户对应的知识图谱场景信息,进而可以判断某用户与其他用户之间的亲疏关系,从而可以对用户画像进行更加细致的描述与场景显现。
附图说明
图1示出了本发明一种结合知识图谱的人物画像刻画方法的流程图;
图2示出了本发明一种结合知识图谱的人物画像刻画系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
本发明以一个城市的移动用户为例,采用本发明的方法对该城市的移动用户进行画像,具体实现方式如下:其中,图1示出了本申请一种结合知识图谱的人物画像刻画方法的流程图。
如图1所示,本申请公开了一种结合知识图谱的人物画像刻画方法,包括以下步骤:
S102,采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群;
S104,识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱;
S106,基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像;
S108,基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像。
需要说明的是,首先采集所述用户对应的所述轨迹数据,获取其在所述预设时间内驻留过的所述基站群,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱,其中,所述预设时间可取一个自然日,根据每个所述基站的经纬度,结合所述POI数据以及所述GIS数据,将每个所述基站以及该所述基站对应所述知识图谱上的物理场景进行对应,将所述用户的移动轨迹中的每个所述基站与该所述基站的所述场景信息进行对应,可直观显示出每个所述用户的移动轨迹特征,从移动空间角度对用户进行画像以得到所述空间画像,进一步,基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像,其中,可将两个所述用户的知识图谱场景信息进行相似度计算,可以判断一个所述用户与其他所述用户间的亲疏关系,从而对用户画像进行更加细致的描述。
根据本发明实施例,所述采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群,具体包括:
基于移动运营商的信令数据采集对应所述用户的所述轨迹数据;
基于所述轨迹数据获取对应所述用户在预设时间内驻留过的各目标基站;
将各所述目标基站进行集合,得到所述用户驻留的所述基站群。
需要说明的是,所述信令数据包括:加密的用户手机号码-IMSI;位置区识别码lac,用于标识不同的位置区、基站编号;ci,与位置区识别码(lac)结合,用于识别网络中覆盖的小区;time_in,表示进入基站的时间;time_out,表示离开基站的时间;基于所述信令数据可以识别所述用户的所述轨迹数据,其中,所述轨迹数据记录了一条IMSI进入某个所述基站和离开对应所述基站的时间,从而可获取每个所述用户在所述预设时间内驻留过的所述目标基站,将该用户对应的所述目标基站进行集合可以得到所述用户驻留的所述基站群,其中,所述预设时间可以选择一个自然日。
根据本发明实施例,所述识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱,具体包括:
根据各所述预设基站的经纬度得到所述坐标数据,其中,所述目标基站位于各所述预设基站的范围内;
结合预设的POI数据以及GIS数据,将每个所述预设基站与其所在地的物理场景进行匹配以得到各所述预设基站对应的所述场景数据;
基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱。
需要说明的是,所述的POI数据,主要是指城市中的信息点(Points ofInformation,POI)或兴趣点(Points of Interest),包括一些与人们日常生活密切相关的活动场所或地点,主要划分为商务办公、公寓住宅、综合娱乐、商业零售、酒店餐饮、医疗服务、公共设施、旅游景点8个大类,每个大类下面再划分为若干个小类,并用多个字段对每个小类进行描述,字段包括名称,地址,邮编,经纬度,电话,所属区县,所属分类,所属细分类别等信息,具体实例如下表1所示:
表1. POI数据分类表
进一步地,所述的GIS,即地理信息系统,是指建立的地理数据库所需的各种数据的来源,主要包括地图、遥感数据、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等,其中地图数据、遥感数据、统计数据、实测数据等是GIS最主要的数据源,GIS对地理空间实体通常从空间、属性、时间等方面进行描述,本发明采用GIS数据对在地图上对基站位置进行标注,从而可以直观显示基站的位置。
根据本发明实施例,所述基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱,具体包括:
以行政地名作为所述知识图谱的实体;
以地名与地名间的隶属关系作为所述知识图谱的相互关系;
将所述POI数据以及所述GIS数据作为所述场景信息添加到所述知识图谱中完成所述知识图谱的构建。
需要说明的是,所述知识图谱的构建首先以所述行政地名作为所述知识图谱对应 的所述实体,以所述地名与地名间的隶属关系作为所述知识图谱对应的所述相互关系,再 将所述POI数据和所述GIS数据中的场景信息加入到所述知识图谱中,具体地,步骤如下:构 建具有场景信息的位置信息图谱(Location Knowledge Graph),包含实体{基站,行政规 划,场景信息},关系{坐落,隶属,附近存在有,属于},例如:
根据本发明实施例,所述基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像,具体包括:
提取所述轨迹数据中与所述知识图谱中各所述基站对应的所述场景信息;
将所述基站群用所述场景信息进行直观显示,以识别所述用户的所述空间画像。
需要说明的是,将所述用户对应的移动轨迹中的每个所述基站与该所述基站的所述场景信息进行对应,由此将一个所述用户每日所访问基站的记录转化为用户访问的场景记录,由此直观显示出每个用户的移动轨迹特征,进而从移动空间角度对用户进行画像。
根据本发明实施例,所述基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像,具体包括:
待所述知识图谱构建完成后,定义基层实体为子节点;
基于子节点以及所述相互关系识别父节点,其中,只有所述子节点没有所述父节点的所述实体定义为根节点,只有所述父节点没有所述子节点的所述实体定义为叶子节点;
获取全部节点中记录的信令轨迹数量与总轨迹数量的比值以得到所述用户对应的所述人物画像。
需要说明的是,具有所述场景信息的位置信息图谱构建完成后,我们定义所述基层实体为所述子节点,其中,被更多所述子节点所指向的节点为所述父节点,只有所述子节点没有所述父节点的对应所述实体为所述根节点,只有所述父节点没有所述子节点的对应所述实体为所述叶子节点。
进一步地,如果一个实体
图2示出了本发明一种结合知识图谱的人物画像刻画系统的框图。
如图2所示,本发明公开了一种结合知识图谱的人物画像刻画系统,包括存储器和处理器,所述存储器中包括结合知识图谱的人物画像刻画方法程序,所述结合知识图谱的人物画像刻画方法程序被所述处理器执行时实现如下步骤:
采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群;
识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱;
基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像;
基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像。
需要说明的是,首先采集所述用户对应的所述轨迹数据,获取其在所述预设时间内驻留过的所述基站群,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱,其中,所述预设时间可取一个自然日,根据每个所述基站的经纬度,结合所述POI数据以及所述GIS数据,将每个所述基站以及该所述基站对应所述知识图谱上的物理场景进行对应,将所述用户的移动轨迹中的每个所述基站与该所述基站的所述场景信息进行对应,可直观显示出每个所述用户的移动轨迹特征,从移动空间角度对用户进行画像以得到所述空间画像,进一步,基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像,其中,可将两个所述用户的知识图谱场景信息进行相似度计算,可以判断一个所述用户与其他所述用户间的亲疏关系,从而对用户画像进行更加细致的描述。
根据本发明实施例,所述采集用户的轨迹数据,基于所述轨迹数据识别用户驻留基站群,具体包括:
基于移动运营商的信令数据采集对应所述用户的所述轨迹数据;
基于所述轨迹数据获取对应所述用户在预设时间内驻留过的各目标基站;
将各所述目标基站进行集合,得到所述用户驻留的所述基站群。
需要说明的是,所述信令数据包括:加密的用户手机号码-IMSI;位置区识别码lac,用于标识不同的位置区、基站编号;ci,与位置区识别码(lac)结合,用于识别网络中覆盖的小区;time_in,表示进入基站的时间;time_out,表示离开基站的时间;基于所述信令数据可以识别所述用户的所述轨迹数据,其中,所述轨迹数据记录了一条IMSI进入某个所述基站和离开对应所述基站的时间,从而可获取每个所述用户在所述预设时间内驻留过的所述目标基站,将该用户对应的所述目标基站进行集合可以得到所述用户驻留的所述基站群,其中,所述预设时间可以选择一个自然日。
根据本发明实施例,所述识别各个预设基站的坐标数据,并基于各所述预设基站对应的场景数据进行标注,以构建所述知识图谱,具体包括:
根据各所述预设基站的经纬度得到所述坐标数据,其中,所述目标基站位于各所述预设基站的范围内;
结合预设的POI数据以及GIS数据,将每个所述预设基站与其所在地的物理场景进行匹配以得到各所述预设基站对应的所述场景数据;
基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱。
需要说明的是,所述的POI数据,主要是指城市中的信息点(Points ofInformation,POI)或兴趣点(Points of Interest),包括一些与人们日常生活密切相关的活动场所或地点,主要划分为商务办公、公寓住宅、综合娱乐、商业零售、酒店餐饮、医疗服务、公共设施、旅游景点8个大类,每个大类下面再划分为若干个小类,并用多个字段对每个小类进行描述,字段包括名称,地址,邮编,经纬度,电话,所属区县,所属分类,所属细分类别等信息,具体实例如下表1所示:
表1. POI数据分类表
进一步地,所述的GIS,即地理信息系统,是指建立的地理数据库所需的各种数据的来源,主要包括地图、遥感数据、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等,其中地图数据、遥感数据、统计数据、实测数据等是GIS最主要的数据源,GIS对地理空间实体通常从空间、属性、时间等方面进行描述,本发明采用GIS数据对在地图上对基站位置进行标注,从而可以直观显示基站的位置。
根据本发明实施例,所述基于所述场景数据对各所述预设基站进行标注,以构建具有场景信息的所述知识图谱,具体包括:
以行政地名作为所述知识图谱的实体;
以地名与地名间的隶属关系作为所述知识图谱的相互关系;
将所述POI数据以及所述GIS数据作为所述场景信息添加到所述知识图谱中完成所述知识图谱的构建。
需要说明的是,所述知识图谱的构建首先以所述行政地名作为所述知识图谱对应 的所述实体,以所述地名与地名间的隶属关系作为所述知识图谱对应的所述相互关系,再 将所述POI数据和所述GIS数据中的场景信息加入到所述知识图谱中,具体地,步骤如下:构 建具有场景信息的位置信息图谱(Location Knowledge Graph),包含实体{基站,行政规 划,场景信息},关系{坐落,隶属,附近存在有,属于},例如:
根据本发明实施例,所述基于所述轨迹数据对应所述知识图谱,识别所述用户的空间画像,具体包括:
提取所述轨迹数据中与所述知识图谱中各所述基站对应的所述场景信息;
将所述基站群用所述场景信息进行直观显示,以识别所述用户的所述空间画像。
需要说明的是,将所述用户对应的移动轨迹中的每个所述基站与该所述基站的所述场景信息进行对应,由此将一个所述用户每日所访问基站的记录转化为用户访问的场景记录,由此直观显示出每个用户的移动轨迹特征,进而从移动空间角度对用户进行画像。
根据本发明实施例,所述基于所述基站群对应的所述场景数据匹配所述知识图谱,以得到所述用户的人物画像,具体包括:
待所述知识图谱构建完成后,定义基层实体为子节点;
基于子节点以及所述相互关系识别父节点,其中,只有所述子节点没有所述父节点的所述实体定义为根节点,只有所述父节点没有所述子节点的所述实体定义为叶子节点;
获取全部节点中记录的信令轨迹数量与总轨迹数量的比值以得到所述用户对应的所述人物画像。
需要说明的是,具有所述场景信息的位置信息图谱构建完成后,我们定义所述基层实体为所述子节点,其中,被更多所述子节点所指向的节点为所述父节点,只有所述子节点没有所述父节点的对应所述实体为所述根节点,只有所述父节点没有所述子节点的对应所述实体为所述叶子节点。
进一步地,如果一个实体
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括一种结合知识图谱的人物画像刻画方法程序,所述结合知识图谱的人物画像刻画方法程序被处理器执行时,实现如上述任一项所述的一种结合知识图谱的人物画像刻画方法的步骤。
本发明公开的一种结合知识图谱的人物画像刻画方法、系统和可读存储介质,可以基于知识图谱匹配用户的移动轨迹对其进行画像,以此得到多个用户对应的知识图谱场景信息,进而可以判断某用户与其他用户之间的亲疏关系,从而可以对用户画像进行更加细致的描述与场景显现。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
机译: 差异校准方法、双目视觉系统和计算机可读存储介质 DIFFERENTIAL CALIBRATION METHOD, BINOCULAR VISION SYSTEM, AND COMPUTER-READABLE STORAGE MEDIUM