公开/公告号CN114969375A
专利类型发明专利
公开/公告日2022-08-30
原文格式PDF
申请/专利权人 广东东软学院;中国科学院心理研究所;北京钢铁侠科技有限公司;
申请/专利号CN202210652233.4
申请日2022-06-10
分类号G06F16/36(2019.01);G06F17/16(2006.01);G06F40/289(2020.01);G06K9/00(2022.01);G06N3/08(2006.01);G06N5/02(2006.01);G06N20/00(2019.01);
代理机构北京国坤专利代理事务所(普通合伙) 11491;
代理人赵红霞
地址 528225 广东省佛山市南海区南海软件科技园
入库时间 2023-06-19 16:33:23
法律状态公告日
法律状态信息
法律状态
2022-10-21
实质审查的生效 IPC(主分类):G06F16/36 专利申请号:2022106522334 申请日:20220610
实质审查的生效
技术领域
本发明属于机器人工智能学习技术领域,尤其涉及一种基于心理学知识赋予机器人工智能学习的方法及系统。
背景技术
机器是指由零部件组装成的装置,可以运转,用来代替人的劳动、作能量变换或产生有用功。机器一般由动力部分、传动部分、执行部分和控制部分组成。从能量角度定义,机器为利用或转换机械能的装置,将其他形式的能量转换为机械能的称原动机,如内燃机、蒸汽机,电动机等,利用机械能来完成有用功的称工作机,如各种机床、起重机、压缩机等。随着科学技术的发展,机器的概念也在不断地更新和变化。然而,现有基于心理学知识赋予机器人工智能学习的方法采用的心理疾病数据标注成本高,缺少大量标注数据训练的神经网络往往识别精度不高;心理疾病知识图谱属于专业领域知识图谱,要求知识质量更高,现有的实体识别算法由于缺乏先验知识的指导,在抽取复杂实体时难免会出错,需要专业人员进行二次纠正,耗费人力物力;同时,对心理健康状态评估不准确。
综上所述,现有技术存在的问题是:现有基于心理学知识赋予机器人工智能学习的方法采用的心理疾病数据标注成本高,缺少大量标注数据训练的神经网络往往识别精度不高;心理疾病知识图谱属于专业领域知识图谱,要求知识质量更高,现有的实体识别算法由于缺乏先验知识的指导,在抽取复杂实体时难免会出错,需要专业人员进行二次纠正,耗费人力物力;同时,对心理健康状态评估不准确。
发明内容
针对现有技术存在的问题,本发明提供了一种基于心理学知识赋予机器人工智能学习的方法及系统。
本发明是这样实现的,一种基于心理学知识赋予机器人工智能学习的方法包括以下步骤:
步骤一,获取监控对象的基本信息、情绪信息以及位置信息;其中,所述基本信息至少包括所述监控对象的姓名与头像画面;
步骤二,以所述位置信息为依据,匹配相应的场景关联事件;以预设的心理状态分析模型对所述基本信息、所述情绪信息、所述位置信息、所述场景关联事件进行分析,得到所述监控对象的心理状态;并建立心理状态文档库;
步骤三,对心理状态文档库中的文档进行分词和智能摘要预处理,得到关键词,对得到的关键词进行相关性分析,处理上述步骤提供的值,计算得出关键词针对该篇文档的关键度分值,得到带有赋值的关键词;
步骤四,按照心理学知识图谱对用户性格分析得用户性格倾向值,并对用户心理状态进行评估;
步骤五,将得到的性格倾向值与得到的关键词关键度分值匹配,得到带有性格倾向属性的文档库;用户发起访问请求时,所述带有性格倾向属性的文档库给出带有性格倾向属性的文档。
进一步,在步骤二中,心理状态分析模型包括:
第一步,利用小波包变换在时频域分解心理状态信号,提取心理状态波的心理状态变化规律;
第二步,采用一对一策略将公共空间模式从两类模式扩展到多类模式,利用一对一公共空间模式对心理状态变化规律心理状态提取特征向量;
第三步,根据特征值的分布特点对特征向量的维数进行选择;
所述用于心理状态信号情感分析的改进公共空间模式特征提取方法对原始心理状态信号提取心理状态变化规律心理状态,包括:采用小波包变换在时频域对心理状态信号进行分解,将心理状态变化频段对应的若干子带的节点系数进行组合重构,从而提取出与原始心理状态信号形式一致的心理状态变化规律心理状态信号;
所述用于心理状态信号情感分析的改进公共空间模式特征提取方法基于公共空间模式对心理状态变化规律心理状态区域数据提取特征向量,具体包括:设情绪心理状态的类别个数为n,则针对n类情绪识别问题,采用一对一方法对传统的两类公共空间模式进行扩展。
一对一公共空间模式算法的步骤为:
(1)用E
式中,trace(X)表示对角矩阵X的迹;
然后对每一类所有区域数据的归一化协方差矩阵求平均值作为该类数据的平均归一化空间协方差矩阵
(2)首先对R进行主分量分解:
R=UVU
其中V为特征值对角矩阵,U为由与V中特征值相对应的特征向量构成的特征向量矩阵;
然后对特征值按降序排序,并对特征向量的排列顺序做相应的调整,得到新的V和U;定义白化矩阵P为:
(3)首先用白化矩阵P对
然后对S
对S
将V
W=B
对任意两类区域数据都计算一个投影矩阵W
(4)对每个区域数据E
Z
得到的Z
f
进一步,所述心理学知识图谱构建方法如下:
(1)采集与患者心理疾病病情相关的数据;对所述采集的数据进行分析,建立心理疾病语料集;根据所述心理疾病语料集,确定实体、关系以及属性指示词表;
(2)利用语言模型对所述心理疾病语料集中的数据进行微调,构建心理疾病命名实体识别数据集,提取所述命名实体识别数据集的特征值,将微调后的数据和提取的特征进行融合,利用融合后的数据对预先构建的深度学习模型进行训练;
(3)利用训练后的深度学习模型对待处理的心理疾病语料进行预测,将预测得到的实体类别索引序列转换为实体类型序列,并将各实体词存入实体词表,并依据关系类型以及属性类型,分别抽取实体关系和属性数据,进行分别存储。
进一步,所述获取心理疾病相关已有信息,建立心理疾病语料集的具体过程包括:根据心理疾病相关书籍设置心理疾病术语种子词集;根据心理疾病术语种子集,遍历搜索医疗网站中的相关内容,记录相关网页url,存为url集合;对url集合使用爬虫技术进行网页内容的爬取;对爬取的网页内容采用正则表达式、xpath解析器进行内容提取,对于非结构化数据存储至数据库中,对于半结构化数据,直接抽取出三元组进行存储,不同的关系类型、不同的属性类型进行区分存储;对已经处理好的语料进行至少一部分的标注。
进一步,所述对用户心理状态进行评估方法如下:
1),获取网络用户的所有上网行为,分别为每种类型的上网行为设置对应的节点;通过边连接与网络用户触发的两个相邻上网行为相对应的两个节点,并根据两个相邻上网行为之间的交互总次数为两个节点之间的边设置权重值;基于各个节点以及各个节点之间的具有权重值的边,建立与网络用户相对应的个体上网行为网络,并获取个体网络行为特征;
2),利用机器学习的方法,基于已知区域中个体网络行为特征和人口统计学特征,建立和训练基于网络行为特征的心理状态评估模型;
3),获取新个体的网络行为特征和人口统计学特征,根据所述的基于网络行为特征的心理状态评估模型,得到该新个体的心理状况;
其中:所述网络行为特征是反映个体所使用的网络媒介/服务工具的功能结果和使用路径的特征集合;所述网络行为特征从记录个体的网络日志中提取;以及所述网络行为特征包括个体的网络信息和时间序列数据,所述个体的网络信息包括:时间信息、各类即时通讯工具信息、邮件信息、所访问网页类别的信息和搜索信息;所述时间序列数据包括:每天的上网时间信息、每天的网络请求个数信息和每天的网页信息;所述时间信息包括:工作日平均每日上网时长和周末平均每日上网时长;所述邮件信息包括是否用客户端收发邮件。
本发明另一目的在于提供一种实施所述基于心理学知识赋予机器人工智能学习的方法的基于心理学知识赋予机器人工智能学习系统。
本发明另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于心理学知识赋予机器人工智能学习的方法步骤。
本发明另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于心理学知识赋予机器人工智能学习的方法。
本发明另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述基于心理学知识赋予机器人工智能学习的方法。
本发明的优点及积极效果为:本发明通过心理学知识图谱构建方法使得海量心理疾病数据可以得到有效的管理与利用,并可在该知识图谱的基础上开展知识搜索、智能问答等多个应用;针对缺少大量标注数据训练的深度学习模型,本发明使用ALBERT语言模型对心理疾病语料进行预训练,为深度学习模型带来了丰富的语义信息,可有效地提高实体识别的精度;同时,通过对用户心理状态进行评估方法消除了个体主观因素对数据收集的影响,有助于更加准确地进行心理健康状态评估。
心理状态分析模型包括:利用小波包变换在时频域分解心理状态信号,提取心理状态波的心理状态变化规律;采用一对一策略将公共空间模式从两类模式扩展到多类模式,利用一对一公共空间模式对心理状态变化规律心理状态提取特征向量;根据特征值的分布特点对特征向量的维数进行选择;可获得准确的数据。
附图说明
图1是本发明实施提供的基于心理学知识赋予机器人工智能学习的方法流程图。
图2是本发明实施提供的心理学知识图谱构建方法流程图。
图3是本发明实施提供的对用户心理状态进行评估方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图对本发明的应用原理作进一步描述。
如图1所示,本发明提供一种基于心理学知识赋予机器人工智能学习的方法包括以下步骤:
S101,获取监控对象的基本信息、情绪信息以及位置信息;其中,所述基本信息至少包括所述监控对象的姓名与头像画面;
S102,以所述位置信息为依据,匹配相应的场景关联事件;以预设的心理状态分析模型对所述基本信息、所述情绪信息、所述位置信息、所述场景关联事件进行分析,得到所述监控对象的心理状态;并建立心理状态文档库;
S103,对心理状态文档库中的文档进行分词和智能摘要预处理,得到关键词,对得到的关键词进行相关性分析,处理上述步骤提供的值,计算得出关键词针对该篇文档的关键度分值,得到带有赋值的关键词;
S104,按照心理学知识图谱对用户性格分析得用户性格倾向值,并对用户心理状态进行评估;
S105,将得到的性格倾向值与得到的关键词关键度分值匹配,得到带有性格倾向属性的文档库;用户发起访问请求时,所述带有性格倾向属性的文档库给出带有性格倾向属性的文档。
在步骤S102中,心理状态分析模型包括:
第一步,利用小波包变换在时频域分解心理状态信号,提取心理状态波的心理状态变化规律;
第二步,采用一对一策略将公共空间模式从两类模式扩展到多类模式,利用一对一公共空间模式对心理状态变化规律心理状态提取特征向量;
第三步,根据特征值的分布特点对特征向量的维数进行选择;
所述用于心理状态信号情感分析的改进公共空间模式特征提取方法对原始心理状态信号提取心理状态变化规律心理状态,包括:采用小波包变换在时频域对心理状态信号进行分解,将心理状态变化频段对应的若干子带的节点系数进行组合重构,从而提取出与原始心理状态信号形式一致的心理状态变化规律心理状态信号;
所述用于心理状态信号情感分析的改进公共空间模式特征提取方法基于公共空间模式对心理状态变化规律心理状态区域数据提取特征向量,具体包括:设情绪心理状态的类别个数为n,则针对n类情绪识别问题,采用一对一方法对传统的两类公共空间模式进行扩展。
一对一公共空间模式算法的步骤为:
(1)用E
式中,trace(X)表示对角矩阵X的迹;
然后对每一类所有区域数据的归一化协方差矩阵求平均值作为该类数据的平均归一化空间协方差矩阵
(2)首先对R进行主分量分解:
R=UVU
其中V为特征值对角矩阵,U为由与V中特征值相对应的特征向量构成的特征向量矩阵;
然后对特征值按降序排序,并对特征向量的排列顺序做相应的调整,得到新的V和U;定义白化矩阵P为:
(3)首先用白化矩阵P对
然后对S
对S
将V
W=B
对任意两类区域数据都计算一个投影矩阵W
(4)对每个区域数据E
Z
得到的Z
f
如图2所示,本发明提供的心理学知识图谱构建方法如下:
S201,采集与患者心理疾病病情相关的数据;对所述采集的数据进行分析,建立心理疾病语料集;根据所述心理疾病语料集,确定实体、关系以及属性指示词表;
S202,利用语言模型对所述心理疾病语料集中的数据进行微调,构建心理疾病命名实体识别数据集,提取所述命名实体识别数据集的特征值,将微调后的数据和提取的特征进行融合,利用融合后的数据对预先构建的深度学习模型进行训练;
S203,利用训练后的深度学习模型对待处理的心理疾病语料进行预测,将预测得到的实体类别索引序列转换为实体类型序列,并将各实体词存入实体词表,并依据关系类型以及属性类型,分别抽取实体关系和属性数据,进行分别存储。
本发明提供的获取心理疾病相关已有信息,建立心理疾病语料集的具体过程包括:根据心理疾病相关书籍设置心理疾病术语种子词集;根据心理疾病术语种子集,遍历搜索医疗网站中的相关内容,记录相关网页url,存为url集合;对url集合使用爬虫技术进行网页内容的爬取;对爬取的网页内容采用正则表达式、xpath解析器进行内容提取,对于非结构化数据存储至数据库中,对于半结构化数据,直接抽取出三元组进行存储,不同的关系类型、不同的属性类型进行区分存储;对已经处理好的语料进行至少一部分的标注。
如图3所示,本发明提供的对用户心理状态进行评估方法如下:
S301,获取网络用户的所有上网行为,分别为每种类型的上网行为设置对应的节点;通过边连接与网络用户触发的两个相邻上网行为相对应的两个节点,并根据两个相邻上网行为之间的交互总次数为两个节点之间的边设置权重值;基于各个节点以及各个节点之间的具有权重值的边,建立与网络用户相对应的个体上网行为网络,并获取个体网络行为特征;
S302,利用机器学习的方法,基于已知区域中个体网络行为特征和人口统计学特征,建立和训练基于网络行为特征的心理状态评估模型;
S303,获取新个体的网络行为特征和人口统计学特征,根据所述的基于网络行为特征的心理状态评估模型,得到该新个体的心理状况;
其中:所述网络行为特征是反映个体所使用的网络媒介/服务工具的功能结果和使用路径的特征集合;所述网络行为特征从记录个体的网络日志中提取;以及所述网络行为特征包括个体的网络信息和时间序列数据,所述个体的网络信息包括:时间信息、各类即时通讯工具信息、邮件信息、所访问网页类别的信息和搜索信息;所述时间序列数据包括:每天的上网时间信息、每天的网络请求个数信息和每天的网页信息;所述时间信息包括:工作日平均每日上网时长和周末平均每日上网时长;所述邮件信息包括是否用客户端收发邮件。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
机译: 一种基于指针的对象获取方法,用于对计算机系统的信息进行有形处理,该方法基于一种自然语言,并且该机器人或机器人的人工智能系统对该计算机系统的接收信号作出反应,该计算机系统具有相应的关联机器人或机器人的人工智能,该机器人或机器人的人工智能计算机系统的相应思想得到证实
机译: 一种基于人工智能学习及其方法跟踪用户知识的系统
机译: 一种基于人工智能学习及其方法跟踪用户知识的系统