首页> 中国专利> 公共事件追踪方法、装置、计算机设备及计算机可读介质

公共事件追踪方法、装置、计算机设备及计算机可读介质

摘要

本申请属于数据展示技术领域,本申请提供了一种公共事件追踪方法、装置、计算机设备及计算机可读存储介质。本申请通过获取用户输入的事件关键词,根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据,根据预设核心要素标签,从所述事件数据中抽取所述事件数据所对应的预设核心要素数据,按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户,能够实现通过关键词追踪大事件,提高事件追踪的效率和质量,减少人工对事件的追踪成本。

著录项

  • 公开/公告号CN112328856A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 中国平安人寿保险股份有限公司;

    申请/专利号CN202011188368.7

  • 发明设计人 蔡静;

    申请日2020-10-30

  • 分类号G06F16/951(20190101);G06F16/9535(20190101);G06F40/30(20200101);G06K9/62(20060101);

  • 代理机构44242 深圳市精英专利事务所;

  • 代理人武志峰

  • 地址 518000 广东省深圳市福田区益田路5033号平安金融中心14、15、16、37、41、44、45、46层

  • 入库时间 2023-06-19 09:49:27

说明书

技术领域

本申请涉及数据展示技术领域,尤其涉及一种公共事件追踪方法、装置、计算机设备及计算机可读存储介质。

背景技术

热点事件永远是最有话题性的内容,也同时是与保险互动最为紧密的内容。不同事件带来的风险都是开启保险话题,传递保险观点的最有说服力的举证,只有观念深入人心,保险销售转化才顺理成章。

传统的人工追踪事件需要花大量的检索时间,进行优质内容挑选,还需要花费大量精力先做事件前因后果的脉络理解,才能输出事件关联知识和认知事件,再转化为客户可理解的文本或话术。需要非常大的成本。尽管如此,如果不进行长期的事件追踪,事件的动态变化还无法及时获取,因此,存在对热点事件获取效率较低的问题。

发明内容

本申请提供了一种公共事件追踪方法、装置、计算机设备及计算机可读存储介质,能够解决传统技术中对公共事件获取效率较低的问题。

第一方面,本申请提供了一种公共事件追踪方法,所述方法包括:获取用户输入的事件关键词;根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据;根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据;按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户。

第二方面,本申请还提供了一种公共事件追踪装置,包括:获取单元,用于获取用户输入的事件关键词;采集单元,用于根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据;抽取单元,用于根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据;构建单元,用于按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户。

第三方面,本申请还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现所述公共事件追踪方法的步骤。

第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行所述公共事件追踪方法的步骤。

本申请提供了一种公共事件追踪方法、装置、计算机设备及计算机可读存储介质。本申请通过获取用户输入的事件关键词,根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据,根据预设核心要素标签,从所述事件数据中抽取所述事件数据所对应的预设核心要素数据,按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户,能够实现通过关键词追踪大事件,尤其能够实现追踪重大公共事件,可以实现追踪和报道事件数据、事件资讯动态、事件关联知识,全流程智能完成并提供开放式服务,如应用于疫情等重大公共事件追踪报道,若应用于保险领域的保险代理人或者保险客服机器人,能够实现智能化事件播报,提高事件追踪的效率和质量,减少人工对事件的追踪成本,为保险代理人提供事件知识,为保险代理人提供与客户进行日常互动的更高效、客观、优质的事件谈资内容,在关注事件的同时,提升保险意识。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的公共事件追踪方法的一个流程示意图;

图2为本申请实施例提供的公共事件追踪方法的另一个具体框架流程示意图;

图3为本申请实施例提供的公共事件追踪方法的第一个子流程示意图;

图4为本申请实施例提供的公共事件追踪方法的第二个子流程示意图;

图5为本申请实施例提供的公共事件追踪装置的一个示意性框图;以及

图6为本申请实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

请参阅图1和图2,图1为本申请实施例提供的公共事件追踪方法的一个流程示意图,图2为本申请实施例提供的公共事件追踪方法的另一个具体框架流程示意图。如图1和图2所示,公共事件,可以为大事件,公共事件追踪用于大事件追踪与播报,尤其是对于公共大事件的追踪与播报,可以用于通过页面显示事件的相关内容,也可以通过语音播报事件的相关内容,若将公共事件应用于保险领域,便于保险代理人结合公共事件宣导保险话题,或者应用于保险机器人结合公共事件进行保险业务的自助服务,所述方法包括以下步骤:

S11、获取用户输入的事件关键词。

具体地,用户想要了解一事件时,输入该事件涉及的既定事件关键词,该事件关键词一般为该事件能区别于其它事件的具有显著特征的词语,例如该事件关键词为该事件的独有名称、独有词语,或者该事件关键词为当前的热点事件或者能关联到当前热点事件上的词语。该事件所覆盖的事件关键词可以通过人工打标签的方式由人工预先设置,获取到标签所包含的事件关键词后,根据所述事件关键词关联至预定事件,即可获知所描述的事件对象,例如,针对传染性疾病如新冠疫情,预先设置针对新冠疫情的标签“新冠”、“疫情”、“确诊病例”、“防疫抗议”、“疫情影响”等该新冠疫情事件等所对应的标签,用户输入“新冠”、“疫情”、“确诊病例”、“防疫抗议”等任一标签,,即可获知用户想了解的内容是关于新冠疫情事件的。

S12、根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据。

具体地,预先构建事件主题识别分类器,该事件主题识别分类器可选取事件的标题(即Title)数据作为正样本集,该事件主题识别分类器可选取事件的文本(即Text)数据作为负样本集,选用逻辑回归模型对正样本集与负样本集进行训练,得到主题识别分类器。例如,预先构建事件主题识别分类器,该分类器可选取主题为传染性疾病如新冠疫情的Title和Text数据分别作为正样本集与负样本,并选用逻辑回归模型对样本进行训练,得到“新冠疫情”主题识别分类器。其中,正样本就是正面的目标样本,负样本就是与正样本有关的干扰样本,其中,针对正负样本,可以针对采集事件数据的进行周期与事件关键词先做一批筛选,通过人工标注选择正负样本,计算机基于人工筛选的样本进行训练。经预训练的事件主题识别分类器可以准确的采集事件主题所对应的事件数据。

获取到所述事件关键词后,可以根据所述事件关键词爬取所述事件关键词所对应的事件数据,也可以根据所述事件关键词确定该事件关键词所对应的事件,并进行该事件所对应事件数据的数据爬取,以得到所述事件关键词所对应的事件数据,从而采集到该事件所对应的事件资讯及事件影响面数据等事件内容。例如,针对传染性疾病如新冠疫情事件,输入“新冠”或者“疫情”等关键字,进行当前热点传染病疫情事件新冠疫情资讯的海量检索,可以采用基本的Requests用法,并可以直接向定向的预设网站,如丁香医生网站及中国卫生健康委员会网站等对事件进行指定播报的网站请求数据,相比通常的数据爬取主要是在综合网站进行搜索爬取,通过定向爬取指定事件数据来源的事件数据更具有针对性,获得的事件数据也更可靠,例如,针对新冠疫情,在一示例中,该预设主题识别分类器能够自动识别出疫情主题的文章,总计提取数据集19368条新闻数据。

进一步地,所述根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据的步骤包括:

判断所述事件关键词是否存在于预设事件所对应的预设事件标签集合,其中,预设事件标签为预设事件所对应的预设关键词;

若所述事件关键词存在于预设事件所对应的预设事件标签集合;

根据所述预设事件标签集合中所包含的预设标签,经所述预设主题识别分类器采集所述预设事件所对应的事件数据。

具体地,针对一个事件,往往会有若干个标签可以关联到该事件,例如,针对事件A,可能涉及到的关键词包括A1、A2、A3及A4等若干个关键词,提到A1、A2、A3及A4中的任何一个关键词,都会关联到事件A上去,例如,针对新冠疫情,可能会涉及到新冠、疫情、防疫抗疫、疫情地区等若干个与新冠疫情有关的关键词作为该新冠疫情事件的标签,提到这些标签中的任何一个标签,就会关联到该疫情事件上。而用户一般只会使用有限个关键词描述自己想了解的该事件的有关内容,例如用一个关键词,此时判断该关键词是否存在于预设事件所对应的预设标签中,若该关键词包存在于预设事件的预设标签中,判定用户想了解的是该事件,进而用该事件所对应的预设标签经预设主题识别分类器采集所述预设事件所对应的事件数据,例如,判断用户输入的关键词是否为事件A所预设的A1、A2、A3及A4中的一个关键词,例如,用户输入的关键词是A2,A2为事件A所预设的A1、A2、A3及A4中的一个关键词,判断用户是想了解事件A的内容,此时,针对事件A采用A1、A2、A3及A4去采集事件A的事件数据,而不仅仅是采用A2去采集事件所对应的事件数据,通过一个事件关键词关联出该事件的所有预设标签,并采用该事件的所有预设标签去采集该事件所对应的事件数据,能够采集该事件所对应的丰富而全面的数据,可以提高后续对事件描述的准确性与全面性,从而提升事件输出的效率和准确性。

S13、根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据。

其中,预设核心要素数据包括事件的原因(何因Why)、对象(何事What)、地点(何地Where)、时间(何时When)、人员(何人Who)、方法(何法How)等方面,即5W1H。

具体地,对于一个事件的发生,一般会包括事件发生的原因、事件发生的对象、事件发生在何地、事件发生的时间、事件发生的人员等事件发生的基本要素。经用户输入事件关键词,并进行事件关键词所对应的新闻爬取,获取到所述事件数据后,通过自然语言处理,例如语义理解及话题聚类,理解事件数据中所包含事件的事件核心要素,并对事件核心要素进行抽取,得到事件所包含的事件发生的原因、事件发生的对象、事件发生在何地、事件发生的时间、事件发生的人员等事件的预设核心要素数据。例如,在新冠疫情事件中,输入“疫情”,进行疫情资讯海量检索后,根据预先设置的事件核心要素标签如“确诊病例”、“疫情故事”、“防疫抗疫”、“经济影响”及“医疗技术”,抽取核心要素如“确诊病例”、“疫情故事”、“防疫抗疫”、“经济影响”及“医疗技术”等各自所对应的预设核心要素标签的具体内容。其中,确诊病例”、“疫情故事”、“防疫抗疫”、“经济影响”、“医疗技术”等标签是根据专家的先验经验进行人工设置的,计算机设备可以根据专家经验设定的分类定义及常见关键词进行自动识别,通过抽取关键词及抽取语义,采取计算机识别结果与专家经验提供的关键词进行加权匹配,从而将标签及标签所对应的具体数据内容组成预设核心要素数据,例如,确诊病例是多少人,疫情故事是什么,防疫抗疫的预防措施有哪些,对经济有什么影响,目前的医疗技术处于什么状态等。

其中,话题聚类主要是基于以往相同或者相似事件积累的数据,采用用户兴趣模型,基于用户画像属性特征及事件内容标签的深度分析,进行将用户偏好与事件内容特征进行交叉比对,最终聚集用户对事件的关联兴趣话题,话题结果也会进行人工标注,确认话题聚集准确性,对聚类的负样例进行归类总结与过滤。例如,针对疫情事件,用户会更关注确诊病例等疫情现状及疫情发展趋势、防疫抗疫的预防措施及目前的医疗技术发展状况等,针对新冠疫情,可以根据以往针对传染性疾病的抗疫防疫的经验进行话题聚类,筛选出用户感兴趣的话题,并且在这次新冠疫情中积累的用户兴趣话题,在后续遇到相同或者相似的事件时,也可以作为先验经验进行参考。

S14、按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户。

其中,所述事件目标数据包括事件脉络分析及事件摘要、事件影响及事件所对应的关联知识,例如针对新冠疫情,可以包括新冠疫情的发生发展脉络及每个时间点所对应的疫情发展态势摘要、新冠疫情的影响及新冠疫情防疫抗疫等关联知识。

具体地,从所述事件数据中抽取事件数据中所包含的预设核心要素数据,即事件所包含的事件发生的原因、事件发生的对象、事件发生在何地、事件发生的时间、事件发生的人员等事件要素后,根据事件发生描述的内在逻辑,构建所述预设核心要素数据所对应的事件发展脉络、摘要及该事件的关联知识等对事件的认知所对应的事件目标数据,并将所述事件目标数据输出至所述用户,从而使用户了解到所述事件目标数据所对应的目标内容,针对保险代理人,可以方便保险代理人将事件认知件转换为客户可理解的口语化的文本或话术,便于保险代理人结合事件进行保险理念的宣导。其中,事件脉络主要是基于事件的发展时间,依次挖掘5W1H等事件要素,并按照事件发生发展的时间顺序构建事件脉络,由于事件往往刚开始只有一些时间、地点和结果,随着事件发展才会陆续有人物、原因等要素的陆续扩展,以及关联影响的发展,因此,事件持续的越久,事件脉络越相对清晰。关联知识即跟事件5W1H的要素相关的知识,这部分的关联关系,有常识性判断和图谱关联判断,如疫情可关联防疫知识,包括感冒、洗手、戴口罩等,从而实现根据影响面数据及事件资讯,对事件进行关联知识挖掘和脉络分析。

本申请实施例中,通过获取用户输入的事件关键词,根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据,根据预设核心要素标签,从所述事件数据中抽取所述事件数据所对应的预设核心要素数据,按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户,能够实现通过关键词追踪大事件,尤其能够实现追踪重大公共事件,可以实现追踪和报道事件数据、事件资讯动态、事件关联知识,全流程智能完成并提供开放式服务,如应用于疫情等重大公共事件追踪报道,若应用于保险代理人或者保险客服机器人,能够实现智能化事件播报,提高事件追踪的效率和质量,减少人工对事件的追踪成本,为保险代理人提供事件知识,为保险代理人提供与客户进行日常互动的更高效、客观、优质的事件谈资内容,在关注事件的同时,提升保险意识,与此同时,可直接为客服机器人提供形态多样化、内容强时效的语料,满足不同需求用户在机器人闲聊、咨询等场景里的内容摄入需求,提升整体的机器人服务质量与用户体验。

在一实施例中,所述预设核心要素数据包括事件发生发展过程中所包含的若干个时间节点及所述事件在每个所述时间节点所对应的事件摘要,所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户的步骤包括:

获取所有所述时间节点及每个所述时间节点所对应的事件摘要;按照所述时间节点的先后顺序,将所有所述事件摘要进行串行描述,以得到所述事件所对应的事件发展脉络,并将所述事件发展脉络输出至所述用户。

具体地,对于事件,一般存在事件的发生发展过程,直至事件结束,是一个一段时间内的持续过程,该持续过程内包括不同的时间节点,每个时间节点对应有该时间节点所对应的事件状态,即该事件发生发展的态势,可以概括描述每个时间节点所对应的事件状态,即为该时间节点所对应的事件摘要。从所述事件数据中抽取事件数据中所包含的预设核心要素数据,即事件所包含的事件发生的原因、事件发生的对象、事件发生在何地、事件发生的时间、事件发生的人员等事件要素后,根据事件发生描述的内在逻辑,例如在何时何地何人发生了何事等事件发生发展的事件要素之间的内在逻辑,,构建所述预设核心要素数据所对应的事件发展脉络及该事件的关联知识等对事件的认知,并将所述事件发展脉络输出至所述用户,从而使用户了解到所述事件发生发展的过程,可以获取该事件发生发展过程中所有预设所述时间节点,及每个所述时间节点所对应的事件内容,再从事件内容中获取该时间节点所对应的事件摘要,进而按照所述时间节点的先后顺序,即事件发生的时间先后顺序,将所有所述事件摘要进行串行描述,以得到所述事件所对应的事件发展脉络,并将所述事件发展脉络输出至所述用户,以使用户了解该事件发生发展的过程及状态,以便将关于事件发展脉络的认知进一步转换为可理解的口语化的文本或话术表达出去。例如,若应用于保险领域的保险代理人或者保险客服机器人,针对保险代理人,便于保险代理人结合疫情事件进行保险理念的宣导。

其中,事件摘要的生成,可以通过对不同事件要素关联的内容进行理解,并做事实性描述抽取,精炼生成重点摘要,可以通过专家经验以及知识图谱,将内容固有特征与知识特征进行交叉比对,所述事实性描述,是新闻报道里的事实,即抽取了关联的要素内容,通过该关键要素所在的句式,进行序列标注和句子排序任务,做到新闻报道的事实句子的判断和抽取,对句子抽取后,使用Seq2seq模型来得到Context向量,并利用Context向量和解码器隐层状态计算输出概率,利用Coverage机制解决生成重复问题,强化精炼的生成式摘要结果。例如,针对新冠疫情,抽取出“医疗技术”,并对该要素的事实性进行智能化描述(以下为算法生成无人工修改):

对于新冠病毒、疫苗、有效的临床药物,中国的科研攻关进展如何。Q:特效药离我们还有多远。周琪:特效药在研发过程中,到目前针对冠状病毒的特效药每一次都会有很大变化,这一次针对新冠肺炎的研发,目前还没有一个真正意义上的特效药。周琪:我们也有流感的疫苗,也不是所有人都打的。Q:是不是只有造出疫苗才能结束疫情。周琪:在抗疫过程中,所有的手段都是必要的,都是应该储备的,疫苗是一个重要的手段但不是唯一的手段。

其中,事件摘要的生成,还可以通过提取事件的新闻元素特征词类,可以根据事件资讯分别提取事件相关的数据集Title及Text的关键词的Text_Rank值(TextRank算法基于PageRank,用于为文本生成关键字和摘要)作为事件关联的新闻元素词类特征,是将数据集Title及Text通过TextRank算法生成Text_rank值,将Text_rank值作为关联的新闻元素特征词类,以生成事件摘要。例如,在传染性疾病新冠疫情事件中,对于新冠病毒疫情,基于疫情事件,搜索关联确诊数据、疑似病例数据、治愈、死亡等数据。并展示基本的增量变化情况,对事件关联的数据引擎搜索,并定时进行信息展示,可以减少人工追踪事件的精力和时间。在一示例中,可以包括如下内容:累计确诊:82236,较昨日新增确诊:158;现有疑似:649,较昨日新增疑似:54;现有治愈:75123,较昨日新增治愈:386;死亡人数:3301,较昨日新增死亡:3。数据截至时间:2020-03-2816:35:00。

在本申请实施例中,通过获取用户输入的事件关键词,根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据,从所述事件数据中抽取所述事件数据所对应的预设核心要素数据,按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件发展脉络,并将所述事件发展脉络输出至所述用户,能够实现通过关键词追踪大事件,尤其能够实现追踪重大公共事件,追踪和报道事件数据、事件资讯动态,尤其对于事件发展脉络的发生发展态势有清楚及快速的了解,若应用于保险领域的保险代理人或者保险客服机器人,可用于保险代理人进行保险理念的宣导,或者客服机器人根据热点事件进行自助,从而实现及时的智能化事件播报,减少人工对事件的追踪成本,为保险代理人提供事件知识,为保险代理人提供与客户进行日常互动的更高效、客观、优质的事件谈资内容,在关注事件的同时,提升保险意识。

请参阅图3,图3为本申请实施例提供的公共事件追踪方法的第一个子流程示意图。如图3所示,在该实施例中,所述预设核心要素数据还包括事件内容,所述获取所有所述时间节点及每个所述时间节点所对应的事件摘要的步骤包括:

S31、获取所述预设核心要素数据中所包含的所有时间参数以得到所有的所述时间节点;

S32、根据预设事件摘要算法,将每个所述时间节点所对应的事件内容生成所述时间节点所对应的事件摘要。

具体地,对于一个包含发生发展过程的事件,所述时间在不同的时间节点会存在不同的发展态势,进而对该时间节点的事件会有相对应的描述,可以将该时间节点作为时间参数以得到所有的时间节点,描述每一时间节点该事件的发展态势,即为该事件在该时间节点的事件内容,然后再根据预设事件摘要算法,获取该事件内容的事件摘要,获取所述预设核心要素数据中所包含的所有时间参数所对应的时间节点及各个时间节点所对应的事件摘要后,按照时间节点的先后顺序描述各个事件节点所对应的事件摘要,即可构建该事件的事件发展脉络,并将所述事件发展脉络输出至用户,用户即可清晰的了解该事件发展的整个过程,从而对事件有个完整、清楚的了解,相比传统技术中通过关键字搜索的各个时间点所对应的对事件的零散描述件,能够提高用户对事件了解的效率和质量。

在一实施例中,所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据的步骤还包括:

筛选出事件所对应的事件影响,并将所述事件影响作为所述目标数据。

具体地,由于事件所对应的事件影响才是用户所关注的,尤其是与自身利益密切相关的事件所对应的事件影响,事件影响一般可以通过对事件带来的好处或者坏处等对人的影响的角度进行描述,一般涉及形容词来描述,例如“重大影响”、“严重影响”、“积极效果”或者“严重后果”等,抽取出事件所对应的预设核心要素数据后,还可以通过对预设核心要素数据进行数据分析,例如通过对预设核心要素数据进行自然语言处理中的语义理解等,筛选出事件所对应的事件影响,并将所述事件影响作为所述目标数据的内容,以与事件发展脉络一起输出至用户,以使用户在对事件有完整、清楚了解的基础上,进一步了解到事件所带来的影响。

在一实施例中,所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据的步骤还包括:

根据预设关联标签,匹配事件所对应的关联知识,并将所述关联知识作为所述目标数据。

具体地,针对事件,很多情况下会存在该事件的关联知识。例如,针对传染性疾病,除确诊病例、疫情发生发展的事件认知外,还存在对疫情的防疫抗议措施等相关的关联知识,可以通过专家经验判断与知识特征匹配,设置预设关联标签,根据预设关联标签,挖掘热点事件所对应的关联知识,输出事件关联知识补充认知事件,作为丰富的信息增量和补充。例如,针对流感、新冠疫情等可以通过空气传播的疫情的防疫知识,口罩使用可以作为疫情事件的关联知识,例如,针对问题关联知识:口罩里垫一张纸巾,就能反复使用?“在口罩内部垫纸巾不能起到延长口罩寿命的效果,反而会让气体从纸巾旁边通过,影响气密性,导致口罩失效。一般来讲,一次性口罩不建议重复使用,N95口罩在保存得当的情况下,可以考虑多次使用,但最好不要超过5次。”同时,所述关联知识,也可直接为客服机器人提供形态多样化、内容时效强的语料,满足不同需求用户在机器人闲聊、咨询等场景里的内容摄入需求,提升整体的机器人服务质量与用户体验。

请参阅图4和继续参阅图2,图4为本申请实施例提供的公共事件追踪方法的第二个子流程示意图。如图4所示,在该实施例中,所述根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据的步骤之后,还包括:

S41、获取所述事件数据所对应的内容类型;

S42、根据所述内容类型,将所述事件数据归属于预设目标索引中,所述预设目标索引包括事件新闻索引、事件数据索引及事件知识索引。

具体地,请继续参阅图2,如图2所示,可以预先设置热点事件库,热点事件库中可以包括积累的各种热点事件所包含的事件新闻索引、事件数据索引及事件知识索引,事件新闻索引为事件所对应的新闻目录,事件数据索引为事件所对应的各种数据目录,事件知识索引为事件所关联的各种知识的目录,例如,针对新冠疫情,针对新冠疫情的各种新闻的目录形成事件新闻索引,新闻目录下包括新冠疫情的各种新闻,事件数据索引下包括新冠引擎的各种数据,如每日每地区的确诊病例、确诊地区等各种数据,以便于后续将各种事件的数据进行比对,对数据进行挖掘与分析,以从中得到数据隐藏的事件内容,事件知识索引下包括口罩使用知识、防疫知识等新冠疫情的各种关联知识目录及关联知识内容。根据所述事件关键词,采集所述事件关键词所对应的事件数据一般会包括多种类型的内容,例如,事件所对应的新闻报道、事件评论及该事件所对应的关联知识,例如,针对新冠疫情,每天都会有新冠疫情的最新疫情数据新闻报道,也会存在对新冠疫情的评论,并且随着新冠疫情的发生发展,会增加对新冠疫情关联知识的报道。采集到所述事件关键词所对应事件数据后,识别多个数据源采集的多种事件数据各自所包含的内容,并判断所述事件数据所属的内容类型,根据所述内容类型,将所述事件数据归属于预设目标索引中,例如,将新闻类事件数据归属于事件新闻索引中,将知识类事件数据归属于事件知识索引中,例如将口罩的使用知识归属于知识类索引中,通过将所述事件数据归属于预设目标索引中,以建立热点数据库,便于后续发生相同或者相似的事件时,从热点数据库中获取相关的热点数据,以利于后续热点事件的追踪与播报。

在一实施例中,设置有预设热点数据库,所述预设热点数据库包含曾经发生的各种热点事件各自所对应的热点事件数据,所述根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据的步骤还包括:

根据所述事件关键词,获取所述事件关键词所对应的事件所包含的事件标签;根据所述事件标签,从所述预设热点数据库中筛选出与所述事件相对应的关联事件;从所述关联事件所对应的热点事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据。

具体地,预先建立热点事件数据库,以将已经发生的每次热点事件所积累的热点事件数据进行存储,并对每件热点事件打标签(即热点事件对应的关键字,通过这些关键字可以关联到该事件上,例如,针对新冠疫情,新冠、疫情、2019疫情等关键字可以关联到新冠疫情上等。),尤其是将相同或者相似事件进行归类与分别存储,例如传染性疾病为相同或者相似事件,例如传染性疾病中的SARS疾病与新冠疫情为相似的传染性疾病,会存在共性与可借鉴的内容,并将每次热点事件划分为事件新闻索引、事件数据索引及事件知识索引等索引分类,后续发生热点事件时,根据用户输入的事件关键词,获取所述事件关键词所对应的事件,再根据该事件获取该事件所包含的事件标签,进而通过该事件所对应的事件标签,从所述预设热点数据库中关联出与该事件相同或者相似的所有关联事件,并从所有关联事件各自所对应的热点事件数据中,抽取所述预设核心要素标签所对应的预设核心要素数据,进而通过借鉴以往积累的事件的先验知识,对当前的事件进行纵向或者横向的对比、分析、追踪与播报,以提高对事件追踪与播报的效率,例如,事件新闻索引,例如,每个地区的疫情新闻、防疫措施,事件数据索引,例如疫情中的确诊病例等,或者事件知识索引,例如口罩的使用等,以便于后续的疫情也从相关角度对事件进行描述,从而使对事件的描述全面、准确,以使用户了解到热点事件丰富而准确的事件内容,从而提高对事件的了解效率。

在一实施例中,所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户的步骤包括:

按照所述预设核心要素数据所对应的预设逻辑关系,根据预设知识图谱构建方法构建事件所对应的事件知识图谱,并将所述事件知识图谱输出至所述用户。

具体地,按照所述预设核心要素数据所对应的预设逻辑关系,构建事件所对应的事件知识图谱,并将所述事件知识图谱输出至所述用户,知识图谱的形式可以为表格或者树形结构等图形,可以用表格的构建方法构建表格,或者用树形结构的形式构建二叉树之类的树形结构等图形。例如,通过知识图谱的形式将事件发展脉络、事件影响及事件的关联知识显示至用户,可以使用户通过结构化的形式快速、准确、清楚的了解事件的相关内容,提高事件智能追踪的效率。其中,知识图谱(英文为Knowledge Graph),是通过将文字、图形学、信息可视化技术等方法相结合,并利用可视化的图谱形象地展示事件的核心内容、发展历史、事件影响及关联知识的方式。

本申请实施例中,通过关键词追踪大事件,并逐步建立热点事件的历史事件库,能够实现智能化事件播报,减少人工追踪成本,并利用知识图谱关联挖掘事件知识,为保险代理人提供事件知识、事件风险警示,为代理人提供与客户进行日常互动的更高效、客观、优质的事件谈资内容,在关注事件的同时,提升保险意识。

在一实施例中,所述将所述目标数据输出至所述用户的步骤包括:

通过预设语音播报方式将所述目标数据播报至所述用户。

具体地,在通过机器人实现自助服务时,可以通过语音播报的方式将所述目标数据播报至所述用户。

需要说明的是,上述各个实施例所述的公共事件追踪方法,可以根据需要将不同实施例中包含的技术特征重新进行组合,以获取组合后的实施方案,但都在本申请要求的保护范围之内。

请参阅图5,图5为本申请实施例提供的公共事件追踪装置的一个示意性框图。对应于上述所述公共事件追踪方法,本申请实施例还提供一种公共事件追踪装置。如图5所示,该公共事件追踪装置包括用于执行上述所述公共事件追踪方法的单元,该公共事件追踪装置可以被配置于计算机设备中。具体地,请参阅图5,该公共事件追踪装置50包括获取单元51、采集单元52、抽取单元53及构建单元54。

其中,获取单元51,用于获取用户输入的事件关键词;

采集单元52,用于根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据;

抽取单元53,用于根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据;

构建单元54,用于按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户。

在一实施例中,所述预设核心要素数据包括事件发生发展过程中所包含的若干个时间节点及所述事件在每个所述时间节点所对应的事件摘要,所述构建单元54包括:

第一获取子单元,用于获取所有所述时间节点及每个所述时间节点所对应的事件摘要;

构建子单元,用于按照所述时间节点的先后顺序,将所有所述事件摘要进行串行描述,以得到所述事件所对应的事件发展脉络,并将所述事件发展脉络输出至所述用户。

在一实施例中,所述预设核心要素数据还包括事件内容,所述第一获取子单元包括:

第二获取子单元,用于获取所述预设核心要素数据中所包含的所有时间参数以得到所有的所述时间节点;

生成子单元,用于根据预设事件摘要算法,将每个所述时间节点所对应的事件内容生成所述时间节点所对应的事件摘要。

在一实施例中,所述构建单元54还包括:

第一筛选子单元,用于筛选出事件所对应的事件影响,并将所述事件影响作为所述目标数据;

和/或者,匹配子单元,用于根据预设关联标签,匹配事件所对应的关联知识,并将所述关联知识作为所述目标数据。

在一实施例中,所述公共事件追踪装置50还包括:

第三获取子单元,用于获取所述事件数据所对应的内容类型;

归属单元,用于根据所述内容类型,将所述事件数据归属于预设目标索引中,所述预设目标索引包括事件新闻索引、事件数据索引及事件知识索引。

在一实施例中,设置有预设热点数据库,所述预设热点数据库包含曾经发生的各种热点事件各自所对应的热点事件数据,所述抽取单元53还包括:

第四获取子单元,用于根据所述事件关键词,获取所述事件关键词所对应的事件所包含的事件标签;

第二筛选子单元,用于根据所述事件标签,从所述预设热点数据库中筛选出与所述事件相对应的关联事件;

抽取子单元,用于从所述关联事件所对应的热点事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据。

在一实施例中,所述构建单元54,用于按照所述预设核心要素数据所对应的预设逻辑关系,根据预设知识图谱构建方法构建事件所对应的事件知识图谱,并将所述事件知识图谱输出至所述用户。

需要说明的是,所属领域的技术人员可以清楚地了解到,上述公共事件追踪装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。

同时,上述公共事件追踪装置中各个单元的划分和连接方式仅用于举例说明,在其他实施例中,可将公共事件追踪装置按照需要划分为不同的单元,也可将公共事件追踪装置中各单元采取不同的连接顺序和方式,以完成上述公共事件追踪装置的全部或部分功能。

上述公共事件追踪装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。

请参阅图6,图6是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是台式机电脑或者服务器等计算机设备,也可以是其他设备中的组件或者部件。

参阅图6,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504,存储器也可以为易失性计算机可读存储介质。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种上述公共事件追踪方法。

该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种上述公共事件追踪方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图6所示实施例一致,在此不再赘述。

其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:获取用户输入的事件关键词;根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据;根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据;按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户。

在一实施例中,所述预设核心要素数据包括事件发生发展过程中所包含的若干个时间节点及所述事件在每个所述时间节点所对应的事件摘要,所述处理器502在实现所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户的步骤时,具体实现以下步骤:

获取所有所述时间节点及每个所述时间节点所对应的事件摘要;

按照所述时间节点的先后顺序,将所有所述事件摘要进行串行描述,以得到所述事件所对应的事件发展脉络,并将所述事件发展脉络输出至所述用户。

在一实施例中,所述预设核心要素数据还包括事件内容,所述处理器502在实现所述获取所有所述时间节点及每个所述时间节点所对应的事件摘要的步骤时,具体实现以下步骤:

获取所述预设核心要素数据中所包含的所有时间参数以得到所有的所述时间节点;

根据预设事件摘要算法,将每个所述时间节点所对应的事件内容生成所述时间节点所对应的事件摘要。

在一实施例中,所述处理器502在实现所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据的步骤时,还实现以下步骤:

筛选出事件所对应的事件影响,并将所述事件影响作为所述目标数据;

和/或者,根据预设关联标签,匹配事件所对应的关联知识,并将所述关联知识作为所述目标数据。

在一实施例中,所述处理器502在实现所述根据所述事件关键词,经预设主题识别分类器采集所述事件关键词所对应的事件数据的步骤之后,还实现以下步骤:

获取所述事件数据所对应的内容类型;

根据所述内容类型,将所述事件数据归属于预设目标索引中,所述预设目标索引包括事件新闻索引、事件数据索引及事件知识索引。

在一实施例中,设置有预设热点数据库,所述预设热点数据库包含曾经发生的各种热点事件各自所对应的热点事件数据,所述处理器502在实现所述根据预设核心要素标签,从所述事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据的步骤时,还实现以下步骤:

根据所述事件关键词,获取所述事件关键词所对应的事件所包含的事件标签;

根据所述事件标签,从所述预设热点数据库中筛选出与所述事件相对应的关联事件;

从所述关联事件所对应的热点事件数据中抽取所述预设核心要素标签所对应的预设核心要素数据。

在一实施例中,所述处理器502在实现所述按照所述预设核心要素数据所对应的预设逻辑关系,构建所述预设核心要素数据所对应的事件目标数据,并将所述事件目标数据输出至所述用户的步骤时,具体实现以下步骤:

按照所述预设核心要素数据所对应的预设逻辑关系,根据预设知识图谱构建方法构建事件所对应的事件知识图谱,并将所述事件知识图谱输出至所述用户。

应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessingUnit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来完成,该计算机程序可存储于一计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。

因此,本申请还提供一种计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以为易失性计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时使处理器执行以上各实施例中所描述的所述公共事件追踪方法的步骤。

所述计算机可读存储介质可以是前述设备的内部存储单元,例如设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所述存储介质为实体的、非瞬时性的存储介质,例如可以是U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、磁碟或者光盘等各种可以存储计算机程序的实体存储介质。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

以上所述,仅为本申请的具体实施方式,但本申请明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号