首页> 中国专利> 一种基于文本回答问题的方法及装置

一种基于文本回答问题的方法及装置

摘要

本发明实施例提供一种基于文本回答问题的方法及装置,所述方法包括:输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。所述装置执行上述方法。本发明实施例提供的方法及装置,能够在文本语义信息中准确输出回答问题的起始索引和终止索引。

著录项

  • 公开/公告号CN112685543A

    专利类型发明专利

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 普天信息技术有限公司;

    申请/专利号CN201910995402.2

  • 发明设计人 曹秀亭;

    申请日2019-10-18

  • 分类号G06F16/332(20190101);G06F16/35(20190101);G06N3/04(20060101);

  • 代理机构11002 北京路浩知识产权代理有限公司;

  • 代理人张睿

  • 地址 100080 北京市海淀区海淀北二街6号普天大厦

  • 入库时间 2023-06-19 10:41:48

说明书

技术领域

本发明涉及人工智能技术领域,尤其涉及一种基于文本回答问题的方法及装置。

背景技术

随着人工智能技术的发展,人们需要让计算机替代人们进行一部分活动,例如,让计算机像人类一样阅读文本,进而根据对该文本的理解来回答问题。这种阅读理解就像是让计算机来做类似高考英语的阅读理解题。目前,基于神经网络的方法成为主流趋势,因为它们可以抓住问题和文本之间的语义和语法关系。

现有技术利用LSTM实现基于文本回答问题,具体可以包括:采用Seq2Seq的模型方案,利用LSTM进行编码器-解码器进行学习序列到序列模型的阅读理解,包括两个LSTM:即一个编码器和一个解码器。编码器将序列作为输入,并在每个时间点处理一个符号,其目的就是将符号序列转换为固定大小的特征向量,该特征向量仅对序列中的重要信息进行编码,同时丢失不必要的信息。通过Seq2Seq的模型方案可以实现阅读理解,输入是question(问题语义信息)和documents(文本语义信息),通过模型在documents扫描输出起始index和终止index,但是,上述方法并不能很好的解决这个问题,回答问题的准确率很低。

发明内容

针对现有技术存在的问题,本发明实施例提供一种基于文本回答问题的方法及装置。

本发明实施例提供一种基于文本回答问题的方法,包括:

输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;

根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;

根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

其中,所述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数,包括:

根据问题语义信息和文本语义信息,确定相似度矩阵;所述相似度矩阵的行是与文本语义信息中的各词分别对应的问题语义信息中的全部词之间的相似度,所述相似度矩阵的列是与问题语义信息中的各词分别对应的文本语义信息中的全部词之间的相似度;

根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数,并根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数。

其中,所述根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数,包括:根据如下公式确定所述第一参数:

U'=Σ

其中,U'为所述第一参数、softmax为所述分类器、S

其中,所述根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数,包括:根据如下公式计算所述第二参数:

H'=Σ

其中,H'为所述第二参数、softmax为所述分类器、max为求最大值函数、S

其中,所述根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数,包括,根据如下拼接方式确定所述上下文表征参数:

G=β(H;U';H*U';H*H')

其中,G为所述上下文表征参数、β为所述全连接网络、H为所述文本语义信息、U'为所述第一参数、所述H'为所述第二参数。

其中,所述输入问题语义信息和文本语义信息至预设问题回答模型的步骤之后,所述基于文本回答问题的方法还包括:

对所述文本语义信息和所述问题语义信息分别进行编码处理;

用编码处理后的文本语义信息和编码处理后的问题语义信息替换所述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数步骤中的问题语义信息和文本语义信息,并执行后续步骤。

其中,所述对所述文本语义信息和所述问题语义信息分别进行编码处理,包括:

对于所述文本语义信息进行如下处理:

对所述文本语义信息进行向量化处理,以获取文本语义向量;

输入所述文本语义向量至所述预设问题回答模型中的self-attention层、并采用L2norm对self-attention层的输出结果和所述文本语义向量进行处理,以获取第一处理结果;

输入所述第一处理结果至所述预设问题回答模型中的前馈神经网络、并采用L2norm对前馈神经网络的输出结果和所述第一处理结果进行处理,以获取第二处理结果;

对于所述问题语义信息进行如下处理:

对所述问题语义信息进行向量化处理,以获取问题语义向量;

输入所述问题语义向量至所述预设问题回答模型中的self-attention层、并采用L2norm对self-attention层的输出结果和所述问题语义向量进行处理,以获取第一处理结果;

输入所述第一处理结果至所述预设问题回答模型中的前馈神经网络、并采用L2norm对前馈神经网络的输出结果和所述第一处理结果进行处理,以获取第二处理结果。

本发明实施例提供一种基于文本回答问题的装置,包括:

第一确定单元,用于输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;

第二确定单元,用于根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;

回答单元,用于根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本发明实施例提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,

所述处理器执行所述计算机程序时实现如下方法步骤:

输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;

根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;

根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下方法步骤:

输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;

根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;

根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本发明实施例提供的基于文本回答问题的方法及装置,通过可反映问题语义信息和文本语义信息之间的双向语义关系的第一参数和第二参数,确定可感知问题的上下文表征参数,进而能够在文本语义信息中准确输出回答问题的起始索引和终止索引。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于文本回答问题的方法实施例流程图;

图2为本发明基于文本回答问题的方法另一实施例流程图;

图3为本发明基于文本回答问题的装置实施例结构示意图;

图4为本发明实施例提供的电子设备实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明基于文本回答问题的方法实施例流程图,如图1所示,本发明实施例提供的一种基于文本回答问题的方法,包括以下步骤:

S101:输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息。

具体的,输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息。执行该方法步骤的可以是计算机设备。预设问题回答模型可以为神经网络,不作具体限定。问题语义信息和文本语义信息的数据主要来源可以来自于百度知道数据,由于,百度知道上有大量的话题发布,以及话题下许多人对其进行的延伸意义解读、反讽等等信息是真实的人与人交流的数据信息。百度知道上的问题就是模型中的query,而对应问题下的好几个回答就是documents。

可以采用模块化设计实现本发明实施例,图2为本发明基于文本回答问题的方法另一实施例流程图,如图2所示,主要包括三个模块:(1)编码模块(对应Query Encoder和Documents Encoder):query和documents在Embedding(向量化)后输入到编码模块,其中,编码模块可以采用3个transformer(对应u1~u3或h1~h3)的编码器,使用self-attention的机制能够在训练上加快速度,并且可以让模型记住长距离的语义信息;(2)双向注意机制模块(对应Attention Flow Match Layer):从编码模块能得到query语义信息和documents语义信息,通过相似度矩阵计算词和词之间的关系,设计双向的注意力机制,输入到前馈神经网络得到它们的语义关系向量;(3)解码模块:借助于现有的注意力机制公式,采用Pointer Networks获得documents的起始索引和终止索引。

对上述三个模块具体说明如下:

对于(1)编码模块:

首先,编码模块的输入是Embedding的query和documents,可以利用腾讯的词向量文件进行查表,映射每个词为200维的向量。

编码模块主要由三个transformer组成,每一个transformer的每个位置的词向量都会通过一个self-attention层,然后将通过之前的词向量和输出加在一起,并采用L2norm进行处理,这样可以避免发生梯度弥散。最终的输出再通过前馈神经网络,然后,将通过之前的输出与其加在一起,并采用L2norm进行处理。即对所述文本语义信息和所述问题语义信息分别进行编码处理,参照图2,可以用编码处理后的文本语义信息和编码处理后的问题语义信息替换上述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数步骤中的问题语义信息和文本语义信息,并执行后续步骤,例如后续步骤S102和S103。进一步地,以文本语义信息为例,进行如下处理:

对所述文本语义信息进行向量化处理,以获取文本语义向量(对应图2中words);输入所述文本语义向量至所述预设问题回答模型中的self-attention层、并采用L2norm(就是欧几里德距离)对self-attention层的输出结果和所述文本语义向量进行处理,以获取第一处理结果;输入所述第一处理结果至所述预设问题回答模型中的前馈神经网络、并采用L2norm对前馈神经网络的输出结果和所述第一处理结果进行处理,以获取第二处理结果。对于问题语义信息,可参照文本语义信息的说明,不再赘述。

这里没有采用LSTM去获得句子的语义信息的原因是,documents中平均的词个数是300多,所以对于LSTM是很难训练的,很容易发生梯度弥散,而采用三层transformer能够有效的避免这个问题,并且也能加快训练。

对于(2)双向注意机制模块:

该模块的输入是通过编码模块得到的query语义信息U和documents语义信息H。输出是具有问题感知的上下文表征参数G。

首先,可以计算H和U的相似度矩阵(对应根据问题语义信息和文本语义信息,确定相似度矩阵):

S

S

(1).documents-to-query Attention计算的是:对每个documents word而言哪些query words和它最相关。计算公式如下(对应根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数):

U'=Σ

其中,U'为所述第一参数、softmax为所述分类器、S

将相似度矩阵S

(2).query-to-documents Attention计算的是:对每个query words而言哪些documents word和它最相关。计算公式如下(对应根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数):

H'=Σ

其中,H'为所述第二参数、softmax为所述分类器、max为求最大值函数、S

由于,这些文本对回答问题很重要,所以直接取相似度矩阵中最大的那一列,对其进行softmax归一化计算documents向量加权求和,得到H'。

(3).将前两步得到的U'和H'经过拼接输入到全连接网络得到具有问题感知的上下文表征G,拼接方式可以是G=β(H;U';H*U';H*H'),其中,β就是全连接网络。

对于(3)解码模块:

该模块的输入是通过编码模块得到的query语义信息U和双向注意机制模块得到的具有问题感知的上下文表征G,输出是在documents上起始索引和终止的索引。

基于机器阅读理解的特点,通过一种类似指针的方式解决问题,每个指针对应输入序列的一个元素,从而可以直接操作输入序列而不需要特意设定输出词汇表。

通过tanh激活函数结合query语义信息U和上下文表征G,最终通过softmax输出documents的最大起始和终止索引点。

通过基于transformer网络结构进行机器阅读理解,克服了之前使用循环神经网络的训练时间慢、更新时间长的缺点。该机器阅读理解还结合了问题和文档间的信息,提高输出准确率。

S102:根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数。

具体的,根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数。进一步地,可以根据如下拼接方式确定所述上下文表征参数:

G=β(H;U';H*U';H*H')

其中,G为所述上下文表征参数、β为所述全连接网络、H为所述文本语义信息、U'为所述第一参数、所述H'为所述第二参数。可参照上述说明,不再赘述。

S103:根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

具体的,根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。可参照上述说明,不再赘述。

本发明实施例提供的基于文本回答问题的方法,通过可反映问题语义信息和文本语义信息之间的双向语义关系的第一参数和第二参数,确定可感知问题的上下文表征参数,进而能够在文本语义信息中准确输出回答问题的起始索引和终止索引。

在上述实施例的基础上,所述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数,包括:

具体的,根据问题语义信息和文本语义信息,确定相似度矩阵;所述相似度矩阵的行是与文本语义信息中的各词分别对应的问题语义信息中的全部词之间的相似度,所述相似度矩阵的列是与问题语义信息中的各词分别对应的文本语义信息中的全部词之间的相似度;可参照上述说明,不再赘述。

具体的,根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数,并根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数。可参照上述说明,不再赘述。

本发明实施例提供的基于文本回答问题的方法,通过引入相似度矩阵确定第一参数和第二参数,保证第一参数和第二参数确定的合理性,进一步能够在文本语义信息中准确输出回答问题的起始索引和终止索引。

在上述实施例的基础上,所述根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数,包括:具体的,根据如下公式确定所述第一参数:

U'=Σ

其中,U'为所述第一参数、softmax为所述分类器、S

本发明实施例提供的基于文本回答问题的方法,通过具体公式确定第一参数,进一步保证第一参数确定的合理性,有助于在文本语义信息中准确输出回答问题的起始索引和终止索引。

在上述实施例的基础上,所述根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数,包括:具体的,根据如下公式计算所述第二参数:

H'=Σ

其中,H'为所述第二参数、softmax为所述分类器、max为求最大值函数、S

本发明实施例提供的基于文本回答问题的方法,通过具体公式确定第二参数,进一步保证第二参数确定的合理性,有助于在文本语义信息中准确输出回答问题的起始索引和终止索引。

在上述实施例的基础上,所述根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数,包括,具体的,根据如下拼接方式确定所述上下文表征参数:

G=β(H;U';H*U';H*H')

其中,G为所述上下文表征参数、β为所述全连接网络、H为所述文本语义信息、U'为所述第一参数、所述H'为所述第二参数。可参照上述说明,不再赘述。可参照上述说明,不再赘述。

本发明实施例提供的基于文本回答问题的方法,通过具体拼接方式确定上下文表征参数,进一步能够在文本语义信息中准确输出回答问题的起始索引和终止索引。

在上述实施例的基础上,所述输入问题语义信息和文本语义信息至预设问题回答模型的步骤之后,所述基于文本回答问题的方法还包括:

具体的,对所述文本语义信息和所述问题语义信息分别进行编码处理;可参照上述说明,不再赘述。

具体的,用编码处理后的文本语义信息和编码处理后的问题语义信息替换所述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数步骤中的问题语义信息和文本语义信息,并执行后续步骤。可参照上述说明,不再赘述。

本发明实施例提供的基于文本回答问题的方法,能够避免发生梯度弥散,进而改善该模型的鲁棒性。

在上述实施例的基础上,所述对所述文本语义信息和所述问题语义信息分别进行编码处理,包括:

对于所述文本语义信息进行如下处理:

具体的,对所述文本语义信息进行向量化处理,以获取文本语义向量;可参照上述说明,不再赘述。

具体的,输入所述文本语义向量至所述预设问题回答模型中的self-attention层、并采用L2norm对self-attention层的输出结果和所述文本语义向量进行处理,以获取第一处理结果;可参照上述说明,不再赘述。

具体的,输入所述第一处理结果至所述预设问题回答模型中的前馈神经网络、并采用L2norm对前馈神经网络的输出结果和所述第一处理结果进行处理,以获取第二处理结果;可参照上述说明,不再赘述。

对于所述问题语义信息进行如下处理:

具体的,对所述问题语义信息进行向量化处理,以获取问题语义向量;可参照上述说明,不再赘述。

具体的,输入所述问题语义向量至所述预设问题回答模型中的self-attention层、并采用L2norm对self-attention层的输出结果和所述问题语义向量进行处理,以获取第一处理结果;可参照上述说明,不再赘述。

具体的,输入所述第一处理结果至所述预设问题回答模型中的前馈神经网络、并采用L2norm对前馈神经网络的输出结果和所述第一处理结果进行处理,以获取第二处理结果。可参照上述说明,不再赘述。

本发明实施例提供的基于文本回答问题的方法,进一步能够避免发生梯度弥散,更好地改善该模型的鲁棒性。

图3为本发明基于文本回答问题的装置实施例结构示意图,如图3所示,本发明实施例提供了一种基于文本回答问题的装置,包括第一确定单元301、第二确定单元302和回答单元303,其中:

第一确定单元301用于输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;第二确定单元302用于根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;回答单元303用于根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

具体的,第一确定单元301用于输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;第二确定单元302用于根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;回答单元303用于根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本发明实施例提供的基于文本回答问题的装置,通过可反映问题语义信息和文本语义信息之间的双向语义关系的第一参数和第二参数,确定可感知问题的上下文表征参数,进而能够在文本语义信息中准确输出回答问题的起始索引和终止索引。

本发明实施例提供的基于文本回答问题的装置具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。

图4为本发明实施例提供的电子设备实体结构示意图,如图4所示,所述电子设备包括:处理器(processor)401、存储器(memory)402和总线403;

其中,所述处理器401、存储器402通过总线403完成相互间的通信;

所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号