首页> 中国专利> 一种语音推荐语展示方法、装置、系统及电子设备

一种语音推荐语展示方法、装置、系统及电子设备

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明实施例提供了一种语音推荐语展示方法、装置、系统及电子设备，涉及数据处理技术领域，包括：接收客户端发送的、携带语音场景信息的语音推荐语获取请求，其中，语音场景信息为：用于指示客户端当前所处的语音场景的信息；基于语音场景信息，从预设的多个语音句式中，筛选出符合语音场景的目标语音句式，并基于语音场景信息，确定符合语音场景的语音关键词；基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，并向客户端反馈语音推荐语，以使客户端展示语音推荐语。应用上述方法可以帮助用户更规范的使用语音控制，并提高语音控制的成功率。

著录项

公开/公告号CN112927686A

专利类型发明专利
公开/公告日2021-06-08

原文格式PDF
申请/专利权人北京奇艺世纪科技有限公司;
展开▼

申请/专利号CN202110073647.7
发明设计人付浩翔;毛晓涛;王视鎏;钟昊;
展开▼

申请日2021-01-20
分类号G10L15/22(20060101);G10L15/08(20060101);G10L15/30(20130101);G06F16/68(20190101);
代理机构11413 北京柏杉松知识产权代理事务所(普通合伙);
代理人孟维娜;马敬
地址 100080 北京市海淀区海淀北一街2号鸿城拓展大厦10、11层
入库时间 2023-06-19 11:17:41

说明书

技术领域

本发明涉及数据处理技术领域，特别是涉及一种语音推荐语展示方法、装置、系统及电子设备。

背景技术

随着语音识别技术的快速发展，为便于用户操作设备，越来越多的场景中引入了通过语音识别技术实现语音控制的功能。例如，在音视频领域，可以通过语音识别技术实现音视频选择、播放进度控制以及音视频搜索等功能。

语音控制作为一种较为新颖的控制方式，与传统的按键控制在控制操作上存在很大的不同，语音控制需要用户通过语音下发控制命令。由于口语的复杂性，同一个控制命令往往会存在多种口语表达方式，导致用户通过语音下发的控制命令不规范。因此，如何帮助用户规范的通过语音下发控制命令是亟需解决的技术问题。

发明内容

本发明实施例的目的在于提供一种语音推荐语展示方法、装置、系统及电子设备，以帮助用户更规范的使用语音控制，并提高语音控制的成功率。具体技术方案如下：

第一方面，本发明实施例提供了一种语音推荐语展示方法，应用于服务器，包括：

接收客户端发送的、携带语音场景信息的语音推荐语获取请求，其中，所述语音场景信息为：用于指示所述客户端当前所处的语音场景的信息；

基于所述语音场景信息，从预设的多个语音句式中，筛选出符合所述语音场景的目标语音句式，并基于所述语音场景信息，确定符合所述语音场景的语音关键词；

基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，并向所述客户端反馈所述语音推荐语，以使所述客户端展示所述语音推荐语。

进一步的，所述语音场景信息包括目标界面信息，所述目标界面信息为：所述客户端前台界面的界面信息；

所述基于所述语音场景信息，从预设的多个语音句式中，筛选出符合所述语音场景的目标语音句式，包括：

基于预先建立的语音句式与界面信息之间的关联关系，从预设的多个句式中，筛选出与所述目标语音场景信息存在关联关系的目标语音句式。

进一步的，所述基于所述语音场景信息，确定符合所述语音场景的语音关键词，包括：

基于所述目标界面信息，从预设关键词库中，筛选出与所述前台界面相关的关键词。

进一步的，所述语音场景信息包括：用户信息和所述客户端的前台界面的目标界面信息；

所述基于所述语音场景信息，确定符合所述语音场景的语音关键词，包括：

查找与所述用户信息关联的用户画像，作为目标用户画像；

基于所述目标界面信息，从所述目标用户画像包含的标签中选择与所述前台界面相关的目标标签；

基于所选择的目标标签，确定符合所述语音场景的语音关键词。

进一步的，所述目标用户画像为：基于用户基础信息和/或用户智能家居信息所生成的；其中，所述用户智能家居信息为智能家居系统所收集的用户信息。

进一步的，所述目标界面信息包括：界面状态信息和界面标识，所述界面状态信息为：用于指示所述前台界面的界面状态的信息；

所述基于所述目标界面信息，从所述目标用户画像包含的标签中选择与所述前台界面相关的目标标签，包括：

基于所述界面标识，确定所述前台界面的界面类型和/或界面内容；

从所述目标用户画像包含的标签中，筛选出与所述界面状态、所述界面类型和/或所述界面内容相关的标签，作为与所述前台界面相关的目标标签。

进一步的，所述基于所选择的目标标签，确定符合所述语音场景的语音关键词，包括：

根据以下方式中的至少一种，确定符合所述语音场景的语音关键词：

将所述目标标签作为语音关键词；

在所述目标标签为视频标签类型时，选取属于所述前台界面所属的频道类型、且包含的视频标签包含所述目标标签的视频的视频名称，作为所述语音关键词；

在所述前台界面包含视频时，选取视频标签中包含所述目标标签、且所述前台界面未包含的视频的视频名称，作为所述语音关键词。

第二方面，本发明实施例提供了一种语音推荐语展示方法，应用于客户端，包括：

获取指示当前所处语音场景的语音场景信息；

向服务器发送推荐语获取请求，其中，所述推荐语获取请求中携带所述语音场景信息；

接收所述服务器反馈的语音推荐语，其中，所述语音推荐语为基于语音关键词和目标语音句式所构建的，所述语音关键词为所述服务器基于所述语音场景信息所确定的符合所述语音场景的关键词，所述目标语音句式为所述服务器基于所述语音场景信息，从预设的多个语音句式中筛选出的符合所述语音场景的语音句式；

展示所述语音推荐语。

第三方面，本发明实施例提供了一种语音推荐语展示系统，所述系统包括：客户端和服务器，其中，

所述客户端，用于获取指示当前所处语音场景的语音场景信息，并且向所述服务器发送推荐语获取请求，其中，所述推荐语获取请求中携带所述语音场景信息；

所述服务器，用于接收所述推荐语获取请求，并且基于所述语音场景信息，从预设的多个语音句式中，筛选出符合所述语音场景的目标语音句式，以及基于所述语音场景信息，确定符合所述语音场景的语音关键词，以及基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，以及向所述客户端反馈所述语音推荐语；

所述客户端，还用于接收所述服务器反馈的所述语音推荐语，并展示所述语音推荐语。

第四方面，本发明实施例提供了一种语音推荐语展示装置，应用于服务器，包括：

请求接收模块，用于接收客户端发送的、携带语音场景信息的语音推荐语获取请求，其中，所述语音场景信息为：用于指示所述客户端当前所处的语音场景的信息；

信息处理模块，用于基于所述语音场景信息，从预设的多个语音句式中，筛选出符合所述语音场景的目标语音句式，并基于所述语音场景信息，确定符合所述语音场景的语音关键词；

推荐语构建模块，用于基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，并向所述客户端反馈所述语音推荐语，以使所述客户端展示所述语音推荐语。

第五方面，本发明实施例提供了一种语音推荐语展示装置，应用于客户端，包括：

信息获取模块，用于获取指示当前所处语音场景的语音场景信息；

请求发送模块，用于向服务器发送推荐语获取请求，其中，所述推荐语获取请求中携带所述语音场景信息；

推荐语接收模块，用于接收所述服务器反馈的语音推荐语，其中，所述语音推荐语为基于语音关键词和目标语音句式所构建的，所述语音关键词为所述服务器基于所述语音场景信息所确定的符合所述语音场景的关键词，所述目标语音句式为所述服务器基于所述语音场景信息，从预设的多个语音句式中筛选出的符合所述语音场景的语音句式；

推荐语展示模块，用于展示所述语音推荐语。

第六方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的语音推荐语展示方法步骤。

第七方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的语音推荐语展示方法。

第八方面，本发明实施例提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的语音推荐语展示方法。

本发明实施例提供的语音推荐语展示方法、装置、系统及电子设备，可以通过客户端当前所处的语音场景，构建语音推荐语，并客户端上展示语音推荐语，从而可以提醒用户按照展示的语音推荐语通过下发控制命令，从而可以帮助用户更规范的使用语音控制。

进一步的，本发明实施例所提供的技术方案中，展示在客户端的语音推荐语是基于目标语音句式和语音关键词所构建的，且目标语音句式和语音关键词的确定均时基于指示客户端当前所处的语音场景的语音场景信息所确定，从而针对客户端所处的不同语音场景，构建不同的语音推荐语，使得所构建的语音推荐语可以与客户端所处的语音场景相匹配，使得用户更愿意按照语音推荐语去下发语音控制指令，进而还可以提高语音控制的成功率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明一个实施例提供的语音推荐语展示系统的结构示意图。

图2为本发明一个实施例提供的应用于服务器的语音推荐语展示方法的流程图。

图3为本发明一个实施例提供的应用于客户端的语音推荐语展示方法的流程图。

图4为本发明一个实施例提供的关键词确定方法的流程图。

图5为本发明另一个实施例提供的语音推荐语展示系统的结构示意图。

图6为本发明一个实施例提供的应用于服务器的语音推荐语展示装置的结构示意图。

图7为本发明一个实施例提供的应用于客户端的语音推荐语展示装置的结构示意图。

图8为本发明一个实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了清楚地阐述本发明实施例提供的技术方案，首先站在系统角度从整体上对本发明实施例提供的技术方案进行简单介绍，如图1所示，本发明实施例提供了一种语音推荐语展示系统的结构示意图，包括：客户端和服务器，其中，

客户端，用于获取指示当前所处语音场景的语音场景信息，并且向服务器发送推荐语获取请求，其中，推荐语获取请求中携带语音场景信息；

服务器，用于接收推荐语获取请求，并且基于语音场景信息，从预设的多个语音句式中，筛选出符合语音场景的目标语音句式，以及基于语音场景信息，确定符合语音场景的语音关键词，以及基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，以及向客户端反馈语音推荐语；

客户端，还用于接收服务器反馈的语音推荐语，并展示语音推荐语。

上述客户端可以为互联网电视、电视机顶盒、个人计算机、智能移动终端等电子设备，在实际使用场景中，客户端可以根据用户的操作展示各类界面，如首页界面、电视剧界面、电影界面、综艺界面、视频详情界面等。

在使用的过程中，客户端可以获取指示当前所处语音场景的语音场景信息，其中，语音场景可以为使用语音时用户所面对的场景。如用户刚刚登陆账户、用户打开了一个新的界面、用户切换了界面、用户始终停留在一个界面、用户反复滑动界面、用户观看视频的时长过短或用户反复观看同一个视频等。

不同的语音场景可能反映出用户不同的语音需求。如用户打开一个新的界面，则可能反映出用户想要在当前新打开的界面中查找自己喜欢的内容；又如用户反复滑动影视界面，则可能反应出用户对影视作品感兴趣、但当前影视界面中所展示的影视作品没有用户想看的；再如，用户观看视频的时长过短，则可能反应用户被当前视频的标题吸引，但对视频的内容不感兴趣等。

可选的，客户端可以周期性的获取语音场景信息，也可以在满足预设的触发条件时获取语音场景信息。其中，触发条件可以基于实际需求确定的，如可以依据客户端接收到的界面操作、前台界面的静止时长、界面的切换、界面焦点所在位置和时长等各类影响因素设置触发条件。示例性的，在客户端接收到从前台界面切换到上一级界面的切换操作时，满足触发条件，此时，客户端可以获取语音场景信息。

可选的，指示客户端所处语音场景的语音场景信息可以包括：与登录客户端的用户账户相关的用户信息，和/或与客户端的前台界面相关的目标界面信息。

其中，用户信息可以为用户标识，如用户账户。而目标界面信息则可以为用于反映前台界面状态的界面状态信息和用于表征前台界面的界面标识。

其中，上述界面状态信息可以为指示客户端前台界面的界面状态的信息，如事先约定的表征界面状态的状态标识，不同的状态标识表示不同的界面状态。而界面状态可以包括以下状态中的至少一种：静止状态、向上切换状态、向下切换状态、滑动状态、焦点状态。

可选的，静止状态可以为表征客户端前台界面的静止时长大于预设时长的状态。而前台界面的静止时长可以理解为前台界面未被切换的时长。举例而言，客户端在12时30分切换到影视界面，则该影视界面作为新的前台界面被展示，在客户端展示该影视界面后，用户在12时31分之前始终停留在该影视界面、且未执行滑动、切换等针对影视界面的操作，则可认为影视界面处于静止状态。上述预设时长可以结合经验、场景和/或需求进行设定，如可以为1分钟。

可选的，上述向上切换状态可以为表征客户端从前台界面切换到上一级界面时的状态，而上述向下切换状态可以为表征客户端从前台界面切换到下一级界面时的状态。

举例而言，存在主页界面、影视界面和影视推荐界面。其中，对于主页界面而言，主页界面的下一级界面为影视界面，而对于影视界面而言，影视界面的上一级界面为主页界面，影视界面的下一级界面为影视推荐界面，对于影视推荐界面而言，影视推荐界面的上一级界面为影视界面。若前台界面为主页界面，则从主页界面切换到影视界面，可以被认定为向下切换状态；若前台界面为影视界面，则从影视界面切换到主页界面，可以被认定为向上切换状态，而从影视界面切换到影视推荐界面，可以被认定为向下切换状态；若前台界面为影视推荐界面，则从影视推荐界面切换到影视界面，可以被认定为向上切换状态。

可选的，上述滑动状态可以为表征前台界面滑动的状态。举例而言，客户端的前台界面为动漫界面，而该动漫界面始终频繁滑动，则可认为前台界面处于滑动状态。可选的，可以基于单位时间内所接收到的滑动操作次数作为滑动状态的判断依据。例如，在30s内接收到大于5次的滑动操作，则判定前台界面处于滑动状态。需要说明的是，本发明实施例所指的滑动操作与切换操作不同，切换操作用于切换界面，而滑动操作用于调整前台界面的显示区域。其中，显示区域为被客户端的显示器所展示的区域，本领域技术人员所知的，对于一些显示器或界面而言，显示器并不能单次完全显示出界面的内容，而只能显示界面的部分内容。

可选的，上述焦点状态可以为表征前台界面中焦点框所处位置的变化情况。其中，焦点框可以为光标、选择框等用于进行内容选择的图标。当前台界面中的焦点框始终位于同一界面区域时，则可认为当前为焦点状态。

可选的，上述界面标识可以为前台界面的访问地址，或事项约定的用于表征前台界面的标识，如字符串。

客户端在运行的过程中可以获取指示当前所处语音场景的语音场景信息，并且向服务器发送推荐语获取请求。其中，推荐语获取请求中携带语音场景信息；

在本发明的一个实施例中，可以将客户端获取语音场景信息与上述触发条件结合。当前台界面满足预设触发条件，则意味着已获取语音场景信息。不同的触发条件对应着不同的语音场景信息。示例性的，预设的触发条件可以为用户登录，当完成用户登录后，获取用户的登录账户，作为语音场景信息。或者，预设的触发条件为向上切换状态，即当客户端接收到向上一级界面进行切换的切换操作时，获取前台界面当前所处向上切换状态的状态标识，作为语音场景信息。或者，预设触发条件为界面展示，每一次切换展示新的前台界面，则获取该前台界面的界面标识，作为语音场景信息。

可选的，当预设触发条件与界面状态相关时，在另一种实现方式中，当客户端的前台界面满足预设的界面状态时，可以同时获取当前登录的用户的用户信息、表征前台界面所满足的界面状态的状态标识和前台界面的界面标识，并将所获取的用户信息、状态标识和界面标识作为语音场景信息。

可选的，当客户端获取到语音场景信息后，可以向服务器发送携带有语音场景信息的语音推荐语获取请求。在实际应用场景中，客户端向服务器发送的语音推荐语获取请求还可以结合实际的使用需求，携带所需求的其他信息，如设备标识、客户端所处位置信息、上一级界面的界面标识、下一级界面的界面标识、前台界面所展示区域的区域标识等信息。

服务器在接收到客户端发送的语音推荐语获取请求后，可以先解析出语音推荐语获取请求中携带的语音场景信息。再进一步的基于语音场景信息获取符合语音场景信息所指示语音场景的目标语音句式和语音关键词。

其中，语音句式包含预留的、待填入关键词的空位的语句，如：“我要看XXX”、“播放XXX”、“我想看XXX”等。进一步的，还可以为：“按住语音键，试试说：我要看XXX”、“XXX没看够？你还可以说：我要看XXX|播放XXX”等。上述“XXX”为预留的、待填入关键词的空位。

可选的，在已预设多个语音句式的情况下，可以建立语音句式与语音场景信息之间的关联关系表，表格中每一语音场景信息都存在与其对应的至少一个语音句式。服务器在解析出指示语音场景的语音场景信息后，可以从关联关系表中查找与该语音场景信息相关联的语音句式，作为符合该语音场景信息所指示语音场景的目标语音句式。

可选的上述语音关键词可以包括视频的视频名称、视频的导演、演员、拍摄年份、视频类型等。如青春有你2、偶像练习生、大鱼海棠、沈腾、夏洛特烦恼等。

可选的，在本发明的另一实现方式中，上述关键词还可以包括结构化的关键词组。如“蔡徐坤(青春有你2(综艺)、偶像练习生(综艺))”、“卡通片(大鱼海棠(电影)、哪吒(电影)、大法师(电影)”、“名侦探柯南(动漫))”、“沈腾(王牌对王牌(综艺)”、“西红柿首富(电影)、夏洛特烦恼(电影))”。

可选的，在本发明的另一实现方式中，还可以可以将语音关键词划分为内容关键词和标签关键词。其中内容关键词表征视频的内容，可以为视频的名称，如上述青春有你2等，而标签关键词则为视频的标签，其包括视频的导演、演员、视频类型，如上述的蔡徐坤、综艺等。

服务器在接收到客户端发送的语音推荐语获取请求后，可以从基于预先针对不同语音场景信息所设置的选取规则，确定针对语音推荐语获取请求中所携带的语音场景信息所设置的选取规则，并基于该选取规则确定出符合语音场景的语音关键词。

在确定出目标语音句式和语音关键词后，服务器还可以基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语。示例性的，如服务器确的目标语音句式为：“我要看XXX”，而确定的语音关键词为:青春有你2，则构建的语音推荐语为：我要看青春有你2。

进一步的，服务器将生成的语音推荐语反馈至客户端。而客户端在接收到服务器反馈的推荐语后，可以展示所接收到的推荐语。

本发明实施例所提供的技术方案，由于可以通过客户端当前所处的语音场景，构建语音推荐语，并客户端上展示语音推荐语，从而可以提醒用户按照展示的语音推荐语通过下发控制命令，从而可以帮助用户更规范的使用语音控制。

进一步的，由于展示在客户端的语音推荐语是基于目标语音句式和语音关键词所构建的，且目标语音句式和语音关键词的确定均时基于指示客户端当前所处的语音场景的语音场景信息所确定，从而针对客户端所处的不同语音场景，构建不同的语音推荐语，使得所构建的语音推荐语可以与客户端所处的语音场景相匹配，使得用户更愿意按照语音推荐语去下发语音控制指令，进而还可以提高语音控制的成功率。

下面再分别站在服务器侧和客户端侧对本发明的技术方案进行详细说明。

如图2所示，本发明实施例还提供一种语音推荐语展示方法，应用于服务器，该方法包括：

S201：接收客户端发送的、携带语音场景信息的语音推荐语获取请求，其中，语音场景信息为：用于指示客户端当前所处的语音场景的信息。

S202：基于语音场景信息，从预设的多个语音句式中，筛选出符合语音场景的目标语音句式，并基于语音场景信息，确定符合语音场景的语音关键词。

S203：基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，并向客户端反馈语音推荐语，以使客户端展示语音推荐语。

相应的，如图3所示，本发明实施例还提供一种语音推荐语展示方法，应用于客户端，该方法包括：

S301：获取指示当前所处语音场景的语音场景信息。

S302：向服务器发送推荐语获取请求，其中，推荐语获取请求中携带语音场景信息。

S303：接收服务器反馈的语音推荐语，其中，语音推荐语为基于语音关键词和目标语音句式所构建的，语音关键词为服务器基于语音场景信息所确定的符合语音场景的关键词，目标语音句式为服务器基于语音场景信息，从预设的多个语音句式中筛选出的符合语音场景的语音句式。

S304：展示语音推荐语。

本发明实施例提供的上述如图2或如图3所示的语音推荐语展示方法，由于可以通过客户端当前所处的语音场景，构建语音推荐语，并客户端上展示语音推荐语，从而可以提醒用户按照展示的语音推荐语通过下发控制命令，从而可以帮助用户更规范的使用语音控制。

本发明实施例所提供的如图2和如图3所示的语音推荐语展示方法，其具体实现方式与本发明实施例提供的如图1所示的语音推荐语展示系统相同或相似，在此不再赘述。

可选的，在本发明的另一实施例中，上述语音推荐语获取请求中携带的语音场景信息可以包括目标界面信息，该目标界面信息为：客户端前台界面的界面信息。此时，上述步骤S202中基于语音场景信息，从预设的多个语音句式中，筛选出符合语音场景的目标语音句式，可以包括：

基于预先建立的语音句式与界面信息之间的关联关系，从预设的多个句式中，筛选出与目标语音场景信息存在关联关系的目标语音句式。

其中，在本发明的一种实现方式中，语音句式与界面信息之间的关联关系可以根据实际的需求和经验进行建立。

可选的，在本发明的另一种实现方式中，当目标界面信息包括用于指示前台界面的界面状态的界面状态信息时，预先建立的语音句式与界面信息之间的关联关系可以为：预先建立的语音句式与界面状态信息之间的关联关系。而语音句式与界面状态信息之间的关联关系的建立可以基于语音句式所表达出的需求与界面状态所反映出的用户需求是否匹配进行建立。

举例而言，当界面状态为静止状态或焦点状态时，则用户可能并不想查找视频，即用户暂时并不知道想看什么视频。因此，与静止状态所关联的可以为“不知道看什么？试试说：我要看XXX”、“播放XXX”等语音句式。

当界面状态为向上切换状态时，则用户可能对前台界面的内容不感兴趣，而返回上一级界面去寻找其他内容。因此，与上切换状态所关联的可以为“没有找到想看的？试试说：我要看XXX|播放XXX”等语音句式。

当界面状态为向下切换状态时，则用户可能从前台界面中找到了感兴趣的内容。因此，与下切换状态所关联的可以为“想要观看XXX？您可以直接说：我要看XXX|播放XXX”等语音句式。

当界面状态为滑动状态时，则可能是用户想要观看与前台界面中类型相关的内容，但未找到自己想要观看的。因此，与滑动状态所关联的可以为“想看喜剧吗？您可以直接说：我要看XXX|播放XXX”等语音句式。

相应于上述实施例，在语音推荐语获取请求中携带的语音场景信息可以包括目标界面信息的情况下，上述步骤S202中基于语音场景信息，确定符合语音场景的语音关键词，可以包括：

基于目标界面信息，从预设关键词库中，筛选出与前台界面相关的关键词。

其中，预设关键库中包含针对各界面所设置的关键词，如针对影视界面，所设置的关键词为西红柿首富、夏洛特烦恼，而针对综艺所设置的关键词为王牌对王牌、偶像练习生、青春有你2等。针对单个的影视界面，所设置的关键词可以为该影视作品的导演、演员、拍摄年份、视频类型等，如前台界面为西红柿首富的播放界面，则所设置的关键词可为沈腾、喜剧等。

可选的，在一种实现方式中，从预设关键词库中，筛选出与前台界面相关的关键词可以为筛选出针对前台界面所设置的关键词。

示例性的，服务器基于目标界面信息确定客户端当前的前台界面为界面1，而在预设关键词库中，针对界面1所设置的关键词包括：西红柿首富、夏洛特烦恼。则可以从西红柿首富和夏洛特烦恼选择一个或多个关键词作为与前台界面相关的关键词。

可选的，若语音推荐语获取请求中除携带客户端的前台界面的目标界面信息外，还携带有用户信息。此时，如图4所示，在本发明的另一实施例中，还提供一种语音关键词确定方法的流程图，以实现上述步骤S202中基于语音场景信息，确定符合语音场景的语音关键词，包括：

S401：查找与用户信息关联的用户画像，作为目标用户画像。

可选的，用户画像为：基于用户基础信息和/或用户智能家居信息所生成的；其中，用户智能家居信息为智能家居系统所收集的用户信息。

其中，上述用户基础信息可以包括用户在各属性维度的信息，如用户年龄、用户性别、用户所在地域等用户信息。示例性的，用户A的各属性维度的信息包括：李红、20周岁、女性、北京用户。用户基础信息还可以包括用户偏好信息，而用户偏好信息可以包含基于用户历史浏览数据、历史观看数据等数据分析出用户的偏好。示例性的，用户A的用户偏好信息可以包括：喜剧、综艺、鹿X，其表示该用户A对影视风格为喜剧、影视类型为综艺和/或由鹿X作为演员的影视较为感兴趣。

上述用户智能家居信息为智能家居系统所收集的用户信息。其中，智能家具系统可以包括智能电视(电视盒)、智能音箱、智能家具控制器等各类智能设备。各智能设备可以采集用户的语音和/或行为数据，并基于所采集的语音和/或行为数据分析的用户状态。示例性的，以采集用户语音数据为例，基于所采集的用户语音数据可以生成用户声纹信息，包括所采集的用户语音所说的词语、以及基于所采集的语音所分析的用户状态。示例性的，通过所采集的用户A的用户语音判定该用户为一位青年女性，则所判定的“青年女性”作为该用户的用户声纹信息。再举一例，采集到的用户A的用户语音为“我想看喜剧综艺”，则将“喜剧综艺”作为该用户的用户声纹信息。

基于用户基础信息和/或用户智能家居信息可以生成用户画像。举例而言，基于用户A的用户基础信息和用户智能家居信息，所生成用户A的用户画像为：李红、20周岁、青年女性、北京用户、对影视风格为喜剧、影视类型为综艺和/或由鹿X作为演员的影视较为感兴趣。

需要说明的是，每一用户的用户画像可以是预先生成的。具体的，可以预先在预设位置存储每个用户的用户画像，并且建立每个用户的用户信息与用户画像之间的关联关系。示例性的，建立用户画像和用户标识之间的关联关系，如与用户A关联的用户画像为用户画像1，与用户B关联的用户画像为用户画像2，与用户C关联的用户画像为用户画像3。当接收到的语音场景信息中包含的用户信息为用户B时，则确定目标用户画像为用户画像2。

S402：基于目标界面信息，从目标用户画像包含的标签中选择与前台界面相关的目标标签。

其中，用户画像中包含表征用户偏好的影视类型的标签，如上述示例中用户A的用户画像包含的标签：喜剧、综艺和鹿X等，表征用户A对喜剧、综艺和/或包含鹿X的影视感兴趣。因此，从目标用户画像包含的标签中确定出的目标标签可以确定、或预测出用户的视频偏好。

可选的，在一种实现方式中，目标用户画像包含的标签中与前台界面相关的目标标签可以为：目标用户画像包含的标签中与前台界面的界面类型相匹配的标签。示例性的，目标用户画像包含的标签包括战争电影、喜剧电影和真人秀综艺，而前台界面的界面类型为电影，则目标用户画像包含的标签中与前台界面相匹配的标签包括战争电影和喜剧电影。

可选的，在一种实现方式中，目标用户画像包含的标签中与前台界面相关的目标标签可以为：目标用户画像包含的标签中与前台界面的界面类型不同的标签。示例性的，目标用户画像包含的标签包括战争电影、喜剧电影和真人秀综艺，而前台界面的界面类型为电影，则目标用户画像包含的标签中与前台界面不同的标签包括真人秀综艺。

可选的，在一种实现方式中，目标用户画像包含的标签中与前台界面所要切换的界面相关的标签。示例性的，目标用户画像包含的标签包括战争电影、喜剧电影和真人秀综艺，而前台界面所要切换的界面的界面类型为电影，则目标用户画像包含的标签中与前台界面相关的标签为战争电影、喜剧电影。

可选的，在一种实现方式中，上述目标界面信息可以包括：界面状态信息和界面标识，该界面状态信息为：用于指示前台界面的界面状态的信息，此时，可以按照以下方式，实现步骤S402，包括：

基于界面标识，确定前台界面的界面类型和/或界面内容；从目标用户画像包含的标签中，筛选出与界面状态、界面类型和/或界面内容相关的标签，作为与前台界面相关的目标标签。

当目标界面信息包含界面状态信息时，可以进一步的结合界面状态信息所指示的界面状态确定目标用户画像包含的标签中与前台界面相关的目标标签具体是何种相关性。

可选的，在一种实现方式中，当界面状态为刚切换进该前台界面时，则可以在目标用户画像所包含的标签中选取与前台界面的界面类型相匹配的用户标签。示例性的，前台界面的界面类型为电影界面，而目标用户画像所包含的用户标签包括：喜剧、战争、沈腾等，则可以确定出喜剧作为与前台界面相关的标签。

当界面状态为向上一级切换时，则可以从目标用户画像包含的标签中选择出与前台界面的界面内容相匹配的标签。

当前台界面始终处于滑动状态时，则可能因为用户在前台界面中未找到想要观看的视频，因此，则可以为基在目标用户画像所包含的标签中选取与前台界面的界面类型无关的用户标签。

当界面状态为静止状态时，则可能为用户并未想查找视频，此时可以随机的选择目标用户画像所包含的用户标签，进一步的，还可以结合用户的界面焦点的变化情况，其中，用户的界面焦点可以基于界面中焦点框所处的位置确定，即将界面中光标所处的位置作为该用户的界面焦点，当界面焦点始终位于同一界面区域时，则可以根据该界面区域所包含的视频类型和/或视频内容从目标用户画像包含的标签中选择与该界面区域相关的标签。

S403：基于所选择的目标标签，确定符合语音场景的语音关键词。

可选的，可以根据以下方式中的至少一种方式，确定符合语音场景的语音关键词：

方式一：将目标标签作为语音关键词；

该方式中，将目标标签直接作为语音关键词。示例性的，目标标签为青春有你2，则可以将青春有你2直接作为语音关键词。

方式二：在目标标签为视频标签类型时，选取属于前台界面所属的频道类型、且包含的视频标签包含目标标签的视频的视频名称，作为语音关键词；

该方式中，目标标签为视频标签类型，则表示用户可能对视频标签中包含目标标签的视频较为感兴趣，因此，可以选取属于前台界面所属的界面类型、且包含的视频标签包含目标标签的视频的视频名称，作为语音关键词。

示例性的，目标标签为演员吴京，前台界面所属的界面类型为电影，则可以将由吴京主演的电影类作品“战狼2”作为语音关键词。又如，目标标签为喜剧，前台界面所属的界面类型为综艺，则可以视频标签包含喜剧综艺的视频的视频名称作为语音关键词，如“欢乐喜剧人”。

方式三：在前台界面包含视频时，选取视频标签中包含目标标签、且前台界面未包含的视频的视频名称，作为语音关键词。

该方式中，前台界面包含视频则表示用户可能正在观看或想要观看该视频，则可以为确定与该前台界面包含视频相关的视频作为语音关键词。示例性的，目标标签为沈腾，确定视频标签中包含目标标签的视频包括：西红柿首富和夏洛特烦恼，而前台界面包含有电影西红柿首富，则确定夏洛特烦恼作为语音关键词。

在一种可能的示例中，当前台界面正在播放电影西红柿首富时，前端将西红柿首富方式至推荐后台，推荐后台基于前端提供的“西红柿首富”确定标签“沈腾”，进而基于“沈腾”推荐语沈腾相关的推荐语元素“夏洛特烦恼”。

在本发明的一个实施例中，除上述基于用户画像确定出语音关键词的方式之外，还可以基于用户偏好确定出语音关键词，示例性的，当前天界面从其他界面切换至电影界面后，则可以将语音关键词设置为与用户偏好的电影相关的电影名称。

本发明实施例提供的如图4所示的语音关键词确定方法，可以根据用户用户信息和目标界面信息，确定语音关键词，为后续生成推荐语提供了基础。

在本发明的另一个实施例中，结合实际的应用场景，如图5，还提供一种语音推荐语展示系统的结构示意图，该系统中包括：客户端、推荐服务器和推荐语生成服务器，其中，客户端可以实时的收集用户历史浏览数据和声纹数据，并将收集的历史浏览数据、声纹数据和设备数据发送至推荐服务器，推荐服务器根据所接收到的数据生成用户画像，并实施对用户画像进行调整，当客户端满足预设的触发条件后，向推荐语生成服务器发送语音推荐语获取请求，推荐语生成服务器将语音推荐语获取请求中所携带的用户标识发送至推荐服务器，推荐服务器根据用户标识确定目标用户画像，并将目标用户画像反馈至推荐语生成服务器，推荐语生成服务器结合目标用户画像和语音推荐语获取请求携带的目标界面信息生成语音推荐语，并向客户端反馈生成的语音推荐语。

基于同一发明构思，根据本发明实施例提供的如图2所示的语音推荐语展示方法，如图6所示，本发明实施例还提供了一种语音推荐语展示装置，应用于服务器，该装置包括：

请求接收模块601，用于接收客户端发送的、携带语音场景信息的语音推荐语获取请求，其中，语音场景信息为：用于指示客户端当前所处的语音场景的信息；

信息处理模块602，用于基于语音场景信息，从预设的多个语音句式中，筛选出符合语音场景的目标语音句式，并基于语音场景信息，确定符合语音场景的语音关键词；

推荐语构建模块603，用于基于所确定的语音关键词和所筛选的目标语音句式，构建语音推荐语，并向客户端反馈语音推荐语，以使客户端展示语音推荐语。

进一步的，语音场景信息包括目标界面信息，目标界面信息为：客户端前台界面的界面信息；

基信息处理模块，具体用于基于预先建立的语音句式与界面信息之间的关联关系，从预设的多个句式中，筛选出与目标语音场景信息存在关联关系的目标语音句式。

进一步的，基信息处理模块，具体用于基于目标界面信息，从预设关键词库中，筛选出与前台界面相关的关键词。

进一步的，语音场景信息包括：用户信息和客户端的前台界面的目标界面信息；

基信息处理模块，具体用于查找与用户信息关联的用户画像，作为目标用户画像；基于目标界面信息，从目标用户画像包含的标签中选择与前台界面相关的目标标签；基于所选择的目标标签，确定符合语音场景的语音关键词。

进一步的，目标用户画像为：基于用户基础信息和/或用户智能家居信息所生成的；其中，用户智能家居信息为智能家居系统所收集的用户信息。

进一步的，目标界面信息包括：界面状态信息和界面标识，界面状态信息为：用于指示前台界面的界面状态的信息；

基信息处理模块，具体用于基于界面标识，确定前台界面的界面类型和/或界面内容；从目标用户画像包含的标签中，筛选出与界面状态、界面类型和/或界面内容相关的标签，作为与前台界面相关的目标标签。

进一步的，基信息处理模块，具体用于根据以下方式中的至少一种，确定符合语音场景的语音关键词：

将目标标签作为语音关键词；

在目标标签为视频标签类型时，选取属于前台界面所属的频道类型、且包含的视频标签包含目标标签的视频的视频名称，作为语音关键词；

在前台界面包含视频时，选取视频标签中包含目标标签、且前台界面未包含的视频的视频名称，作为语音关键词。

本发明实施例提供的如图6所示的语音推荐语展示装置，由于可以通过客户端当前所处的语音场景，构建语音推荐语，并客户端上展示语音推荐语，从而可以提醒用户按照展示的语音推荐语通过下发控制命令，从而可以帮助用户更规范的使用语音控制。

基于同一发明构思，根据本发明实施例提供的如图3所示的语音推荐语展示方法，如图7所示，本发明实施例还提供了一种语音推荐语展示装置，应用于客户端，该装置包括：

信息获取模块701，用于获取指示当前所处语音场景的语音场景信息；

请求发送模块702，用于向服务器发送推荐语获取请求，其中，推荐语获取请求中携带语音场景信息；

推荐语接收模块703，用于接收服务器反馈的语音推荐语，其中，语音推荐语为基于语音关键词和目标语音句式所构建的，语音关键词为服务器基于语音场景信息所确定的符合语音场景的关键词，目标语音句式为服务器基于语音场景信息，从预设的多个语音句式中筛选出的符合语音场景的语音句式；

推荐语展示模块704，用于展示语音推荐语。

本发明实施例提供的如图7所示的语音推荐语展示装置，由于可以通过客户端当前所处的语音场景，构建语音推荐语，并客户端上展示语音推荐语，从而可以提醒用户按照展示的语音推荐语通过下发控制命令，从而可以帮助用户更规范的使用语音控制。

本发明实施例还提供了一种电子设备，如图8所示，包括处理器801、通信接口802、存储器803和通信总线804，其中，处理器801，通信接口802，存储器803通过通信总线804完成相互间的通信，

存储器803，用于存放计算机程序；

处理器801，用于执行存储器803上所存放的程序时，实现上述如图2或如图3所示的语音推荐语展示方法。

本发明实施例提供的如图8所示的电子设备，由于可以通过客户端当前所处的语音场景，构建语音推荐语，并客户端上展示语音推荐语，从而可以提醒用户按照展示的语音推荐语通过下发控制命令，从而可以帮助用户更规范的使用语音控制。

需要说明的是，上述电子设备实现语音推荐语展示的其他实施例，与前述方法实施例部分提及的语音推荐语展示方法相同，在此不再赘述。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例中任一所述的语音推荐语展示方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的语音推荐语展示方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、存储介质、计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种语音推荐语展示方法、装置、系统及电子设备 [P] . 中国专利： CN112927686A . 2021-06-08
2. 一种手语语音互译系统及手语语音互译方法 [P] . 中国专利： CN101539994A . 2009-09-23
3. A system capable of displaying Chinese pronunciation as a Hangul phonetic symbol including a predetermined sign indicating a tonal tone, and a method for displaying a Hangul phonetic symbol including a predetermined sign indicating a tone as a Chinese pronunciation using the system, and a phonetic pronunciation of Chinese pronunciation and Chinese tones System of Korean and how to write Chinese pronunciation and Chinese tones with Korean phonetic symbols [P] . 韩国专利： KR101060928B1 . 2011-08-31

机译：一种能够将包括发音的预定符号的韩文语音符号显示为语音的系统，以及使用该系统显示包括作为发音的预定符号的韩文语音符号的方法和系统的显示语音的方法。朝鲜语的汉语发音系统以及如何用朝鲜语音标写汉语发音
4. RECOMMENDATION INFORMATION PRESENTATION DEVICE, RECOMMENDATION INFORMATION PRESENTATION SYSTEM, RECOMMENDATION INFORMATION PRESENTATION METHOD, AND RECOMMENDATION INFORMATION PRESENTATION PROGRAM [P] . 日本专利： JP2017134635A . 2017-08-03

机译：推荐信息展示装置，推荐信息展示系统，推荐信息展示方法和推荐信息展示程序
5. Recommended presentation device, recommended presentation system, recommended presentation method, recommended presentation program [P] . 日本专利： JP2020129411A . 2020-08-27

机译：推荐的展示设备，推荐的展示系统，推荐的展示方法，推荐的展示程序