首页> 中国专利> 用于分析系统中的基于对话的洞察力搜索的平台

用于分析系统中的基于对话的洞察力搜索的平台

摘要

提供了一种用于基于用户的口头输入从分析系统提供洞察力的方法、系统和计算机可读存储介质,用于:由分析系统的基于对话的搜索系统(CSS)从用户接收口头输入;由CSS基于该口头输入提供文本输入;由该CSS处理该文本输入以确定上文集,该上下文集中的每个上下文代表企业的一个或多个经营;由该CSS基于该上下文集确定一个或多个洞察力,每个洞察力代表该企业的绩效;并且由该分析系统显示包括一个或多个可视化的故事,每个可视化描绘至少一个洞察力。

著录项

  • 公开/公告号CN113032666A

    专利类型发明专利

  • 公开/公告日2021-06-25

    原文格式PDF

  • 申请/专利权人 SAP欧洲公司;

    申请/专利号CN202011171389.8

  • 发明设计人 J.M.阿姆卢;R.纳塔拉詹;

    申请日2020-10-28

  • 分类号G06F16/9535(20190101);G06F16/332(20190101);G06F40/30(20200101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人邵亚丽

  • 地址 德国瓦尔多夫

  • 入库时间 2023-06-19 11:35:49

说明书

技术领域

本公开的实施例涉及用于基于用户的口头输入从分析系统提供洞察力的计算机实现的方法、计算机可读存储介质和系统。

背景技术

企业使用软件系统来进行经营(operation)。通过软件系统的使用,企业可以生成和积累大量的企业数据。示例企业数据可以包括但不限于产品数据、财务数据、人力资源(human resources,HR)数据等。然而,企业需要理解该企业数据以便高效地进行经营。已经开发了智能分析系统,该智能分析系统处理企业数据以提供有用的信息,这些信息可以被称为洞察力。洞察力可以被描述为可以从企业数据中确定的统计数据、事实、趋势等。示例洞察力包括但不限于最高评级的产品、收入、利润、实际销售额、预测销售额等。

一些分析系统使用户能够提交基于文本的查询来搜索洞察力。例如,可以显示搜索界面,并且用户可以输入基于文本的搜索查询(例如,[与2018年的预测收入相比的实际收入])。该分析系统处理该搜索查询并提供用户可以从中进行选择的洞察力结果列表。例如,用户可以选择洞察力结果以包含在所谓的故事(story)中。在一些示例中,故事可以包括一个或多个页面(例如,显示在用户界面(user interface,UI)中),其中所述一个或多个页面各自可以基于企业数据和一个或多个洞察力显示一个或多个可视化。

然而,传统的洞察力搜索系统本质上相对原始。例如,这种洞察力搜索系统仅允许基于具有可搜索元数据的预构建模型化对象的搜索。此外,为了高效地参与这种洞察力搜索系统,用户需要知道搜索将要在其上进行的上下文(例如,将要使用哪个(哪些)模型)和/或所寻求的度量和/或维度,但通常不是这样。换句话说,传统的洞察力搜索系统缺乏对用户的理解,并且在用户完全知道他们在寻找什么的期望的情况下进行操作。此外,传统的洞察力搜索系统的输出在本质上可能很小,并且不能以进一步分析的形式消费(consume)。

发明内容

本公开的实现针对用于分析系统的基于对话的搜索系统(conversation-basedsearch system,CSS)。更具体地,如本文进一步详细描述的,本公开的CSS从用户接收搜索查询作为口头输入,处理该口头输入以提供文本输入,基于该文本输入确定一个或多个上下文,基于所述一个或多个上下文提供内容到数据范围映射(content to data scopemapping),基于该内容到数据范围映射提供并执行查询以提供查询结果作为一个或多个洞察力,并且显示该洞察力(例如,作为一个或多个可视化)。在一些示例中,该洞察力被显示在响应于接收到口头输入而生成的新创建的故事中。在一些示例中,该洞察力被显示在在接收到口头输入之前生成的现有故事中。

在一些实现方式中,动作包括:由分析系统的基于对话的搜索系统(CSS)从用户接收口头输入;由该CSS基于该口头输入提供文本输入;由该CSS处理该文本输入以确定上下文集,该上下文集中的每个上下文代表企业的一个或多个经营;由该CSS基于该上下文集确定一个或多个洞察力,每个洞察力代表企业的绩效(performance);以及由该分析系统显示包括一个或多个可视化的故事,每个可视化描绘至少一个洞察力。这方面的其他实现方式包括被配置为执行被编码在计算机存储设备上的该方法的动作的相应的系统、装置和计算机程序。

这些和其他实现方式可以各自可选择性地包括以下特征中的一个或多个:通过一个或多个自然语言系统(natural language system,NLS)库处理口头输入来提供文本输入;动作还包括至少部分基于分配给用户的角色来确定该用户的数据围栏(data fence),该数据围栏确定要被访问的一个或多个数据源以确定上下文集;动作还包括确定配置设置指示CSS可由该用户访问,并且作为响应,使CSS能够从该用户接收口头输入;动作还包括基于所述一个或多个洞察力中的至少一个洞察力来提供中间故事(intermediate story),其中该中间故事中的至少一部分被包括在故事中;至少一个上下文被确定为前导上下文(leading context),并且至少一个上下文被确定为中间上下文(intermediate context);并且该上下文中集的上下文以排名次序提供。

本公开还提供了一种计算机可读存储介质,该计算机可读介质耦合到一个或多个处理器并具有存储在其上的指令,该指令当由所述一个或多个处理器执行时使得所述一个或多个处理器根据本文提供的方法的实现方式来执行操作。

本公开进一步提供了用于实现本文提供的方法的系统。该系统包括一个或多个处理器、以及耦合到所述一个或多个处理器并具有存储在其上的指令的计算机可读存储介质,该指令当由所述一个或多个处理器执行时使得所述一个或多个处理器根据本文提供的方法的实现方式来执行操作。

应当理解,根据本公开的方法可以包括本文描述的方面和特征的任何组合。也就是说,根据本公开的方法不限于本文具体描述的方面和特征的组合,而是还包括所提供的方面和特征的任何组合。

在附图和以下描述中阐述了本公开的一个或多个实现的细节。根据说明书和附图并且根据权利要求书,本公开的其他特征和优点将是明显的。

附图说明

图1描绘了可以用于执行本公开的实现方式的示例架构。

图2描绘了包括根据本公开的实现方式的分析系统的示例概念架构。

图3描绘了可以根据本公开的实现方式来执行的示例过程。

图4是可以用于执行本公开的实现方式的示例计算机系统的示意图。

在不同附图中的相同的附图标记表示相同的元件。

具体实施方式

本公开的实现方式针对用于分析系统的基于对话的搜索系统(CSS)。更具体地,如本文进一步详细描述的,本公开的CSS从用户接收搜索查询作为口头输入,处理口头输入以提供文本输入,基于该文本输入确定一个或多个上下文,基于所述一个或多个上下文提供内容到数据范围映射,基于该内容到数据范围映射提供并执行查询,以提供查询结果作为一个或多个洞察力,以及显示该洞察力(例如,作为一个或多个可视化)。在一些示例中,该洞察力被显示在响应于接收到口头输入而生成的新创建的故事中。在一些示例中,该洞察力被显示在在接收到口头输入之前生成的现有故事中。

实现方式可以包括以下动作:由分析系统的CSS从用户接收口头输入;由该CSS基于该口头输入提供文本输入;由该CSS处理该文本输入以确定上下文集,该上下文集中的每个上下文代表企业的一个或多个经营;由CSS基于该上下文集确定一个或多个洞察力,每个洞察力代表该企业的绩效;以及由分析系统显示包括一个或多个可视化的故事,每个可视化描绘至少一个洞察力。

参考示例分析系统(由德国沃尔多夫的SAP SE提供的SAP分析云(SAP AnalyticsCloud,SAC))进一步详细描述本公开的实现方式。SAC可以被描述为集商业智能、规划和预测分析于一体的平台,以支持企业经营。然而,可以设想,本公开的实现方式可以在任何适当的分析系统中实现。

为了给本公开的实现方式提供进一步的背景,如上所述,企业使用软件系统来进行经营。通过对软件系统的使用,企业可以生成和积累大量的企业数据。示例企业数据可以包括但不限于产品数据、财务数据、人力资源(HR)数据等。然而,企业需要理解企业数据以便高效地进行经营。已经开发了智能分析系统(例如,SAC),该系统处理企业数据以提供有用的信息,该信息可以被称为洞察力。洞察力可以被描述为可以从企业数据中确定的统计数据、事实、趋势等。示例洞察力包括但不限于最高评级的产品、收入、利润、实际销售额、预测销售额等。

一些分析系统使用户能够提交基于文本的查询来搜索洞察力。例如,可以显示搜索界面,并且用户可以输入搜索查询(例如,[与2018年的预测收入相比的实际收入])。该分析系统处理该搜索查询并提供用户可以从中进行选择的洞察力结果列表。例如,用户可以选择洞察力结果以包含在所谓的故事中。在一些示例中,故事可以包括一个或多个页面(例如,被显示在用户界面(UI)中),其中所述一个或多个页面可以各自基于企业数据和一个或多个洞察力来显示一个或多个可视化。

然而,传统的洞察力搜索系统本质上相对原始。例如,这种洞察力搜索系统仅允许基于具有可搜索元数据的预构建模型化对象的搜索。此外,为了高效地参与这种洞察力搜索系统,用户需要知道搜索将要在其上进行的上下文(例如,将要使用哪个(哪些)模型)和/或所寻求的度量和/或维度,但通常不是这样。换句话说,传统的洞察力搜索系统缺乏对用户的理解,并且在用户完全知道他们在寻找什么的期望的情况下进行经营。通常不是这样,诸如在其中用户不是领域专家或者甚至不是领域熟练的情况下。此外,传统的洞察力搜索系统的输出在本质上可能很小,并且不能以进一步分析的形式消费。

鉴于以上背景,本公开的实现方式提供了用于分析系统的CSS。更具体地,如本文进一步详细描述的,本公开的CSS从用户接收搜索查询作为口头输入,处理该口头输入以提供文本输,基于该文本输入确定一个或多个上下文,基于所述一个或多个上下文提供内容到数据范围映射,基于该内容到数据范围映射提供并执行查询,以提供查询结果作为一个或多个洞察力,以及显示洞察力(例如,作为一个或多个可视化)。在一些示例中,该洞察力被显示在响应于接收到口头输入而生成的新创建的故事中。在一些示例中,该洞察力被显示在在接收到口头输入之前生成的现有故事中。

为了给本公开的实现方式提供进一步的背景,分析系统可以使用模型和故事来提供并发布洞察力。在一些示例中,模型可以被认为是数据探索(data exploration)和发展洞察力的基础。在一些示例中,模型包括一个或多个度量和一个或多个维度,并且每个模型提供可以被并入故事的数据可视化(例如,图表、表格、图形)的框架。示例模型可以包括分析模型和规划模型。在一些示例中,模型使企业数据能够为分析做好准备。在模型中,用户可以定义度量和维度、创建计算、建立层次关系、丰富地理数据等。在企业经营中,示例度量可以包括但不限于销售、收入、利润、开支、预算、预测。示例维度可以包括但不限于时间、地点、产品。在一些示例中,每个维度可以具有一个或多个子维度。例如,时间维度可以包括年子维度,每个年子维度可以包括季度子维度,每个季度子维度可以包括月子维度,每个月子维度可以包括周子维度,以此类推。作为另一个示例,产品维度可以包括类别子维度,并且每个类别子维度可以包括线子维度。作为另一示例,地点维度可以包括国家子维度,每个国家子维度可以包括区域子维度(例如,北部、东部、西部、南部、中西部),每个区域子维度可以包括子区域子维度(例如,州、省),并且每个子区域子维度可以包括城市子维度。在一些示例中,模型可以用于设置预算和预测、创建模型数据的版本、复制/粘贴数据、以及拓展、分发和分配特征。

在一些示例中,提供了数据驱动的故事,这些故事传达了有意义的洞察力,并使企业能够在其经营中做出更好的决策。在一些示例中,故事可以作为显示企业数据、分析数据和洞察力的用户界面(UI)来提供。简而言之,故事是其中企业数据得以生动表现所在。在故事模式中,企业数据和洞察力是可视化的(例如,作为图表、图形、表格)。故事中的可视化基于一个或多个底层模型中包含的度量和维度,并且用于分析、规划和报告。

如上所述,本公开的实现方式在分析系统内提供了CSS,该CSS使得用户能够与分析系统进行口头对话,以生成能够包括在故事中的洞察力(本文也称为智能洞察力(smartinsights))。CSS提供的这个过程通常可以被称为对话至洞察力(converse-to-insights,C-to-I)。根据本公开的实现方式,对话至洞察力使得用户能够自然地与分析系统的CSS进行对话,而无需记住任何准备好的上下文。此外,随着对话的进行,CSS提供了逐渐加深的洞察力(例如,更详细的洞察力)。在一些实现方式中,CSS访问企业范围的数据源,其中从这些数据源中可以根据上下文构建洞察力。在一些示例中,基于数据围栏来选择数据源集,以及检测对话语言和上下文,并且确定允许用户具有的访问(例如,基于企业中的角色和专业知识)。

如本文进一步详细描述的,CSS使用一个或多个自然语言系统(NLS)库来理解用户提供的口头输入。在会话期间,NLS库在交互期间被持续维护,以在企业上下文中实现类似人的对话。这将用户输入的上下文连接到企业数据(例如,在数据围栏内),以提供相关的洞察力。在企业经营中,示例上下文可以包括但不限于销售、财务、供应链和采购。这引导用户对话用户感兴趣的以故事形式发现洞察力的前导上下文。前导上下文可以被描述为口头输入所指向的主上下文。一个或多个其他上下文可以连接到前导上下文(例如,销售可以连接到财务)。如本文进一步详细描述的,用户可以选择在对话过程的任何阶段智能地冻结(freeze)洞察力,并将中间洞察力注入到故事中,其中该洞察力在稍后的时间点可以被精细化(refine)和消费。在一些示例中,前导上下文用于通过消除当前上下文来提供非冗余的洞察力,并允许用户深入挖掘可用且未在任何分析模型构建中使用的源。

图1描绘了根据本公开的实现方式的示例架构100。在所描绘的示例中,该示例架构100包括客户端设备102、网络106和服务器系统104。该服务器系统104包括一个或多个服务器设备和数据库108(例如,处理器、存储器)。在所描绘的示例中,用户112与该客户端设备102交互。

在一些示例中,客户端设备102可以通过网络106与服务器系统104通信。在一些示例中,客户端设备102包括任何适当类型的计算设备,诸如台式计算机、膝上型计算机、手持计算机、平板计算机、个人数字助理(personal digital assistant,PDA)、蜂窝电话、网络设备、相机、智能电话、增强型通用分组无线服务(enhanced general packet radioservice,EGPRS)移动电话、媒体播放器、导航设备、电子邮件设备、游戏控制台、或者这些设备中的任何两个或更多个或其他数据处理设备的适当组合。在一些实现方式中,网络106可以包括连接任意数量的通信设备、移动计算设备、固定计算设备和服务器系统的大型计算机网络,诸如局域网(LAN)、广域网(WAN)、互联网、蜂窝网络、电话网络(例如,PSTN(publicswitched telephone network,公共交换电话网))或它们的适当组合。

在一些实现方式中,服务器系统104包括至少一个服务器和至少一个数据存储。在图1的示例中,服务器系统104旨在表示各种形式的服务器,包括但不限于网络服务器、应用服务器、代理服务器、网络服务器和/或服务器池。通常,服务器系统接受对应用服务的请求,并且向任意数量的客户端设备(例如,通过网络106向客户端设备102)提供这种服务。

根据本公开的实现方式,服务器系统104托管包括本公开的CSS的分析系统。例如,用户112可以通过客户端设备102与该分析系统交互。在一些示例中,客户端设备102显示一个或多个UI,其中所述一个或多个UI使得用户112能够向该分析系统提供输入并从该分析系统接收输出。在一些实现方式中,用户112可以与CSS口头交互。作为响应,并且如本文进一步详细描述的,CSS可以处理用户112的口头输入,以提供可以提供给用户112的一个或多个洞察力(智能洞察力)。例如,可以在由客户端设备102呈现的故事中向用户112显示所述一个或多个洞察力。

图2描绘了根据本公开的实现方式的包括分析系统202的示例概念架构200。在所描绘的示例中,该概念架构200进一步包括一个或多个数据源204和客户端侧206(例如,图1的客户端设备102)。客户端侧206包括UI 208,其中用户可以通过UI 208与分析系统202交互。在一些示例中,所述一个或多个数据源204包括基于云的应用、基于云的数据源、本地部署(on-premise)应用、本地部署数据源等。通常,所述一个或多个数据源204可以包括分析系统202可以连接到的任何合适的数据源。

在所描绘的示例中,分析系统202包括一个或多个应用210、分析模块212、一个或多个核心能力模块214和CSS 216。在一些示例中,所述一个或多个应用210可以包括但不限于企业总结和分析应用(例如,SAP数字会议室(SAP Digital Boardroom))和分析资产聚合应用(例如,SAP分析中心(SAP Analytics Hub))。在所描绘的示例中,分析模块212包括智能模块220、规划模块222和预测模块224。在一些示例中,所述一个或多个核心能力模块214可以包括但不限于数据连接模块(例如,将分析系统202连接到所述一个或多个数据源204)、数据整理(wrangling)模块(例如,为通过分析进行处理准备数据)、建模模块(例如,生成一个或多个模型)和故事体验模块(例如,提供一个或多个故事)。

在一些实现方式中,CSS 216包括配置模块230、数据围栏(data fencing,DF)模块232、NLS模块234、上下文模块236、洞察力结果模块238、智能冻结模块240、用户学习模块242、深度挖掘(deep mining,DM)模块244和呈现模块246。在所描绘的示例中,配置模块230包括设置子模块250、DF范围子模块252、一个或多个NLS库254、一个或多个DM源256和智能冻结子模块258。CSS 216的组件中的每一个及其各自的功能将在本文进一步详细描述。

关于配置模块230,可以跨配置参数集来配置CSS 216的使用。示例配置参数可以包括但不限于启用、角色、上下文限制、时区设置、语言、货币设置、使用统计信息收集、数据围栏(DF)范围、NLS库、深度挖掘(DM)源启用、智能冻结启用和智能冻结限制。例如,管理员用户可以与CSS 216交互以在配置模块230内建立配置参数,其中该配置参数管理本公开的对话至洞察力过程的操作。在一些示例中,设置子模块250存储设置,其中该设置可以包括但不限于启用(例如,能够使用CSS 216来提供对话至洞察力功能的分析系统租户集(基于通用唯一标识符(universally unique identifier,UUID)来识别))、角色(例如,能够使用由CSS 216提供的对话至洞察力功能的用户角色)、上下文限制(例如,将上下文集限制为要根据口头输入确定的[1,……,n]个上下文)、时区设置、语言设置、货币设置、和使用统计信息收集的设置。

在一些示例中,DF范围子模块252包括DF范围设置,该DF范围设置指示一个或多个数据源204的数据源,所述一个或多个数据源204可以被连接以供CSS 216访问。简而言之,DF用于定义可由CSS 216访问以进行处理的数据源(或不可由CSS 216访问以进行处理的数据源)。在一些示例中,可以基于特定的分析系统租户和/或特定的用户角色来确定数据源是否可以由CSS 216连接到。例如,对于第一分析系统租户,可以允许CSS 216访问数据源,但是对于第二分析系统租户则不允许。作为另一个示例,对于第一用户角色,可以允许CSS216访问数据源,但是对于第二用户角色则不允许。在一些示例中,DF范围设置还可以指示可以被访问的所述一个或多个数据源中的每一个中的数据对象(例如,特定用户拥有的数据对象、共享的数据对象、特定用户有权访问的数据对象)。

在一些示例中,所述一个或多个NLS库254包括可以用于提供对话至洞察力功能的NLS库。在一些示例中,NLS库254可以执行用于语言检测(例如,确定用户的口头输入以哪种语言提供)、语音到文本转换(例如,将音频数据转换成文本数据)、情感识别(例如,确定用户的情感,诸如沮丧、高兴、悲伤)的功能。

在一些示例中,如本文进一步详细描述的,所述一个或多个DM源256包括可以用于深度挖掘的数据源。也就是说,所述一个或多个DM源256指示能够进行深度挖掘的数据源。这可以包括任何模型(例如,分析模型、规划模型)都不能访问的数据源。在一些示例中,智能冻结子模块258存储指示智能冻结是否被启用(例如,对于特定用户和/或角色)的设置,并且可以包括一个或多个限制。示例限制可以包括智能冻结可以被限制于其中的多个可视化和/或多类可视化(例如,图表、图形、表格)。

根据本公开的实现方式,如上所述,用户可以与分析系统交互。在一些实现方式中,用户可以请求对CSS 216的访问以使用对话至洞察力功能。在一些示例中,并且基于配置设置,可以确定用户是否能够访问CSS 216来使用对话至洞察力功能。例如,可以将用户的标识符(例如,唯一标识用户的标识符)、用户的角色、和用户正在访问的分析系统租户的UUID中的一个或多个与相应的许可设置(被包括在配置设置中)进行比较,以确定用户是否能够访问CSS 216来使用对话至洞察力功能。

在一些实现方式中,如果用户能够访问CSS 216以使用对话至洞察力功能,则用户的数据围栏由DF模块232确定。在一些示例中,确定数据围栏包括确定用户(例如,用户的标识符),确定与用户相关联的一个或多个角色,以及识别数据源、数据源系统、空间和元数据存储库中的数据对象中的一个或多个数据对象,其中所述一个或多个数据对象可以被访问以执行对话至洞察力的功能。例如,用户的标识符可以用于标识用户拥有的数据对象(例如,由用户在分析系统内创建的)。作为另一个示例,与用户相关联的一个或多个角色可以用于识别用户能够访问的数据对象(例如,基于角色的许可)。作为另一个示例,用户的标识符可以用于标识用户已被授予访问许可的数据对象(例如,共享的对象)。

在一些示例中,源系统可以包括存储可能与用户查询相关的数据的一个或多个基于云的系统和/或一个或多个本地部署系统。示例源系统可以包括但不限于企业资源规划(enterprise resource planning,ERP)系统、客户关系管理(customer relationshipmanagement,CRM)系统、人力资本管理(human capital management,HCM)系统和数据仓库(data warehouse,DW)系统。在一些示例中,空间是数据的逻辑分离(例如,在源系统内)。例如,定义第一空间(例如,营销)和第二空间(例如,销售),并且可以将数据和/或模型分配给第一空间和第二空间中的一个或两个。用户可以被授权访问各自的空间。

在一些实现方式中,NLS模块234处理由用户提供的口头输入。例如,用户的语音可以由麦克风接收,其中该麦克风提供口头输入作为音频(例如,流式音频、音频文件)。在一些示例中,NLS模块234处理口头输入以确定用户正在说的语言(例如,英语、法语、德语),并且选择适当的NLS库以用于口头输入的进一步处理(例如,如果检测到英语,则选择英语的NLS库)。在一些实现方式中,NLS模块234使用NLS库将音频数据(口头输入)转换成文本数据(例如,语音到文本),并且处理文本输入以进行识别和响应。

作为非限制性示例,可以考虑以下示例对话(其中,U表示用户输入,并且CSS表示CSS输出(例如,听觉的、文本的)):

用户:我做得怎么样?

CSS:嗨,詹姆斯。你想知道你在销售、财务、HR或其他方面做得怎么样吗?

用户:我在销售方面表现如何?

CSS:你是在寻找整体销售,还是特定产品、地点和/或时间框架等的销售?

用户:我对去年北美的[PRODUCT_X]和[[PRODUCT_Y]的销售感兴趣。

非限制性地参考以上示例对话,可以处理从用户提供的文本数据以确定用户的意图(例如,查询)和/或上下文。在以上示例中,可以处理文本[我做得怎么样](例如,通过NLS模块使用自然语言处理(NLP)),以确定用户正在询问关于绩效的一般问题,上下文是绩效。

在一些示例中,一个或多个上下文(如果被检测到)和一个或多个域(如果被检测到)被NLS模块234精细化以用于响应准备。在一些示例中,精细化意味着该上下文或域被排除在进一步处理之外。例如,可以确定文本数据的上下文或域不是特定用户被授权查询的上下文或域。例如,如果用户未被授权访问工资单信息,则可以在对话的进行过程中过滤工资单以防止进一步使用。

在一些示例中,如果特定域不能从用户输入中确定,则可以提供响应以引出用户感兴趣的一个或多个域。

在一些实现方式中,与用户相关联的数据可以用于制定(formulate)来自CSS的响应。例如,每个用户可以具有与其相关联的用户简档,其中该用户简档指示与该用户相关联的一个或多个角色。在一些示例中,每个角色可以与一个或多个域相关联。示例域可以包括但不限于销售、财务、人力资源、产品、制造等。在以上示例中,可以确定用户具有将用户与销售、财务和人力资源(HR)的域相关联的一个或多个角色。因此,提供了响应[……你在销售、财务、HR或其他方面做得怎么样?]。

在一些实现方式中,域可以作为度量来提供,如以上参考定义度量和维度、创建计算、建立层次关系、丰富地理数据等的模型所描述的。例如,销售可以是模型的度量。在一些示例中,每个度量可以与一个或多个维度相关联。例如,销售可以与时间、地点、产品维度相关联。在一些示例中,每个维度可以具有一个或多个子维度。例如,时间维度可以包括年子维度,每个年子维度可以包括季度子维度,每个季度子维度可以包括月子维度,每个月子维度可以包括周子维度等。作为另一个示例,产品维度可以包括类别子维度,并且每个类别子维度可以包括线子维度。作为另一示例,地点维度可以包括国家子维度,每个国家子维度可以包括区域子维度(例如,北部、东部、西部、南部、中西部),每个区域子维度可以包括子区域子维度(例如,州、省),并且每个子区域子维度可以包括城市子维度。

在以上示例对话中,可以确定销售度量与产品、地点和时间的维度相关联。因此,提供了响应[你是在寻找整体销售,还是针对特定产品、地点和/或时间框架等的销售?]。

在一些示例中,NLS模块234构建(或重建)模型以用于响应调配(dispensing)。在一些示例中,NLS模块234基于数值预测、最优化和概率评估中的一个或多个来匹配和分类模型以用于响应调配。在一些示例中,NLS模块234使用语义、标记化、词干化和解析中的一个或多个来重建模型库。

在一些实现方式中,上下文模块236接收从NLS模块234提供的NLS输出,并处理该NLS输出以提供上下文集和/或域集。在一些示例中,上下文模块236基于包括在配置(例如,设置250)中的任何排除项目来精细化该上下文集。例如,如上所述,如果用户未被授权以访问特定信息(例如,工资单),则从进一步处理中过滤该上下文(或域)。在一些示例中,上下文集中的上下文和域集中的域以相应的排名次序排列,并且经排名的上下文和经排名的域被最终确定(finalize)及精细化以用于内容到数据范围映射。

在一些实现方式中,洞察力结果模块238执行上下文到数据范围的映射,以提供洞察力结果集。更具体地,洞察力结果模块238从NLS模块234接收经排名的上下文和经排名的域并分析经排名的上下文和经排名的域。在一些示例中,可以基于与用户相关联的模式来对上下文和域进行排名。例如,如果可以维护用户查询上下文/域的频率,则来自用户的更高频率的上下文/域可以比来自用户的更低频率的上下文/域排名更高。在一些示例中,洞察力结果模块238对域模型、对象、源、语义和存储库进行精细化和分组。

在一些示例中,如本文进一步详细描述的,如果配置设置指示要执行源的DM,则DM模块244进行操作来提供来自DM源的DM结果。在一些示例中,DM模块244收集未在模型和/或对象中使用的源。在一些示例中,DM模块244为识别到的孤立源收集元数据源。在一些示例中,DM模块244收集上下文到数据范围调配要求查询。在一些示例中,DM模块244添加线程以跨越源。在一些示例中,DM模块244收集、核对结果,并将结果反馈给洞察力结果模块238。在一些示例中,DM模块244收集源系统的存储库/表/对象/视图,其中这些源系统获得模型,但是并非源的所有对象部分都被利用。

在一些示例中,如本文进一步详细描述的,DM模块244提供输出以用于更新用户学习。

在一些示例中,洞察力结果模块238使用基于上下文和排名的最佳拟合对识别到的对象(包括从深度挖掘提供的任何对象)进行排名。

在一些示例中,洞察力结果模块238准备查询以基于识别到的模型调配结果。例如,再次参考以上示例对话,洞察力结果模块238可以响应于用户陈述[我对去年北美的[PRODUCT_X]和[PRODUCT_Y]的销售感兴趣]而提供查询。因此,可以生成查询来提供查询结果,在本示例中,该查询结果为在北美发生的销售提供了PRODUCT_X的销售额和PRODUCT_Y的销售额。在一些示例中,洞察力结果模块238执行该查询并接收结果。例如,该查询被传送到数据围栏内的一个或多个数据源,每个数据源提供查询结果。

在一些示例中,洞察力结果模块238提供结果以用于显示给用户。在一些示例中,用户可以与显示的结果进行交互。响应于用户对结果(洞察力)的交互,洞察力结果模块238基于用户审阅的洞察力来读取互连的上下文。在一些示例中,洞察力结果模块238对排除当前上下文的互连的上下文进行精细化并排名。在一些示例中,洞察力结果模块238基于互连的上下文识别对象并对具有最佳匹配的对象进行排名。在一些示例中,洞察力结果模块238确定是否已经达到所需的洞察力深度。在一些示例中,可以由用户指示洞察力深度。例如,如果用户对所提供的(多个)洞察力满意,并且不希望向下深入以生成更详细的洞察力,则用户可以像这样指示(例如,点击指示洞察力深度已满足的UI元素)。

如果已经达到所需的洞察力深度,可以将洞察力添加到故事中。例如,用户可以指示在这一点上提供的洞察力足以满足用户的需求。因此,用户可以指示已经达到所需的洞察力深度(例如,选择在UI内显示的界面元素)。如果尚未达到所需的洞察力深度,则确定当前的洞察力深度在另一个上下文中是否可用。如果当前的洞察力深度在另一个上下文中不可用,则洞察力结果模块238继续监视对洞察力的用户输入(例如,用户提供的持续口头输入),以进一步确定互连的上下文并在洞察力深度上进行创建。如果当前的洞察力深度在另一个上下文中可用,则洞察力结果模块238将当前洞察力深度提供给智能冻结模块240以用于进一步处理。例如,用户可以指示当前的洞察力深度可用,并且可以启动智能冻结(如果启用的话)来捕捉中间洞察力,以用于后续故事(例如,选择在UI内显示的界面元素)。

在一些实现方式中,智能冻结模块240从洞察力结果模块238接收状态和结果。可以确定至此所接收的洞察力是否是最终的。例如,用户可以提供指示到此为止所接收的洞察力是最终的输入。如果是最终的,则用户可以与呈现模块246的功能进行交互以最终确定故事。如果不是最终的,则洞察力结果模块238继续监视对洞察力的用户输入(例如,由用户提供的持续口头输入),以进一步确定互连的上下文并在洞察力深度上进行创建。

在一些实现方式中,呈现模块246(例如,以故事的形式)最终确定洞察力的呈现。在一些示例中,呈现模块246从洞察力结果模块238接收状态和结果。在一些示例中,确定是否要使用自动生成的故事名称来创建故事。如果要用自动生成的故事名称来创建故事,则创建该故事。如果不使用自动生成的故事名称来创建故事,则选择现有的故事。例如,用户从一个或多个现有故事的列表中选择现有故事。在一些实现方式中,呈现模块246传送任何智能冻结和相关模型的内容以及元数据,以用于包含在故事中。向用户显示该故事。在一些示例中,用户可以确定是最终确定故事还是继续开发可以包含在故事中的其他洞察力。在一些实现方式中,用户可以编辑故事(例如,重命名故事,重组故事中描述的可视化)。可以存储故事以用于后续参考。可以与一个或多个其他用户共享故事。

在一些实现方式中,用户学习模块242基于用户与CSS 216的交互生成用户的用户简档,并向用户提供反馈。在一些示例中,用户学习模块242将用户的默认语言设置为用户与CSS 216的交互中使用的语言。在一些示例中,用户学习模块242记录用户交互、模型使用和使用CSS 216所花费的时间。在一些示例中,用户学习模块242记录元数据使用,包括但不限于出现(occurrence)、源、模型、对象、故事(被创建/更新)、对失败尝试和动作的结果的审核、以及数据结果的大小。在一些示例中,用户学习模块242生成用户简档,其中该用户简档可以记录使用类型、使用时间、平均停留持续时间、感兴趣的领域、特征、行为、渐进学习(progressive learning)以及对用户社区的贡献等因素。

图3描绘了可以根据本公开的实现方式来执行的示例过程300。在一些示例中,使用由一个或多个计算设备执行的一个或多个计算机可执行程序来提供示例过程300。

读取配置设置(302)。例如,响应于用户登录分析系统以开始分析会话(session),读取配置设置(例如,图2的配置设置250)。确定是否启用了对话至洞察力功能(304)。例如,如本文所述,可以确定用户是否能够访问CSS216来使用对话至洞察力功能。例如,可以将用户的标识符(例如,唯一标识用户的标识符)、用户的角色、和用户正在访问的分析系统租户的UUID中的一个或多个与相应的许可设置(被包括在配置设置中)进行比较,以确定用户是否能够访问CSS 216来使用对话至洞察力功能。如果未启用对话至洞察力功能(306),则提供传统操作。例如,提供了传统的文本至洞察力的功能,其中用户通过该传统的文本至洞察力功能提供文本输入。

如果启用了对话至洞察力功能,则确定数据围栏(308)。例如,如本文所述,确定数据围栏包括确定用户(例如,用户的标识符),确定与用户相关联的一个或多个角色,以及识别数据源、数据源系统、空间和元数据存储库中的数据对象中的一个或多个数据对象,其中所述一个或多个数据对象可以被访问以执行对话至洞察力的功能。

确定是否已经接收到口头输入(VI)(310)。例如,可以确定用户是否已经向CSS216(例如,通过计算设备的麦克风)提供了口头输入。如果没有接收到口头输入,则确定会话是否结束(312)。例如,可以确定用户是否已经指示与分析系统的会话结束(例如,登出)。如果会话要结束,则会话结束(314)。如果会话没有结束,则示例过程300循环返回。

如果接收到口头输入,则通过NLS处理该口头输入(316),并确定一个或多个上下文和/或域(318)。例如,如本文所述,处理该口头输入以提供文本数据,并且处理该文本数据以确定一个或多个上下文。在一些示例中,如以上参考示例对话所述,从用户引出额外的口头输入来确定所述一个或多个上下文。

从所述一个或多个上下文和/或域中确定数据范围(320),并提供一个或多个洞察力(322)。例如,如本文所述,响应于用户的口头输入,识别一个或多个数据源(在数据围栏内)以用于查询来检索数据。在一些示例中,提供了洞察力(例如,总结该数据的数据可视化)。选择性地执行智能冻结(324)。例如,如果启用了智能冻结,并且用户选择执行智能冻结功能,则执行智能冻结功能。

执行用户学习(326)。例如,记录用户与CSS 216的交互,并提供一个或多个度量。示例度量可以包括但不限于其中用户指示上下文或域的频率。以这种方式,可以基于用户的知识来管理用户与CSS 216的后续交互。例如,如果与第一域相关联的频率高于与第二域相关联的频率,则第一域(例如,销售)可以排名高于第二域(例如,HR)。

确定故事是否要被最终确定(328)。例如,如本文所述的,故事可以被提供并且可以包括数据和/或描述数据的文本的一个或多个可视化。在一些示例中,可视化作为可视地总结数据的洞察力来提供。如果故事没有被最终确定,则示例过程300返回。如果故事要被最终确定,则该故事被处理并被呈现(330)。

现在参考图4,提供了示例计算系统400的示意图。系统400可以用于结合本文描述的实现方式的描述的操作。例如,系统400可以包括在本文讨论的任何或所有服务器组件中。系统400包括处理器410、存储器420、存储设备430和输入/输出设备440。组件410、420、430、440使用系统总线450互连。处理器410能够处理在系统400内执行的指令。在一些实现方式中,处理器410是单线程处理器。在一些实现方式中,处理器410是多线程处理器。处理器410能够处理存储在存储器420或存储设备430中的指令,以在输入/输出设备440上显示用户界面的图形信息。

存储器420存储系统400内的信息。在一些实现方式中,存储器420是计算机可读介质。在一些实现方式中,存储器420是易失性存储器单元。在一些实现方式中,存储器420是非易失性存储器单元。存储设备430能够为系统400提供大容量存储。在一些实现方式中,存储设备430是计算机可读介质。在一些实现方式中,存储设备430可以是软盘设备、硬盘设备、光盘设备或磁带设备。输入/输出设备440为系统400提供输入/输出经营。在一些实现方式中,输入/输出设备440包括键盘和/或定点设备。在一些实现方式中,输入/输出设备440包括用于显示图形用户界面的显示单元。

所描述的特征可以在数字电子电路中实现,或者在计算机硬件、固件、软件中或在它们的组合中实现。该装置可以在有形地体现在信息载体中的计算机程序产品中实现(例如,在机器可读存储设备中,由可编程处理器执行),并且方法步骤可以由可编程处理器执行,其中该可编程处理器执行指令程序以通过对输入数据进行操作并生成输出来执行所描述的实现方式的功能。所描述的特征可以有利地在可编程系统上可执行的一个或多个计算机程序中实现,其中该可编程系统包括至少一个可编程处理器,该可编程处理器被耦合以从数据存储系统、至少一个输入设备和至少一个输出设备接收数据和指令,并将数据和指令发送到该数据存储系统、所述至少一个输入设备和所述至少一个输出设备。计算机程序是指令集,其中该指令集可以在计算机中直接或间接用于执行特定活动或产生特定结果。计算机程序可以用任何形式的编程语言(包括编译或解释语言)编写,并且它可以以任何形式部署,包括作为独立程序或作为模块、组件、子例程或适合在计算环境中使用的其他单元。

举例来说,用于指令程序的执行的合适处理器包括通用和专用微处理器、以及任何类型计算机的单个处理器或多个处理器之一。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的元件可以包括用于执行指令的处理器和用于存储指令和数据的一个或多个存储器。通常,计算机还可以包括或可操作地耦合以与之通信的、用于存储数据文件的一个或多个大容量存储设备,这种设备包括磁盘(诸如内部硬盘和可移动磁盘)、磁光盘和光盘。适用于有形地包含计算机程序指令和数据的存储设备包括所有形式的非易失性存储器,包括例如半导体存储设备(诸如EPROM、EEPROM和闪存设备)、磁盘(诸如内部硬盘和可移动磁盘)、磁光盘、以及CD-ROM和DVD-ROM。处理器和存储器可以由ASIC(application-specific integrated circuit,专用集成电路)补充或并入ASIC。

为了提供与用户的交互,这些特征可以在计算机上实现,其中该计算机具有用于向用户显示信息的显示设备(诸如CRT(cathode ray tube,阴极射线管)或LCD((liquidcrystal display,液晶显示器))、以及用户可以通过其向计算机提供输入的键盘和定点设备(诸如鼠标或轨迹球)。

这些特征可以在计算机系统中实现,其中该计算机系统包括后端组件(诸如数据服务器),或者包括中间件组件(诸如应用服务器或互联网服务器),或者包括前端组件(诸如具有图形用户界面或互联网浏览器的客户端计算机),或者包括它们的任意组合。系统的组件可以由任何形式或介质的数字数据通信(诸如通信网络)来连接。通信网络的示例包括,例如,LAN、WAN以及形成互联网的计算机和网络。

计算机系统可以包括客户端和服务器。客户端和服务器通常彼此远离,并且典型地通过网络(诸如所描述的那个)进行交互。客户端和服务器的关系是由运行在各自计算机上并具有彼此的客户端-服务器关系的计算机程序而产生。

此外,图中描绘的逻辑流程不需要所示的特定顺序或逻辑顺序来获得期望的结果。此外,可以从所描述的流程中提供其他步骤,或者移除步骤,并且可以向所描述的系统添加其他组件,或者移除其他组件。因此,其他实现方式在所附权利要求的范围内。

已经描述了本公开的许多实现方式。然而,应当理解,在不脱离本公开的精神和范围的情况下,可以进行各种修改。因此,其他实现方式在所附权利要求的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号