首页> 中国专利> 一种多语言的特征逻辑共享方法

一种多语言的特征逻辑共享方法

摘要

本发明实施例公开了一种多语言的特征逻辑共享方法,包括以下步骤建立一特征中转空间;所述特征生产空间获取特征生产者输入带有特征生成过程的特征;当接收到有特征使用者发出的对某一特征的取出请求后,取出带有所述特征生成过程的特征。通过建立中转空间进而建立一个多方使用的桥梁,使发布者发布特征并由特征使用者自由使用特征,并通过对特征生成过程的完整描述,确立特征的唯一性,减少各方对特征的分歧,加快特征的传递速度,且特征一次发布,持久唯一,同时通过此种方式没解决了特征生成的歧义问题,并可以使多种语言之间无歧义,减少不必要的麻烦和无效沟通。

著录项

  • 公开/公告号CN114861938A

    专利类型发明专利

  • 公开/公告日2022-08-05

    原文格式PDF

  • 申请/专利权人 上海蓝书信息科技有限公司;

    申请/专利号CN202210572231.4

  • 申请日2022-05-24

  • 分类号G06N20/00(2019.01);G06K9/62(2022.01);

  • 代理机构北京市京师律师事务所 11665;

  • 代理人黄熊

  • 地址 200135 上海市浦东新区中国(上海)自由贸易试验区浦东大道2123号三层

  • 入库时间 2023-06-19 16:17:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-23

    实质审查的生效 IPC(主分类):G06N20/00 专利申请号:2022105722314 申请日:20220524

    实质审查的生效

  • 2022-08-05

    公开

    发明专利申请公布

说明书

技术领域

本发明实施例涉及特征共享技术领域,具体涉及一种多语言的特征逻辑共享方法。

背景技术

随着人工智能的进一步演进,机器学习也日渐成熟。深度学习,迁移学习,联邦学习也等新的适应于不同领域的智能学习技术不断产生并发展。同时,应用于不同学习方式的模型训练方法也逐渐增多,可使用的训练语言也有所不同,而作为训练的基础元素的特征,在不同语言中的共享问题也就越来越明显,在模型训练结果的应用即生产(实时在线)应用显得尤为突出。特征的取数逻辑,计算逻辑在不同语言间的翻译问题也越来越被重视。

特征工程是机器学习中的一个重要概念,顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。而特征工程更多的是基于特征本身的可工程化,并未考虑具体实现,更不会考虑多语言间共享。在现在有技术中,大都采用通用的特征工程的概念,此概念并未对多语言间的共享提出友好的解决方法。

发明内容

为此,本发明实施例提供一种多语言的特征逻辑共享方法,以解决现有技术中特征不能多语言共享的问题。

为了实现上述目的,本发明实施例提供如下技术方案:一种多语言的特征逻辑共享方法,包括以下步骤:

建立一特征中转空间;

所述特征生产空间获取特征生产者输入带有特征生成过程的特征;

当接收到有特征使用者发出的对某一特征的取出请求后,取出带有所述特征生成过程的特征。

进一步地,所述特征生成过程包括:

所述特征的数据源;

所述特征的取数逻辑;

所述特征的数据加工逻辑;

所述特征的特征关系;

所述特征的输出数据。

进一步地,所述特征的数据源,具体包括:

所述特征的所有需要的数据储存位置、储存格式、数据类型。

进一步地,所述特征的取数逻辑,具体包括:

根据所述数据源,将所述特征需要的所有数据取出,并转入本地处理,并对所述特征所需要的所有数据进行预处理。

进一步地,所述预处理包括但不限于数据类型转换,数据规范,如字符转数字,数字取整,小数点保留,字符串长度。

进一步地,所述数据的数据加工逻辑,具体包括:

定义所述特征类型,所述特征类型包括三类,三类所述特征类型具体包括:

基础类特征:与所述数据直接映射的特征;

复合类特征:所述数据经过系统工程加工的特征;

数据算式类特征:所述数据经过计算的特征。

进一步地,所述特征的特征关系,具体包括:

所述特征与其余特征的关联关系。

进一步地,所述特征的输出数据,具体包括:

所述输出数据包括但不限于特征处理为模型所需要的格式、长度和类型。

进一步地,所述当接收到有特征使用者发出的对某一特征的取出请求后,取出带有所述特征生成过程的特征,具体包括:

在所述中转空间内取出包含特征生成过程的特征,根据预设逻辑转化语言。

本发明实施例具有如下优点:通过建立中转空间进而建立一个多方使用的桥梁,使发布者发布特征并由特征使用者自由使用特征,并通过对特征生成过程的完整描述,确立特征的唯一性,减少各方对特征的分歧,加快特征的传递速度,且特征一次发布,持久唯一,同时通过此种方式没解决了特征生成的歧义问题,并可以使多种语言之间无歧义,减少不必要的麻烦和无效沟通。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。

本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。

图1为本发明实施例提供的一种多语言的特征逻辑共享方法的流程图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例:一种多语言的特征逻辑共享方法,如图1所示,包括以下步骤:

建立一特征中转空间;

特征生产空间获取特征生产者输入带有特征生成过程的特征;

当接收到有特征使用者发出的对某一特征的取出请求后,取出带有特征生成过程的特征,在中转空间内取出包含特征生成过程的特征,根据预设逻辑转化语言。

其中,特征生成过程包括:特征的数据源;特征的取数逻辑;特征的数据加工逻辑;特征的特征关系;特征的输出数据。

特征的数据源包括:特征的所有需要的数据储存位置、储存格式、数据类型。

特征的取数逻辑包括:根据数据源,将特征需要的所有数据取出,并转入本地处理,并对特征所需要的所有数据进行预处理。

预处理包括但不限于数据类型转换,数据规范,如字符转数字,数字取整,小数点保留,字符串长度。

数据的数据加工逻辑,具体包括:定义特征类型,其中特征类型包括三类,三类特征类型具体包括:基础类特征:与数据直接映射的特征;复合类特征:特征与数据经过系统工程加工的特征;数据算式类特征:数据经过加式的特征。

特征的特征关系,具体包括:特征与其余特征的关联关系。

特征的输出数据,具体包括:输出数据包括但不限于特征处理为模型所需要的格式、长度和类型。

具体的,中转空间作为一种存储介质,可根据实际应用情况进行选择,但要保持一个原则,对存储结构易于解析。针对不同的特征逻辑,可采取多样化的存储,且中转空间仅是一个定义,具体为储存并发布特征的空间。

特征定义,是特征实现逻辑共享的核心部分。其包含数据源,取数逻辑,数据加工逻辑,特征关系,特征输出几个部分。

1,数据源,需要严格定义特征所需要的数据来源。数据存储位置,存储格式,数据类型都需要明确说明。

2,取数逻辑,根据以上数据源,将数据进行取出,转入本地处理。此时可根据需求对数据进行预处理,包括数据类型转换,数据规范,如字符转数字,数字取整,小数点保留,字符串长度等。

3,数据加工,是将数据转化为特征的关键过程。通常包括各数据项之间的数学运算,逻辑运算。对一个即将生成的特征,可能是由多个数据计算而来,此处需要严格定义这个过程。这里其实定义的是数据到特征的过程,根据特征自身特性,可将特征进行分类,一类为基础类的特征,其与2中数据进行直接对应或映射,无需再多余处理即可作为特征使用。一类为复合特征,为特征与特征,特征与数据经过系统过程加工而来。再一类则为由数据加式而来的特征。针对以上三类可区别定义。

4,特征关系,是指多个特征之间的关联,或者是一个特征向另一个特征衍生的过程。多用于复合特征的情况下。

5,特征输出,是指向特征引向模型使用的最后一步,此处需要将特征处理为模型所需要的内容,包括格式,长度,类型等。

特征生产者需要完成以上工作,将特征定义存入中转空间中,并将特征进行发布,以供特征使用方进行获取,并解析使用。但由于特征产生过程多样化,侧重点可有所不同,上述过程针对不同类型特征不一定同时都具备。

本发明实施例具有如下优点:通过建立中转空间进而建立一个多方使用的桥梁,使发布者发布特征并由特征使用者自由使用特征,并通过对特征生成过程的完整描述,确立特征的唯一性,减少各方对特征的分歧,加快特征的传递速度,且特征一次发布,持久唯一,同时通过此种方式没解决了特征生成的歧义问题,并可以使多种语言之间无歧义,减少不必要的麻烦和无效沟通。

虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所作的这些修改或改进,均属于本发明要求保护的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号