首页> 中国专利> 机器翻译译后的术语翻译方法、装置、设备及存储介质

机器翻译译后的术语翻译方法、装置、设备及存储介质

摘要

本公开提供一种机器翻译译后的术语翻译方法,包括以下步骤:为原文文本创建第一术语库以及第二术语库;将原文文本中原译文关系为一对一的术语存储至第一术语库,将原文文本中原译文关系为一对多的术语存储至第二术语库;对原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;基于原文译文对齐信息,使用第一术语库将译文文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,基于用户的第一操作指令,使用第二术语库至少对原文文本中的一对多术语原文进行指示,生成指示信息。本公开还提供了一种机器翻译译后的术语翻译装置、电子设备以及存储介质。

著录项

  • 公开/公告号CN113836947A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 北京中科凡语科技有限公司;

    申请/专利号CN202110938432.7

  • 发明设计人 周玉;

    申请日2020-11-20

  • 分类号G06F40/58(20200101);G06F40/45(20200101);

  • 代理机构11807 北京庚致知识产权代理事务所(特殊普通合伙);

  • 代理人韩德凯;李晓辉

  • 地址 100190 北京市海淀区知春路63号51号楼10层1006

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本公开涉及一种机器翻译译后的术语翻译方法、装置、设备及存储介质,属于翻译技术领域。

背景技术

虽然神经网络机器翻译质量较规则和统计机器翻译质量有大幅提升,在翻译有高精准度要求的内容,特别是专业领域等内容时,依然需要人工翻译介入修正。

机器翻译译后编辑逐渐成为重要的翻译方式,一方面大幅提高了翻译效率,一方面保证翻译精准度。而译后编辑的内容一般要求较高,需要精准翻译,特别是翻译内容中的术语如何做到准确高效地翻译,一直是翻译领域的重要问题。

现有技术中的术语翻译主要有两种,一种是基于机器翻译的术语翻译,在文本和文档的纯自动机器翻译过程中,提前指定术语库,使翻译结果中的术语按照术语库中的解释进行输出。另一种是在辅助翻译软件的编辑器界面中,在翻译对应的句子时,主动或自动查询该句子中和术语表中命中的术语,并提示给译者。

基于机器翻译的术语翻译,可以实现纯自动翻译过程的术语替换,但无法在辅助翻译或译后编辑过程中再次添加术语。

基于辅助翻译软件的术语提示,在译者翻译到相关内容时,可自动查询术语库中相关术语并做提示,但无法自动替换,译者需要手动选择和执行替换操作。在翻译内容较多,术语量较大情况下,存在效率低下的问题。

术语库中往往存在一个术语原文对应多个术语译文的情况,替换术语时,存在无法判断该替换为哪个术语译文的情况,因为只能保留一个术语,可能会出现替换错误的情况,导致属于翻译不准确。在多人协作情况下,协作成员添加的术语无法相互参考,导致协作成员贡献的术语译文版本丢失和资源浪费。

发明内容

为了解决上述技术问题中的至少一个,本公开提供了一种机器翻译译后的术语翻译方法、装置、设备及存储介质。

本公开的机器翻译译后的术语翻译方法、装置、设备及存储介质通过以下技术方案实现。

根据本公开的一个方面,提供一种机器翻译译后的术语翻译方法,包括以下步骤:S1、为原文文本创建第一术语库以及第二术语库;S2、将所述原文文本中原译文关系为一对一的术语存储至所述第一术语库,将所述原文文本中原译文关系为一对多的术语存储至所述第二术语库;S3、对所述原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;以及S4、基于所述原文译文对齐信息,使用所述第一术语库将所述译文文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,使用所述第二术语库至少对所述原文文本中的一对多术语原文进行指示,生成指示信息。优选地,基于所述原文译文对齐信息,使用所述第二术语库对所述原文文本中的一对多术语原文进行指示、对机器译文文本中的术语译文进行指示以及生成一对多术语译文的提示信息。示例性的操作场景:自动地将原文文本中的所有一对多术语原文进行指示(例如高亮、变色等),所有一对多术语原文对应的机器译文中的术语译文也被指示(例如高亮、变色等),还生成:所有一对多术语原文对应的一对多术语译文的提示信息(例如,每个术语原文对应的第二术语库中的多个术语译文以提示框的方式进行提示,该提示框中显示一个术语原文和多个术语译文)。

优选地,当所述术语翻译方法用于多个翻译人员协作处理机器翻译之后的文本时,还获取每个翻译人员的身份信息,每个翻译人员的身份信息包括翻译等级,阈值等级以上的翻译人员能够对第一术语库及第二术语库的术语对进行添加和修改,低于阈值等级的翻译人员不能够对第一术语库的术语对进行修改但能够添加,当低于阈值等级的翻译人员尝试对第一术语库中的术语对进行修改时,被尝试修改成的目标术语对被自动备份至所述第二术语库。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,替换地,步骤S4为:基于所述原文译文对齐信息,使用所述第一术语库将所述译文文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,基于用户的第一操作指令,使用所述第二术语库对所述原文文本中的一对多术语原文进行指示,生成指示信息。优选地,基于所述原文译文对齐信息,使用所述第二术语库对所述原文文本中的一对多术语原文进行指示、对机器译文文本中的术语译文进行指示以及生成一对多术语译文的提示信息。示例性的操作场景:当用户的光标位于原文文本中的某一段落时,该段落内的所有一对多术语原文均被指示(例如高亮、变色等),与该段落对齐的机器译文段落中的术语译文也被指示(例如高亮、变色等),还生成:被指示的一对多术语原文对应的一对多术语译文的提示信息(例如,每个术语原文对应的第二术语库中的多个术语译文以提示框的方式进行提示,该提示框中显示一个术语原文和多个术语译文)。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,步骤S1中,为原文文本创建第一术语库以及第二术语库,包括:使用语料库为原文文本创建第一术语库以及第二术语库。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,在步骤S4之前,所述第一术语库被转换为第一字典,所述第二术语库被转换为第二字典。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,用户的所述第一操作指令为光标位置指令。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,还包括:S5、接收用户的第二操作指令,被所述第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文被存储至所述第一术语库或第二术语库并更新第一术语库或第二术语库;以及S6、基于被存储至所述第一术语库的所述目标词语原文查找所述原文文本中的所有目标词语原文,基于所述原文译文对齐信息,使用所述目标词语译文替换所述译文文本中的与所述目标词语原文对齐的词语译文。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,替换地,步骤S6为:基于被存储至所述第一术语库的所述目标词语原文查找所述原文文本中的所有目标词语原文,生成提示信息,基于所述提示信息,所述译文文本中的与所述目标词语原文对齐的词语译文能够被所述目标词语译文替换。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,步骤S5中,被存储至第一术语库的被所述第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文还被存储至所述第二术语库并更新所述第二术语库。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,所述第二操作指令为选中指令。

根据本公开的另一个方面,提供一种机器翻译译后的术语翻译方法,包括以下步骤:SS1、为原文文本创建第一术语库以及第二术语库;SS2、将所述原文文本中原译文关系为一对一的术语存储至所述第一术语库,将所述原文文本中原译文关系为一对多的术语存储至所述第二术语库;SS3、对所述原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;SS4、将所述原文文本拆分为至少两个原文子文本,将各个原文子文本以及各个与原文子文本对齐的译文子文本作为原文译文子文本组以被隔离处理;以及SS5、基于所述原文译文对齐信息,使用所述第一术语库将所述译文子文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,使用所述第二术语库至少对所述原文子文本中的一对多术语原文进行指示,生成指示信息。优选地,基于所述原文译文对齐信息,使用所述第二术语库对所述原文文本中的一对多术语原文进行指示、对机器译文文本中的术语译文进行指示以及生成一对多术语译文的提示信息。示例性的操作场景:自动地将原文文本中的所有一对多术语原文进行指示(例如高亮、变色等),所有一对多术语原文对应的机器译文中的术语译文也被指示(例如高亮、变色等),还生成:所有一对多术语原文对应的一对多术语译文的提示信息(例如,每个术语原文对应的第二术语库中的多个术语译文以提示框的方式进行提示,该提示框中显示一个术语原文和多个术语译文)。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,替换地,步骤SS5为:基于所述原文译文对齐信息,使用所述第一术语库将所述译文子文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,基于用户的第一操作指令,使用所述第二术语库至少对所述原文子文本中的一对多术语原文进行指示,生成指示信息。优选地,基于所述原文译文对齐信息,使用所述第二术语库对所述原文文本中的一对多术语原文进行指示、对机器译文文本中的术语译文进行指示以及生成一对多术语译文的提示信息。示例性的操作场景:当用户的光标位于原文文本中的某一段落时,该段落内的所有一对多术语原文均被指示(例如高亮、变色等),与该段落对齐的机器译文段落中的术语译文也被指示(例如高亮、变色等),还生成:被指示的一对多术语原文对应的一对多术语译文的提示信息(例如,每个术语原文对应的第二术语库中的多个术语译文以提示框的方式进行提示,该提示框中显示一个术语原文和多个术语译文)。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,还包括:SS6、接收用户的第二操作指令,被所述第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文被存储至所述第一术语库或第二术语库并更新第一术语库或第二术语库;以及SS7、基于被存储至所述第一术语库的所述目标词语原文查找被所述第二操作指令操作的原文子文本中的所有目标词语原文,基于所述原文译文对齐信息,使用所述目标词语译文替换被所述第二操作指令操作的原文子文本中的与所述目标词语原文对齐的词语译文。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,替换地,步骤SS7为:基于被存储至所述第一术语库的所述目标词语原文查找被所述第二操作指令操作的原文子文本中的所有目标词语原文,生成提示信息,基于所述提示信息,与被所述第二操作指令操作的原文子文本对齐的译文子文本中的与所述目标词语原文对齐的词语译文能够被所述目标词语译文替换。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译方法,步骤SS6中,被存储至第一术语库的被所述第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文还被存储至所述第二术语库并更新所述第二术语库。

根据本公开的又一个方面,提供一种机器翻译译后的术语翻译装置,包括:术语库创建模块,所述术语库创建模块为原文文本创建第一术语库以及第二术语库,以将所述原文文本中原译文关系为一对一的术语存储至所述第一术语库,以将所述原文文本中原译文关系为一对多的术语存储至所述第二术语库;机器翻译模块,所述机器翻译模块对所述原文文本进行机器翻译,生成译文文本;对齐模块,所述对齐模块对所述原文文本以及所述译文文本进行词对齐,生成原文译文对齐信息;以及处理模块,所述处理模块基于所述原文译文对齐信息,使用所述第一术语库将所述译文文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,使用所述第二术语库至少对所述原文文本中的一对多术语原文进行指示,生成指示信息。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,替换地,所述处理模块基于所述原文译文对齐信息,使用所述第一术语库将所述译文文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,基于用户的第一操作指令,使用所述第二术语库至少对所述原文文本中的一对多术语原文进行指示,生成指示信息。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,所述术语库创建模块为原文文本创建第一术语库以及第二术语库,包括:使用语料库为原文文本创建第一术语库以及第二术语库。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,还包括转换模块,所述转换模块将所述第一术语库被转换为第一字典,将所述第二术语库被转换为第二字典。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,还包括:操作指令接收模块,所述操作指令接收模块接收用户的第二操作指令,所述处理模块将被所述第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至所述第一术语库或第二术语库并更新第一术语库或第二术语库;所述处理模块基于被存储至所述第一术语库的所述目标词语原文查找所述原文文本中的所有目标词语原文,基于所述原文译文对齐信息,使用所述目标词语译文替换所述译文文本中的与所述目标词语原文对齐的词语译文。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,替换地,所述处理模块基于被存储至所述第一术语库的所述目标词语原文查找所述原文文本中的所有目标词语原文,生成提示信息;基于所述提示信息,所述译文文本中的与所述目标词语原文对齐的词语译文能够基于通过所述操作指令接收模块接收的替换指令被所述目标词语译文替换。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,所述处理模块还将被存储至第一术语库的被所述第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至所述第二术语库并更新所述第二术语库。

根据本公开的再一个方面,提供一种机器翻译译后的术语翻译装置,包括:术语库创建模块,所述术语库创建模块为原文文本创建第一术语库以及第二术语库,以将所述原文文本中原译文关系为一对一的术语存储至所述第一术语库,以将所述原文文本中原译文关系为一对多的术语存储至所述第二术语库;机器翻译模块,所述机器翻译模块对所述原文文本进行机器翻译,生成译文文本;对齐模块,所述对齐模块对所述原文文本以及所述译文文本进行词对齐,生成原文译文对齐信息;拆分模块,所述拆分模块将所述原文文本拆分为至少两个原文子文本,使得各个原文子文本以及各个与原文子文本对齐的译文子文本作为原文译文子文本组以被隔离处理;以及处理模块,所述处理模块基于所述原文译文对齐信息,使用所述第一术语库将所述译文子文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,使用所述第二术语库至少对所述原文子文本中的一对多术语原文进行指示,生成指示信息。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,替换地,所述处理模块基于所述原文译文对齐信息,使用所述第一术语库将所述译文子文本中的一对一术语译文替换为所述第一术语库中的术语译文;基于所述原文译文对齐信息,基于用户的第一操作指令,使用所述第二术语库至少对所述原文子文本中的一对多术语原文进行指示,生成指示信息。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,还包括:操作指令接收模块,所述操作指令接收模块接收用户的第二操作指令,所述处理模块将被所述第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至所述第一术语库或第二术语库并更新第一术语库或第二术语库;以及所述处理模块基于被存储至所述第一术语库的所述目标词语原文查找被所述第二操作指令操作的原文子文本中的所有目标词语原文,基于所述原文译文对齐信息,使用所述目标词语译文替换被所述第二操作指令操作的原文子文本中的与所述目标词语原文对齐的词语译文。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,替换地,所述处理模块基于被存储至所述第一术语库的所述目标词语原文查找被所述第二操作指令操作的原文子文本中的所有目标词语原文,生成提示信息,基于所述提示信息,与被所述第二操作指令操作的原文子文本对齐的译文子文本中的与所述目标词语原文对齐的词语译文能够基于通过所述操作指令接收模块接收的替换指令被所述目标词语译文替换。

根据本公开的至少一个实施方式的机器翻译译后的术语翻译装置,所述处理模块还将被存储至第一术语库的被所述第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至所述第二术语库并更新所述第二术语库。

根据本公开的再一个方面,提供一种电子设备,包括:存储器,所述存储器存储执行指令;以及处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行上述任一项所述的方法。

根据本公开的再一个方面,提供一种可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现上述任一项所述的方法。

附图说明

附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。

图1是本公开的一个实施方式的机器翻译译后的术语翻译方法的流程示意图。

图2是本公开的又一个实施方式的机器翻译译后的术语翻译方法的流程示意图。

图3是本公开的又一个实施方式的机器翻译译后的术语翻译方法的流程示意图。

图4是本公开的又一个实施方式的机器翻译译后的术语翻译方法的流程示意图。

图5是本公开的一个实施方式的机器翻译译后的术语翻译装置的结构示意框图。

图6是本公开的又一个实施方式的机器翻译译后的术语翻译装置的结构示意框图。

图7是本公开的又一个实施方式的机器翻译译后的术语翻译装置的结构示意框图。

图8是本公开的又一个实施方式的机器翻译译后的术语翻译装置的结构示意框图。

图9为本公开的一个实施方式的电子设备的结构示意框图。

100机器翻译译后的术语翻译装置

101术语库创建模块

102机器翻译模块

103对齐模块

104处理模块

105转换模块

106操作指令接收模块

107拆分模块

1000通讯接口

2000存储器

3000处理器。

具体实施方式

下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。

需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开的技术方案。

除非另有说明,否则示出的示例性实施方式/实施例将被理解为提供可以在实践中实施本公开的技术构思的一些方式的各种细节的示例性特征。因此,除非另有说明,否则在不脱离本公开的技术构思的情况下,各种实施方式/实施例的特征可以另外地组合、分离、互换和/或重新布置。

在附图中使用交叉影线和/或阴影通常用于使相邻部件之间的边界变得清晰。如此,除非说明,否则交叉影线或阴影的存在与否均不传达或表示对部件的具体材料、材料性质、尺寸、比例、示出的部件之间的共性和/或部件的任何其它特性、属性、性质等的任何偏好或者要求。此外,在附图中,为了清楚和/或描述性的目的,可以夸大部件的尺寸和相对尺寸。当可以不同地实施示例性实施例时,可以以不同于所描述的顺序来执行具体的工艺顺序。例如,可以基本同时执行或者以与所描述的顺序相反的顺序执行两个连续描述的工艺。此外,同样的附图标记表示同样的部件。

当一个部件被称作“在”另一部件“上”或“之上”、“连接到”或“结合到”另一部件时,该部件可以直接在所述另一部件上、直接连接到或直接结合到所述另一部件,或者可以存在中间部件。然而,当部件被称作“直接在”另一部件“上”、“直接连接到”或“直接结合到”另一部件时,不存在中间部件。为此,术语“连接”可以指物理连接、电气连接等,并且具有或不具有中间部件。

为了描述性目的,本公开可使用诸如“在……之下”、“在……下方”、“在……下”、“下”、“在……上方”、“上”、“在……之上”、“较高的”和“侧(例如,如在“侧壁”中)”等的空间相对术语,从而来描述如附图中示出的一个部件与另一(其它)部件的关系。除了附图中描绘的方位之外,空间相对术语还意图包含设备在使用、操作和/或制造中的不同方位。例如,如果附图中的设备被翻转,则被描述为“在”其它部件或特征“下方”或“之下”的部件将随后被定位为“在”所述其它部件或特征“上方”。因此,示例性术语“在……下方”可以包含“上方”和“下方”两种方位。此外,设备可被另外定位(例如,旋转90度或者在其它方位处),如此,相应地解释这里使用的空间相对描述语。

这里使用的术语是为了描述具体实施例的目的,而不意图是限制性的。如这里所使用的,除非上下文另外清楚地指出,否则单数形式“一个(种、者)”和“所述(该)”也意图包括复数形式。此外,当在本说明书中使用术语“包含”和/或“包括”以及它们的变型时,说明存在所陈述的特征、整体、步骤、操作、部件、组件和/或它们的组,但不排除存在或附加一个或更多个其它特征、整体、步骤、操作、部件、组件和/或它们的组。还要注意的是,如这里使用的,术语“基本上”、“大约”和其它类似的术语被用作近似术语而不用作程度术语,如此,它们被用来解释本领域普通技术人员将认识到的测量值、计算值和/或提供的值的固有偏差。

图1是本公开的一个实施方式的机器翻译译后的术语翻译方法。如图1所示,机器翻译译后的术语翻译方法包括以下步骤:S1、为原文文本创建第一术语库以及第二术语库;S2、将原文文本中原译文关系为一对一的术语存储至第一术语库,将原文文本中原译文关系为一对多的术语存储至第二术语库;S3、对原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;以及S4、基于原文译文对齐信息,使用第一术语库将译文文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,使用第二术语库至少对原文文本中的一对多术语原文进行指示,生成指示信息。

图2是本公开的又一个实施方式的机器翻译译后的术语翻译方法。如图2所示,机器翻译译后的术语翻译方法包括以下步骤:S1、为原文文本创建第一术语库以及第二术语库;S2、将原文文本中原译文关系为一对一的术语存储至第一术语库,将原文文本中原译文关系为一对多的术语存储至第二术语库;S3、对原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;以及步骤S4、基于原文译文对齐信息,使用第一术语库将译文文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,基于用户的第一操作指令,使用第二术语库至少对原文文本中的一对多术语原文进行指示,生成指示信息。

上述各个实施方式中,步骤S1中,为原文文本创建第一术语库以及第二术语库,包括:使用语料库为原文文本创建第一术语库以及第二术语库。

其中,语料库可以使用现有技术中的语料库。

上述各个实施方式中,在步骤S4之前,第一术语库被转换为第一字典,第二术语库被转换为第二字典。

优选地,基于原文译文对齐信息,使用第一字典将译文文本中的一对一术语译文替换为第一字典中的术语译文;基于原文译文对齐信息,使用第二字典至少对原文文本中的一对多术语原文进行指示,生成指示信息。

优选地,基于原文译文对齐信息,使用第一字典将译文文本中的一对一术语译文替换为第一字典中的术语译文;基于原文译文对齐信息,基于用户的第一操作指令,使用第二字典至少对原文文本中的一对多术语原文进行指示,生成指示信息。

其中,用户的第一操作指令可以为光标位置指令。

对于上述指示信息,例如,根据用户的光标位置,查询原文文本中(即待翻译文本中)是否有第二术语库中的术语,如有,可以将原文文本中的这些术语展示出来(例如网页翻译系统的编辑器的侧边栏,作为术语指示),或者将这些术语进行高亮显示、变色显示等。

优选地,上述各个实施方式中,还包括:S5、接收用户的第二操作指令,被第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文被存储至第一术语库或第二术语库并更新第一术语库或第二术语库;以及S6、基于被存储至第一术语库的目标词语原文查找原文文本中的所有目标词语原文,基于原文译文对齐信息,使用目标词语译文替换译文文本中的与目标词语原文对齐的词语译文。

通过步骤S5,能够实现用户实时对原文文本中的术语原文添加术语译文,如果添加的术语译文为一对一,则将术语原文以及术语译文添加至第一术语库,如果添加的术语译文为一对多(一个术语原文对应多个术语译文),则将术语原文以及多个术语译文添加至第二术语库。

优选地,上述各个实施方式中,替换地,步骤S6为:基于被存储至第一术语库的目标词语原文查找原文文本中的所有目标词语原文,生成提示信息,基于提示信息,译文文本中的与目标词语原文对齐的词语译文能够被目标词语译文替换。

对于上述提示信息,例如为包括术语原文框和术语译文框的弹窗。

优选地,步骤S5中,被存储至第一术语库的被第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文还被存储至第二术语库并更新第二术语库。

优选地,上述实施方式中,第二操作指令为选中指令。

图3是本公开的又一个实施方式的机器翻译译后的术语翻译方法,包括以下步骤:SS1、为原文文本创建第一术语库以及第二术语库;SS2、将原文文本中原译文关系为一对一的术语存储至第一术语库,将原文文本中原译文关系为一对多的术语存储至第二术语库;SS3、对原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;SS4、将原文文本拆分为至少两个原文子文本,将各个原文子文本以及各个与原文子文本对齐的译文子文本作为原文译文子文本组以被隔离处理;以及SS5、基于原文译文对齐信息,使用第一术语库将译文子文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,使用第二术语库至少对原文子文本中的一对多术语原文进行指示,生成指示信息。

图4是本公开的又一个实施方式的机器翻译译后的术语翻译方法,包括以下步骤:SS1、为原文文本创建第一术语库以及第二术语库;SS2、将原文文本中原译文关系为一对一的术语存储至第一术语库,将原文文本中原译文关系为一对多的术语存储至第二术语库;SS3、对原文文本进行机器翻译,生成译文文本以及原文译文对齐信息;SS4、将原文文本拆分为至少两个原文子文本,将各个原文子文本以及各个与原文子文本对齐的译文子文本作为原文译文子文本组以被隔离处理;以及步骤SS5、基于原文译文对齐信息,使用第一术语库将译文子文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,基于用户的第一操作指令,使用第二术语库至少对原文子文本中的一对多术语原文进行指示,生成指示信息。

上述实施方式中,优选地,还包括:SS6、接收用户的第二操作指令,被第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文被存储至第一术语库或第二术语库并更新第一术语库或第二术语库;以及SS7、基于被存储至第一术语库的目标词语原文查找被第二操作指令操作的原文子文本中的所有目标词语原文,基于原文译文对齐信息,使用目标词语译文替换被第二操作指令操作的原文子文本中的与目标词语原文对齐的词语译文。

上述实施方式中,优选地,替换地,步骤SS7为:基于被存储至第一术语库的目标词语原文查找被第二操作指令操作的原文子文本中的所有目标词语原文,生成提示信息,基于提示信息,与被第二操作指令操作的原文子文本对齐的译文子文本中的与目标词语原文对齐的词语译文能够被目标词语译文替换。

上述实施方式中,优选地,步骤SS6中,被存储至第一术语库的被第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文还被存储至第二术语库并更新第二术语库。

上述实施方式可以实现:

当一个原文文本被拆分成至少两个原文子文本时(至少两个协作成员进行机器翻译译后的编辑),如果某个协作成员添加的术语对(原文译文术语对)和第一术语库中的术语对存在一词多译的情况,则根据添加时间顺序,将第一术语库中的术语对替换为协作成员最后添加的术语对,并将被替换的术语对存储到第二术语库中。

当某个协作成员在第一术语库中添加术语对后,该术语对还被添加到第二术语库中,提示给其他协作成员,实现了多个协作成员独立替换自己有权限的原文子文本中的术语,同时添加的术语对可以相互参考提示。

根据本公开的优选实施方式,多个翻译人员协作处理机器翻译文本时,还获取每个翻译人员的身份信息,每个翻译人员的身份信息包括翻译等级信息。翻译等级信息可以基于翻译人员上传至系统的证书信息、翻译字数信息以及翻译正确率等信息生成。

不同翻译等级的翻译人员被赋予不同的权限,例如阈值等级以上的翻译人员可以对第一术语库的术语对进行添加和修改,也可以对第二术语库的术语对进行添加和修改,低于阈值等级的翻译人员不能够对第一术语库的术语对进行修改,但可以添加,当低于阈值等级的翻译人员尝试对第一术语库中的术语对进行修改时,被尝试修改成的目标术语对被自动备份至第二术语库。例如翻译等级包括高级、中级和初级,高级的翻译人员可以对第一术语库的术语对进行添加和修改,也可以对第二术语库的术语对进行添加和修改,中级和初级的翻译人员不能够对第一术语库的术语对进行修改,当中级或者初级的翻译人员尝试对第一术语库中的术语对进行修改时,被尝试修改成的目标术语对被自动备份至第二术语库。例如尝试将第一术语库中的“苹果--apple”修改为“苹果--fruit”,则第一术语库仍然保留“苹果--apple”,而将“苹果--fruit”备份至第二术语库。

图5是本公开的一个实施方式的机器翻译译后的术语翻译装置100的结构示意框图。

如图5所示,术语翻译装置100包括:术语库创建模块101,术语库创建模块101为原文文本创建第一术语库以及第二术语库,以将原文文本中原译文关系为一对一的术语存储至第一术语库,以将原文文本中原译文关系为一对多的术语存储至第二术语库;机器翻译模块102,机器翻译模块102对原文文本进行机器翻译,生成译文文本;对齐模块103,对齐模块103对原文文本以及译文文本进行词对齐,生成原文译文对齐信息;以及处理模块104,处理模块104基于原文译文对齐信息,使用第一术语库将译文文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,使用第二术语库至少对原文文本中的一对多术语原文进行指示,生成指示信息。

优选地,替换地,处理模块104基于原文译文对齐信息,使用第一术语库将译文文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,基于用户的第一操作指令,使用第二术语库至少对原文文本中的一对多术语原文进行指示,生成指示信息。

优选地,术语库创建模块101为原文文本创建第一术语库以及第二术语库,包括:使用语料库为原文文本创建第一术语库以及第二术语库。

图6是本公开的一个实施方式的机器翻译译后的术语翻译装置100的结构示意框图。

如图6所示,术语翻译装置100还包括转换模块105,转换模块105将第一术语库被转换为第一字典,将第二术语库被转换为第二字典。

图7是本公开的一个实施方式的机器翻译译后的术语翻译装置100的结构示意框图。

如图7所示,术语翻译装置100还包括操作指令接收模块106,操作指令接收模块106接收用户的第二操作指令,处理模块104将被第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至第一术语库或第二术语库并更新第一术语库或第二术语库;处理模块104基于被存储至第一术语库的目标词语原文查找原文文本中的所有目标词语原文,基于原文译文对齐信息,使用目标词语译文替换译文文本中的与目标词语原文对齐的词语译文。

优选地,替换地,处理模块104基于被存储至第一术语库的目标词语原文查找原文文本中的所有目标词语原文,生成提示信息;基于提示信息,译文文本中的与目标词语原文对齐的词语译文能够基于通过操作指令接收模块106接收的替换指令被目标词语译文替换。

优选地,处理模块104还将被存储至第一术语库的被第二操作指令操作的原文文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至第二术语库并更新第二术语库。

图8是本公开的一个实施方式的机器翻译译后的术语翻译装置100的结构示意框图。

如图8所示,机器翻译译后的术语翻译装置100包括:术语库创建模块101,术语库创建模块101为原文文本创建第一术语库以及第二术语库,以将原文文本中原译文关系为一对一的术语存储至第一术语库,以将原文文本中原译文关系为一对多的术语存储至第二术语库;机器翻译模块102,机器翻译模块102对原文文本进行机器翻译,生成译文文本;对齐模块103,对齐模块103对原文文本以及译文文本进行词对齐,生成原文译文对齐信息;拆分模块107,拆分模块107将原文文本拆分为至少两个原文子文本,使得各个原文子文本以及各个与原文子文本对齐的译文子文本作为原文译文子文本组以被隔离处理;以及处理模块104,处理模块104基于原文译文对齐信息,使用第一术语库将译文子文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,使用第二术语库至少对原文子文本中的一对多术语原文进行指示,生成指示信息。

优选地,替换地,处理模块104基于原文译文对齐信息,使用第一术语库将译文子文本中的一对一术语译文替换为第一术语库中的术语译文;基于原文译文对齐信息,基于用户的第一操作指令,使用第二术语库至少对原文子文本中的一对多术语原文进行指示,生成指示信息。

优选地,术语翻译装置100还包括:操作指令接收模块106,操作指令接收模块106接收用户的第二操作指令,处理模块104将被第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至第一术语库或第二术语库并更新第一术语库或第二术语库;以及处理模块104基于被存储至第一术语库的目标词语原文查找被第二操作指令操作的原文子文本中的所有目标词语原文,基于原文译文对齐信息,使用目标词语译文替换被第二操作指令操作的原文子文本中的与目标词语原文对齐的词语译文。

优选地,替换地,处理模块104基于被存储至第一术语库的目标词语原文查找被第二操作指令操作的原文子文本中的所有目标词语原文,生成提示信息,基于提示信息,与被第二操作指令操作的原文子文本对齐的译文子文本中的与目标词语原文对齐的词语译文能够基于通过操作指令接收模块106接收的替换指令被目标词语译文替换。

优选地,处理模块104还将被存储至第一术语库的被第二操作指令操作的原文子文本中的目标词语原文以及该目标词语原文对应的目标词语译文存储至第二术语库并更新第二术语库。

本公开还提供一种电子设备,如图9所示,该设备包括:通信接口1000、存储器2000和处理器3000。通信接口1000用于与外界设备进行通信,进行数据交互传输。存储器2000内存储有可在处理器3000上运行的计算机程序。处理器3000执行计算机程序时实现上述实施方式中方法。存储器2000和处理器3000的数量可以为一个或多个。

存储器2000可以包括高速RAM存储器,也可以还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

如果通信接口1000、存储器2000及处理器3000独立实现,则通信接口1000、存储器2000及处理器3000可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,该图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果通信接口1000、存储器2000、及处理器3000集成在一块芯片上,则通信接口1000、存储器2000、及处理器3000可以通过内部接口完成相互间的通信。

在本说明书的描述中,参考术语“一个实施例/方式”、“一些实施例/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例/方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例/方式或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例/方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例/方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例/方式或示例以及不同实施例/方式或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号