公开/公告号CN103678353A
专利类型发明专利
公开/公告日2014-03-26
原文格式PDF
申请/专利权人 北京大学;北大方正集团有限公司;北京北大方正电子有限公司;
申请/专利号CN201210335592.3
申请日2012-09-11
分类号G06F17/30(20060101);
代理机构11204 北京英赛嘉华知识产权代理有限责任公司;
代理人王达佐
地址 100871 北京市海淀区颐和园路5号
入库时间 2023-12-17 01:00:24
法律状态公告日
法律状态信息
法律状态
2023-09-22
未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL2012103355923 申请日:20120911 授权公告日:20170620
专利权的终止
2022-07-01
专利权的转移 IPC(主分类):G06F17/30 专利号:ZL2012103355923 登记生效日:20220621 变更事项:专利权人 变更前权利人:北京大学 变更后权利人:北京大学 变更事项:地址 变更前权利人:100871 北京市海淀区颐和园路5号 变更后权利人:100871 北京市海淀区颐和园路5号 变更事项:专利权人 变更前权利人:北大方正集团有限公司 北京北大方正电子有限公司 变更后权利人:新方正控股发展有限责任公司 北京北大方正电子有限公司
专利申请权、专利权的转移
2017-06-20
授权
授权
2014-05-14
实质审查的生效 IPC(主分类):G06F17/30 申请日:20120911
实质审查的生效
2014-03-26
公开
公开
技术领域
本发明涉及信息处理领域,具体而言,涉及一种用于稿件中的 职务信息的检查方法和装置。
背景技术
稿件中经常出现人名及其职务信息,在稿件的编辑过程中要求 该人名的职务信息,并且当多个人名并列出现时,应当按照其职务 的排序将这些人名进行排序。
目前稿件职务校对的工作可以采取人工校对方法,一般包括以 下步骤:
(1)从采编系统中打印需要校对的稿件。
(2)人工阅读该纸面稿件,遇到有疑问的领导人职务,手动去 查找相关的职务信息,或者咨询经验丰富的校对人员。
(3)对错误的职务进行手工批注修改。
(4)手动把修改的内容录入到采编系统中。
人工校对的校对过程过多地依赖校对人员的知识经验,容易出 现失误,导致报纸出现错误的职务信息,影响出版物的质量。
发明内容
本发明旨在提供一种用于稿件中的职务信息的检查方法和装 置,以取代人工校对稿件中的人名信息。
根据本发明的一个方面,提供了一种用于稿件中的职务信息的 检查方法,包括:利用人名数据库对稿件进行全文检索,以确定稿 件中的人名;以确定的人名检索职务数据库,以确定人名所关联的 职务;利用确定的职务判断人名在稿件中的相关信息是否正确。
根据本发明的另一方面,提供了一种用于稿件中的职务信息的 检查装置,包括:人名模块,用于利用人名数据库对稿件进行全文 检索,以确定稿件中的人名;职务模块,用于以确定的人名检索职 务数据库,以确定人名所关联的职务;判断模块,用于利用确定的 职务判断人名在稿件中的相关信息是否正确。
本发明的用于稿件中的职务信息的检查方法和装置因为采用数 据库来检查人名信息,所以克服了人工校对的失误问题,进而提高 了稿件质量。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申 请的一部分,本发明的示意性实施例及其说明用于解释本发明,并 不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的用于稿件中的职务信息的检查 方法的流程图;
图2示出了根据本发明实施例的用于稿件中的职务信息的检查 装置的示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明实施例的用于稿件中的职务信息的检查 方法的流程图,包括:
步骤S10,利用人名数据库对稿件进行全文检索,以确定稿件 中的人名;
步骤S20,以确定的人名检索职务数据库,以确定人名所关联 的职务;
步骤S30,利用确定的职务判断人名在稿件中的相关信息是否 正确。
现有技术中通过人工校对来检查稿件中的人名职务信息,而本 实施例中,利用人名数据库和职务数据库来分析稿件中的人名职务 信息,从而整个过程实现了软件自动化,所以克服了人工校对的失 误问题,进而提高了稿件质量。
优选地,本检查方法还包括:预先创建人名数据库,其中包括 多条记录,各条记录包括用于记载人名的字段;其中,利用人名数 据库对稿件进行全文检索包括:将各条记录中记载的人名与稿件的 全文进行匹配;如果在稿件中匹配到与记录中记载的人名相同的词, 则将匹配到的词确定为稿件中的人名。本实施例的人名数据库方案 比较简单,容易实现。通过对人名数据库的维护,还可以实现人名 数据库的动态更新。需要说明的是,本文中的词是指一个语言单位, 可以是构成单词的一个字符,也可以是构成单词的多个字符,而且 字符可以是标点,也可以是文字。
优选地,本检查方法还包括:预先创建职务数据库,其中包括 多条记录,各条记录包括用于记载人名的第一字段和用于记载职务 的第二字段;其中,以确定的人名检索职务数据库包括:将确定的 人名匹配各条记录;如果在记录的第一字段中匹配到人名,则提取 当前记录中的第二字段中的职务;将提取的职务确定为人名所关联 的职务。本实施例的职务数据库方案比较简单,容易实现。通过对 职务数据库的维护,还可以实现职务数据库的动态更新。例如,校 对人员如果发现职务数据库中的职务信息有误,可以手动修改职务 数据库中的相关字段。
优选地,步骤S30包括:
提取人名在稿件中相邻的词;判断相邻的词是否为职务;
如果相邻的词是职务,则确定相邻的词是否匹配以职务数据库 确定的职务;
如果不匹配,则标注相邻的词。
本实施例通过简单的匹配操作,即可自动地判断职务信息是否 准确,显著地节省了校对人员的工作量。例如稿件中的文字为“部 长张三”,将“部长”与职务数据库进行匹配,发现职务数据库中的 “张三”记录的第二字段是“副部长”,即可自动地标注“部长张三”, 例如显示为红字,从而提醒校对人员判断稿件是否有误。
优选地,预先创建职务数据库,其中包括多条记录,各条记录 包括:用于记载人名的第一字段、用于记载职务的第二字段;以及 用于记载职务的索引的第三字段,索引的大小与职务的级别线性相 关;其中,以确定的人名检索职务数据库,在确定人名所关联的职 务的同时,还确定所关联的职务的索引。本优选实施例将职务的级 别在职务数据库中予以数字化,从而可以对职务自动检查级别信息。
优选地,步骤S30包括:确定稿件中为并列关系的人名;判断 并列的人名的索引在并列关系中的先后排序是否符合人名所关联的 职级为从高到低;如果不符合,则标注并列的人名。因为职务的级 别在职务数据库中已经数字化,所以通过对索引的排序,即可确定 稿件中的人名是否按照职务级别予以排序。例如稿件中的文字为“局 长李四、部长张三、科长王五”,在职务数据库中如果部长的索引是 1、局长的索引是2、科长的索引是3,则上述文字得到的索引顺序 是“2、1、3”,不符合“1、2、3”的顺序,本优选实施例可以自动 地蓝字标注“局长李四、部长张三、科长王五”,从而提醒校对人员 这段文字的人名是否排序有误。
优选地,并列关系为以下模式:职务1、职务2......职务ml人 名1、职务1、职务2......职务m2人名2、......、职务1、职务2...... 职务mn人名n,其中,n为大于等于2的自然数;m1、m2、......、 mn均为非负整数,职务可有可无。例如,可以有以下几种:
1)领导人1
2)领导人1,领导人2
3)职务1领导人1
4)职务1,职务2领导人1
5)职务1,职务2领导人1,领导人2。
这包括了稿件中常见的人名次序。
优选地,确定稿件中为并列关系的人名包括:
A)判断当前的人名在稿件中上文相邻的词;
B)如果无词或者词不是职务,则确定当前人名之前无并列的 人名,结束当前人名的并列关系的判断;
C)如果词是标点符号或词是职务,则对在上文相邻的字符循 环执行步骤B和C;
D)如果词是人名,则将判断得到的人名加入并列关系,并以 判断得到的人名作为当前的人名循环执行上述判断并列关系的步 骤。
上述过程是简单的循环过程,很容易通过计算机变成来实现。
图2示出了根据本发明实施例的用于稿件中的职务信息的检查 装置的示意图,包括:
人名模块10,用于利用人名数据库对稿件进行全文检索,以确 定稿件中的人名;
职务模块20,用于以确定的人名检索职务数据库,以确定人名 所关联的职务;
判断模块30,用于利用确定的职务判断人名在稿件中的相关信 息是否正确。
本装置克服了人名职务人工校对的失误问题,进而提高了稿件 质量。
优选地,判断模块30包括:提取模块,用于提取人名在稿件中 相邻的词;职务判断模块,用于判断相邻的词是否为职务;匹配模 块,用于如果相邻的词是职务,则确定相邻的词是否匹配以职务数 据库确定的职务;标注模块,用于如果不匹配,则标注相邻的词。
本实施例中,利用人名数据库和职务数据库来分析稿件中的人 名职务信息,从而整个过程实现了软件自动化,所以克服了人工校 对的失误问题,进而提高了稿件质量。
优选地,预先创建职务数据库,其中包括多条记录,各条记录 包括:用于记载人名的第一字段、用于记载职务的第二字段;以及 用于记载职务的索引的第三字段,索引的大小与职务的级别线性相 关;其中,职务在确定人名所关联的职务的同时,还确定所关联的 职务的索引,判断模块30包括:并列模块,用于确定稿件中为并列 关系的人名;排序模块,用于判断并列的人名的索引在并列关系中 的先后排序是否符合人名所关联的职级为从高到低;标注模块,用 于如果不符合,则标注并列的人名。
网站、出版物等各种稿件中往往会涉及领导人,通常领导人名 字前面会带上领导人的职务。稿件中,领导人的职务错误或者排序 混乱,会严重影响稿件的质量。从以上的描述中,可以看出,本发 明实现了对稿件的人名职务信息的自动校对,从而提高了稿件质量。
显然,本领域的技术人员应该明白,上述的本发明的各模块或 各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算 装置上,或者分布在多个计算装置所组成的网络上,可选地,它们 可以用计算装置可执行的程序代码来实现,从而,可以将它们存储 在存储装置中由计算装置来执行,或者将它们分别制作成各个集成 电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模 块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明, 对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在 本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。
机译: 确定稿件精细信息位中测量值的装置
机译: 稿件数据的信息处理装置和显示处理方法
机译: 用于在信息信号中嵌入水印的方法和装置,该信息信号具有嵌入的水印,存储介质。用于在信息信号中检测水印的装置和用于发送信息信号的装置