首页> 中国专利> 基于大规模术语语料库对译稿自动碎片化分类的方法

基于大规模术语语料库对译稿自动碎片化分类的方法

摘要

本发明提供了一种基于大规模术语语料库对译稿自动碎片化分类的方法,包括:对译稿进行分词处理,去除停用词,获得其关键词集合,提取译稿每段的各个关键词,建立每个段落与其包含的各个关键词的对应关系;将所述译稿的各个关键词逐个在术语语料库中匹配,将每个关键词匹配的术语的行业类别属性,作为该关键词在其对应的每个段所归属的行业类别属性;根据所述对应关系,确定每个段包含相同的最多的行业类别属性;将最多的行业类别属性对该段分类。由于译稿的词语数要远小于术语库的词语数;且术语库具备按字母顺序查找的功能,在其中进行关键词匹配不需要采用模式匹配算法,可以极大的减少查询时间。缩短对译稿碎片化的时间,提高碎片化效率。

著录项

  • 公开/公告号CN103106245A

    专利类型发明专利

  • 公开/公告日2013-05-15

    原文格式PDF

  • 申请/专利权人 武汉传神信息技术有限公司;

    申请/专利号CN201210591759.2

  • 发明设计人 江潮;

    申请日2012-12-31

  • 分类号G06F17/30(20060101);

  • 代理机构

  • 代理人

  • 地址 430073 湖北省武汉市东湖开发区光谷软件园一期以西、南湖南路以南光谷软件园六期2幢5层205号

  • 入库时间 2024-02-19 18:38:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-06

    发明专利申请公布后的驳回 IPC(主分类):G06F17/30 申请公布日:20130515 申请日:20121231

    发明专利申请公布后的驳回

  • 2016-12-07

    著录事项变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20121231

    著录事项变更

  • 2013-06-12

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20121231

    实质审查的生效

  • 2013-05-15

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号