首页> 中国专利> 一种基于深度学习的高并行性阅读理解的方法

一种基于深度学习的高并行性阅读理解的方法

摘要

本发明涉及一种基于深度学习的高并行性阅读理解的方法,包括数据预处理,嵌入层,编码层,交互层,输出层。使用bert模型对预训练进行优化;使用Octave卷积替换原模型中的深度可分离卷积。本发明在原有的高并行机器阅读理解算法——QANet的基础上,改进其嵌入层和编码块的结构,将嵌入层的预训练模型改为BERT,并重构了整个编码块。在编码块中应用了多头自注意力机制,固定了编码块的卷积层的数量,并将本次设计的编码块内所需用到的所有卷积层都改为Octave卷积。并提出将参数量较少其计算较快的的深度可分离卷积应用于Octave卷积中,提升Octave卷积在提升速度的同时提升模型的泛化能力,并将之应用于机器阅读理解任务。

著录项

  • 公开/公告号CN112417089B

    专利类型发明专利

  • 公开/公告日2022.12.09

    原文格式PDF

  • 申请/专利权人 东北大学秦皇岛分校;

    申请/专利号CN201910773587.2

  • 发明设计人 方淼;刘宏凯;菜珩;王翠荣;

    申请日2019.08.21

  • 分类号G06F16/33;G06F16/332;G06N3/04;G06N3/08;

  • 代理机构中国商标专利事务所有限公司;

  • 代理人宋义兴

  • 地址 066004 河北省秦皇岛市经济技术开发区泰山路143号

  • 入库时间 2022-12-29 02:03:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-09

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号