首页> 中国专利> 基于多语言的阅读理解任务识别方法及装置

基于多语言的阅读理解任务识别方法及装置

摘要

本发明实施例提供一种基于多语言的阅读理解任务识别方法及装置,该方法包括:获取任一目标语言的阅读理解任务数据,编码得到上下文嵌入表达向量;将所述嵌入表达向量,输入预设的多语言阅读理解模型,根据多语言阅读理解模型的输出结果,确定阅读理解任务的答案;其中,所述多语言阅读理解模型,以源语言任务数据分别和每一目标语言任务数据的关联语义信息矩阵,进行融合后得到的特征向量作为输入,以源语言任务数据的答案作为标签,进行训练后得到。该方法能够同时支持迁移多语言和多任务数据集中的知识到目标语言中,实现目标语言无数据、少数据条件下的抽取式阅读理解任务,可以提高目标语言少数据以及富数据的抽取式阅读理解任务的准确度。

著录项

  • 公开/公告号CN112182151B

    专利类型发明专利

  • 公开/公告日2021-08-17

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN202011012758.9

  • 发明设计人 许斌;吴高晨;李涓子;侯磊;

    申请日2020-09-23

  • 分类号G06F16/33(20190101);G06F16/332(20190101);G06F40/58(20200101);

  • 代理机构11002 北京路浩知识产权代理有限公司;

  • 代理人郭亮

  • 地址 100084 北京市海淀区双清路30号清华大学

  • 入库时间 2022-08-23 12:18:48

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号