首页> 中国专利> 问答语料生成方法及系统

问答语料生成方法及系统

摘要

本发明实施例提供一种问答语料生成方法。该方法包括:接收语料文本;检测语料文本的文本量,当文本量小于预设阈值时,确定语料文本的用于知识图谱的实体和属性;基于实体和属性,查询与语料文本相匹配的正则表达式;基于正则表达式确定语料文本的模糊说法,将模糊说法输入至知识图谱,按照倒排索引确定语料文本的对应文本;通过正则表达式对语料文本和对应文本进行语料生成,以构建多条成对的问答式对话语料。本发明实施例还提供一种问答语料生成系统。本发明实施例在知识图谱中使用了模糊搜索,提高检索的召回率。在知识图谱检索中,使用倒排索引的方法,提高检索的效率。从而可以在文本、文本段中生成多条成对的问答式对话预料。

著录项

  • 公开/公告号CN111026834B

    专利类型发明专利

  • 公开/公告日2022-07-08

    原文格式PDF

  • 申请/专利权人 思必驰科技股份有限公司;

    申请/专利号CN201911258482.X

  • 发明设计人 许建伟;

    申请日2019-12-10

  • 分类号G06F16/31(2019.01);G06F16/332(2019.01);G06F16/36(2019.01);

  • 代理机构北京商专永信知识产权代理事务所(普通合伙) 11400;北京商专永信知识产权代理事务所(普通合伙) 11400;

  • 代理人黄谦;车江华

  • 地址 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋

  • 入库时间 2022-08-23 13:59:21

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号