首页> 中国专利> 文本断句方法及训练方法、装置、电子设备、存储介质

文本断句方法及训练方法、装置、电子设备、存储介质

摘要

文本断句方法及训练方法、装置、电子设备、存储介质,所述文本断句的训练方法包括:分别获取包含断句信息的第一训练语料和未包含断句信息的第二训练语料;对所述第二训练语料添加断句信息,得到第三训练语料;分别对所述第一训练语料和所述第三训练语料添加与断句信息相关的标注信息;将所述第一训练语料输入至预设的神经网络模型,对所述预设的神经网络模型进行预训练,得到初始文本断句模型;将所述第三训练语料输入至所述初始文本断句模型,对所述初始文本断句模型进行微调,得到文本断句模型。采用上述方案,能够提高断句的准确率。

著录项

  • 公开/公告号CN114239554A

    专利类型发明专利

  • 公开/公告日2022-03-25

    原文格式PDF

  • 申请/专利权人 上海流利说信息技术有限公司;

    申请/专利号CN202111527234.8

  • 发明设计人 余勇宏;

    申请日2021-12-14

  • 分类号G06F40/221(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构31327 上海知锦知识产权代理事务所(特殊普通合伙);

  • 代理人潘彦君

  • 地址 200090 上海市杨浦区长阳路1687号西1168幢(C楼)一层C2101室

  • 入库时间 2023-06-19 14:39:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-25

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号