首页> 中国专利> 一种医学文本词向量化方法

一种医学文本词向量化方法

摘要

本发明涉及面向自然语言处理的预训练领域,具体提供了一种医学文本词向量化方法,通过对原始医学文本数据探查建立词库对后续的向量化做准备,然后通过GLOVE模型进行医学数据词向量化;所述原始医学文本分为结构化数据、半结构化数据和非结构化数据,所述结构化数据中有固定的填写要求数据,所述半结构化数据包含一部分电子病历数据,半结构化数据中有固定标识,固定标识中的内容可能空,所述非结构化数据也包含一部分电子病历数据,非结构化数据没有标识,根据知识去提取。与现有技术相比,本发明收集数据较快速且准确。

著录项

  • 公开/公告号CN114004225A

    专利类型发明专利

  • 公开/公告日2022-02-01

    原文格式PDF

  • 申请/专利权人 山东健康医疗大数据有限公司;

    申请/专利号CN202111185056.5

  • 发明设计人 荆晨;

    申请日2021-10-12

  • 分类号G06F40/289(20200101);G06F40/216(20200101);

  • 代理机构37100 济南信达专利事务所有限公司;

  • 代理人姜丽洁

  • 地址 250117 山东省济南市槐荫区兴福街道西城西进时代中心D座1212室

  • 入库时间 2023-06-19 14:05:00

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号