基于BERT在非结构化医疗文本数据处理中的研究与应用

陈健; 左秀然; 孙淼

首页> 中文期刊> 《中国数字医学》 >基于BERT在非结构化医疗文本数据处理中的研究与应用

基于BERT在非结构化医疗文本数据处理中的研究与应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目的:基于BERT对医院近4年的肺部影像非结构化文本报告中的肺结节直径大小进行归类处理,以开发和利用非结构化数据的临床应用效能。方法:通过KETTLE清洗医院近4年有关肺结节的影像文本报告数据,随机选取500个样本报告,对报告中关于肺结节直径大小进行3分类标注,分别是:<8 mm、≥8 mm和未作描述;将标注的样本数据利用第四范式的基于BERT模型的文本分类模块进行自动机器学习,并发布成服务。结果:训练过程中,500个样本报告数据通过自动学习后,模型的准确率达到88.46%;之后对近4年13万份的肺结节报告通过训练后的模型进行了分类推论,并从中随机抽查了500份归类报告(不同于训练用数据),有462份符合实际情况,准确率高达92.40%。结论:BERT在非结构化医疗文本数据处理中更加方便,训练的样本量更少,准确率更高,降低了医疗文本利用最新自然语言处理技术进行学习的门槛。

著录项

来源
《中国数字医学》 |2022年第2期|30-33|共4页
作者
陈健; 左秀然; 孙淼;
展开▼
作者单位

武汉市中心医院;

展开▼
原文格式 PDF
正文语种 chi
中图分类其他科学技术在医学上的应用;
关键词
BERT; 非结构化数据; 肺结节; KETTLE; 自然语言处理;

相似文献

中文文献
外文文献
专利

1. 非结构化数据处理分析在电子数据取证中的应用 [J] . 罗文华 . 警察技术 . 2010,第003期
2. 基于区块链技术数据处理机制的研究与改进——数据处理机制在医疗系统中的应用 [J] . 胡继圆 ,于瓅 . 西安文理学院学报:自然科学版 . 2022,第2期
3. 基于XML的非结构化文本数据转换研究与实现 [J] . 程洪涛 . 现代计算机（专业版） . 2013,第006期
4. 基于Hadoop的医疗健康非结构化大数据分析研究 [J] . 赵俊 ,孙亚丹 . 科技视界 . 2017,第036期
5. 基于结构化电子病历的医疗质量管理系统应用研究 [J] . 秦虎 ,时艳博 ,王帅同 . 中国数字医学 . 2020,第002期
6. 基于本体的非结构化文本查询方法研究及应用 [C] . 刘琼 ,赵韩 ,郑彩霞 . 第二十二届全国计算机信息管理学术研讨会 . 2008
7. 基于多通道卷积神经网络的非结构化医疗文本多标签分类研究 [A] . 陈婕 . 2020

基于BERT在非结构化医疗文本数据处理中的研究与应用

摘要

著录项

相似文献

相关主题

期刊订阅