首页> 美国卫生研究院文献>other >Supervised Extraction of Diagnosis Codes from EMRs: Role of Feature Selection Data Selection and Probabilistic Thresholding
【2h】

Supervised Extraction of Diagnosis Codes from EMRs: Role of Feature Selection Data Selection and Probabilistic Thresholding

机译:有监督地从EMR中提取诊断代码:特征选择数据选择和概率阈值的作用

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Extracting diagnosis codes from medical records is a complex task carried out by trained coders by reading all the documents associated with a patient’s visit. With the popularity of electronic medical records (EMRs), computational approaches to code extraction have been proposed in the recent years. Machine learning approaches to multi-label text classification provide an important methodology in this task given each EMR can be associated with multiple codes. In this paper, we study the the role of feature selection, training data selection, and probabilistic threshold optimization in improving different multi-label classification approaches. We conduct experiments based on two different datasets: a recent gold standard dataset used for this task and a second larger and more complex EMR dataset we curated from the University of Kentucky Medical Center. While conventional approaches achieve results comparable to the state-of-the-art on the gold standard dataset, on our complex in-house dataset, we show that feature selection, training data selection, and probabilistic thresholding provide significant gains in performance.
机译:从病历中提取诊断代码是一项复杂的任务,由训练有素的编码人员通过读取与患者就诊相关的所有文档来完成。随着电子病历(EMR)的普及,近年来已经提出了用于代码提取的计算方法。鉴于每个EMR都可以与多个代码关联,因此用于多标签文本分类的机器学习方法在此任务中提供了一种重要的方法。在本文中,我们研究了特征选择,训练数据选择和概率阈值优化在改进不同的多标签分类方法中的作用。我们基于两个不同的数据集进行实验:用于此任务的最新金标准数据集,以及我们从肯塔基大学医学中心策划的第二个更大,更复杂的EMR数据集。尽管常规方法在金标准数据集上可获得与最新技术相当的结果,但在我们复杂的内部数据集上,我们却表明,特征选择,训练数据选择和概率阈值可显着提高性能。

著录项

  • 期刊名称 other
  • 作者单位
  • 年(卷),期 -1(2013),-1
  • 年度 -1
  • 页码 66–73
  • 总页数 21
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号