首页> 美国卫生研究院文献>AMIA Annual Symposium Proceedings >HITON: A Novel Markov Blanket Algorithm for Optimal Variable Selection
【2h】

HITON: A Novel Markov Blanket Algorithm for Optimal Variable Selection

机译:HITON:一种用于最优变量选择的新型马尔可夫毯算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We introduce a novel, sound, sample-efficient, and highly-scalable algorithm for variable selection for classification, regression and prediction called HITON. The algorithm works by inducing the Markov Blanket of the variable to be classified or predicted. A wide variety of biomedical tasks with different characteristics were used for an empirical evaluation. Namely, (i) bioactivity prediction for drug discovery, (ii) clinical diagnosis of arrhythmias, (iii) bibliographic text categorization, (iv) lung cancer diagnosis from gene expression array data, and (v) proteomics-based prostate cancer detection. State-of-the-art algorithms for each domain were selected for baseline comparison. Results: (1) HITON reduces the number of variables in the prediction models by three orders of magnitude relative to the original variable set while improving or maintaining accuracy. (2) HITON outperforms the baseline algorithms by selecting more than two orders-of-magnitude smaller variable sets than the baselines, in the selected tasks and datasets.
机译:我们为分类,回归和预测的变量选择引入了一种新颖,可靠,高效且可扩展的算法,称为HITON。该算法通过引入要分类或预测的变量的马尔可夫毯来工作。具有不同特征的各种各样的生物医学任务被用于实证评估。即,(i)用于药物发现的生物活性预测,(ii)心律不齐的临床诊断,(iii)书目文本分类,(iv)从基因表达阵列数据诊断出肺癌,以及(v)基于蛋白质组学的前列腺癌检测。选择每个领域的最新算法进行基线比较。结果:(1)HITON将预测模型中的变量数量相对于原始变量集减少了三个数量级,同时提高或保持了准确性。 (2)HITON在选定的任务和数据集中,通过选择比基线小的两个数量级以上的变量集来胜过基线算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号