首页> 外文学位 >Mining predictive patterns and extension to multivariate temporal data.
【24h】

Mining predictive patterns and extension to multivariate temporal data.

机译:挖掘预测模式并扩展到多元时间数据。

获取原文
获取原文并翻译 | 示例

摘要

An important goal of knowledge discovery is the search for patterns in the data that can help explaining its underlying structure. To be practically useful, the discovered patterns should be novel (unexpected) and easy to understand by humans. In this thesis, we study the problem of mining patterns (defining subpopulations of data instances) that are important for predicting and explaining a specific outcome variable. An example is the task of identifying groups of patients that respond better to a certain treatment than the rest of the patients.;We propose and present efficient methods for mining predictive patterns for both atemporal and temporal (time series) data. Our first method relies on frequent pattern mining to explore the search space. It applies a novel evaluation technique for extracting a small set of frequent patterns that are highly predictive and have low redundancy. We show the benefits of this method on several synthetic and public datasets.;Our temporal pattern mining method works on complex multivariate temporal data, such as electronic health records, for the event detection task. It first converts time series into time-interval sequences of temporal abstractions and then mines temporal patterns backwards in time, starting from patterns related to the most recent observations. We show the benefits of our temporal pattern mining method on two real-world clinical tasks.
机译:知识发现的一个重要目标是在数据中搜索可以帮助解释其底层结构的模式。要在实践中有用,发现的模式应该新颖(出乎意料)并且易于人类理解。在本文中,我们研究了挖掘模式(定义数据实例的子群体)的问题,该模式对于预测和解释特定的结果变量很重要。一个例子是确定与其他患者相比对某种治疗反应更好的患者群体的任务。我们提出并提出了有效的方法来挖掘时间和时间(时间序列)数据的预测模式。我们的第一种方法依靠频繁的模式挖掘来探索搜索空间。它应用了一种新颖的评估技术来提取少量的频繁预测的模式,这些模式具有很高的预测性和低冗余性。我们在多种合成和公共数据集上展示了该方法的优势。我们的时间模式挖掘方法适用于复杂的多元时间数据,例如电子健康记录,用于事件检测任务。它首先将时间序列转换为时间抽象的时间间隔序列,然后从与最新观察相关的模式开始,向后挖掘时间模式。我们在两个现实世界的临床任务上展示了我们的时间模式挖掘方法的好处。

著录项

  • 作者

    Batal, Iyad.;

  • 作者单位

    University of Pittsburgh.;

  • 授予单位 University of Pittsburgh.;
  • 学科 Computer Science.
  • 学位 Ph.D.
  • 年度 2012
  • 页码 172 p.
  • 总页数 172
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号