【24h】

Unsupervised Discretization Using Tree-Based Density Estimation

机译:基于树的密度估计的无监督离散化

获取原文
获取原文并翻译 | 示例

摘要

This paper presents an unsupervised discretization method that performs density estimation for univariate data. The subintervals that the discretization produces can be used as the bins of a histogram. Histograms are a very simple and broadly understood means for displaying data, and our method automatically adapts bin widths to the data. It uses the log-likelihood as the scoring function to select cut points and the cross-validated log-likelihood to select the number of intervals. We compare this method with equal-width discretization where we also select the number of bins using the cross-validated log-likelihood and with equal-frequency discretization.
机译:本文提出了一种对单变量数据执行密度估计的无监督离散化方法。离散化产生的子间隔可以用作直方图的bin。直方图是一种非常简单且广为人知的用于显示数据的方式,我们的方法会自动将bin宽度调整为数据。它使用对数似然作为评分功能来选择切点,并使用交叉验证的对数似然来选择间隔数。我们将这种方法与等宽离散化进行比较,在等宽离散化中,我们还使用交叉验证的对数似然和等频率离散化来选择面元数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号