...
首页> 外文期刊>ORSA Journal on Computing >On the Existence and Significance of Data Preprocessing Biases in Web-Usage Mining
【24h】

On the Existence and Significance of Data Preprocessing Biases in Web-Usage Mining

机译:Web使用挖掘中数据预处理偏向的存在和意义

获取原文
获取原文并翻译 | 示例
           

摘要

The literature on web-usage mining is replete with data preprocessing techniques, which correspond to many closely related problem formulations. We survey data-preprocessing techniques for session-level pattern discovery and compare three of these techniques in the context of understanding session-level purchase behavior on the web. Using real data collected from 20,000 users' browsing behavior over a period of six months, four different models (linear regressions, logistic regressions, neural networks, and classification trees) are built based on data preprocessed using three different techniques. The results demonstrate that the three approaches result in radically different conclusions and provide initial evidence that a data preprocessing bias exists, the effect of which can be significant.
机译:关于网络使用挖掘的文献中充斥着数据预处理技术,这些技术对应于许多密切相关的问题表述。我们调查用于会话级模式发现的数据预处理技术,并在了解网络上的会话级购买行为的背景下比较其中三种技术。使用六个月内从20,000个用户的浏览行为中收集的真实数据,基于使用三种不同技术预处理的数据,构建了四个不同的模型(线性回归,逻辑回归,神经网络和分类树)。结果表明,这三种方法得出的结论截然不同,并提供了数据预处理偏差存在的初步证据,其影响可能很大。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号