Web日志预处理的Clementine方案

摘要

为了对Web日志进行预处理,通常首先将日志导入到某种数据库中,然后借助数据库管理系统(DBMS)提供的功能完成相关的预处理操作,或者直接交给目前比较成熟的Web日志分析工具,如Awstats、Webtrends等。但无论是DBMS还是Web日志分析工具,它们的挖掘能力相对来说都比较弱,难以满足后期Web日志挖掘的目标,因而还需要将预处理好的日志重新导出交给其他挖掘软件进行处理。SPSS公司整合开发的Clementine数据挖掘工具平台,作为新一代数据挖掘软件,不仅提供了大量的人工智能、统计分析模型,而且提供了与数据准备有关的常用工具,包括选择、排序、筛选、分类、关联等,这为Web日志挖掘以及预处理工作提供了充分的可能。本文重点探讨利用Clementine对Web日志进行预处理的可行性以及具体的操作步骤,为下一步在该平台上开展日志挖掘工作做准备,从而可大大提高Web日志挖掘的自动化程度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号