【24h】

Data Preprocessing in Web Text Mining

机译:Web文本挖掘中的数据预处理

获取原文

摘要

the development of highly efficient and effective search engines is accelerated by the abundant WWW information and people's need for high quality information.Web text mining is one of the key techniques for search engines.But Web data is much complex which enlarges the difficulty in web text mining.To get good mining results, Web page preprocessing is necessary before any text mining starting.Here given the pages set collected from the Robot of search engines, we discussed some essential work to present pages in vectors, such as the term selection, weights presentation, etc.The purpose is to make preparation for the following Web text mining task.
机译:大量的WWW信息和人们对高质量信息的需求促进了高效高效搜索引擎的发展。Web文本挖掘是搜索引擎的关键技术之一。但是Web数据非常复杂,这加大了Web文本的难度为了获得良好的挖掘结果,在进行任何文本挖掘之前都必须对网页进行预处理。在给定从搜索引擎机器人收集的页面集的情况下,我们讨论了以向量表示页面的一些基本工作,例如术语选择,权重目的是为以下Web文本挖掘任务做准备。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号