首页> 中文期刊>计算机仿真 >用于聊天词汇的权重计算方法CDTF*IDF

用于聊天词汇的权重计算方法CDTF*IDF

     

摘要

随着聊天室的广泛使用,对聊天内容监控也变成亟待解决的问题.在聊天室监控中,为衡量聊天数据中词汇对聊天内容的描述能力,现在一般直接采用文本词汇的权重计算方法;然而,这种方法忽视了聊天数据与静态文本结构上的差异,导致计算出的权重并不能准确反应词汇描述聊天内容的能力.针对聊天数据的固有特点,提出了一种专门针对聊天数据的词汇权重计算方法CDTF*IDF.该方法通过分别计算词汇在不同数据源中的权值并汇总、并对重点词汇提高权重等方式来计算聊天数据的词汇权重.基于IRC聊天室内容监控的实验表明:该方法能较好地衡量聊天词汇的权重,同时基于该方法的监控系统能够准确地识别出聊天数据中的话题.

著录项

  • 来源
    《计算机仿真》|2007年第12期|332-335|共4页
  • 作者

    高鹏; 曹先彬;

  • 作者单位

    中国科学技术大学,计算机科学技术系,安徽,合肥,230027;

    安徽省计算机通讯软件重点实验室,安徽,合肥,230027;

    中国科学技术大学,计算机科学技术系,安徽,合肥,230027;

    安徽省计算机通讯软件重点实验室,安徽,合肥,230027;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 算法理论;
  • 关键词

    聊天室监控; 词汇权重; 话题识别;

  • 入库时间 2022-08-18 04:28:19

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号