首页> 中文会议>中国电子学会第十一届青年学术年会 >基于二元切分和模糊集的垃圾邮件中组合歧义词识别算法

基于二元切分和模糊集的垃圾邮件中组合歧义词识别算法

摘要

本文给出了一种基于逆向最大二元切分和模糊集的中文垃圾邮件中组合歧义字符串的识别算法:根据词在句子中出现的概率,训练生成新的核心字典.针对单一邮件,运用逆向最大匹配生成可能字符串,提取字串附近一个阈值范围内的字组成论域,通过改进的二元切分法提取可能存在的词,在论域上定义模糊集进行描述,构造隶属函数并计算贴近度,判别是否属于字符串.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号