首页> 中文会议>第27届中国数据库学术会议 >基于双向路径约束模型的XML文档结构相似性度量

基于双向路径约束模型的XML文档结构相似性度量

摘要

为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML文档的结构信息,为更精确的XML相似度计算打下基础。引入自然语言领域中成熟的N-Gram思想,将基于N-Gram的划分方式应用在路径约束相似度计算中,加快了计算效率和精确度。运用正整数和各种权值简化N-Gram信息的提取和运算。实验结果表明,方法提高了聚类的准确率和召回率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号