首页> 中文会议>第27届中国数据库学术会议 >GHOST:作者名字排歧系统

GHOST:作者名字排歧系统

摘要

名字二义性降低了文档检索的性能,在数据清理过程中消除名字二义性十分重要。针对名字二义性的研究,提供了一个名字排歧框架的演示系统,名为GHOST。GHOST使用合作者信息作为输入。通常,对于一位特定的作者,其运行一个4步的工作流程--"合作者图的构建"、"有效路径选择"、"相似度计算"以及"聚类"。同时给出了GHOST演示系统的演示方案。整个演示方案可分为4部分--"合作者图和相似度计算"、"聚类过程"、"结果和评测"以及"用户贡献"。在第1部分中,用户可以观察GHOST生成的合作者图并且对每对待解决结点(resolving node)之间的相似度产生一个直观的认识;第2部分演示了聚类的过程;在第3部分,GHOST的结果和对GHOST的评测将被展现出来;第4部分允许用户提供评测数据,来帮助所有名字排歧问题的研究者获得更多的评测数据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号