首页> 中国专利> 一种不同信息源的房产数据同一性判别方法

一种不同信息源的房产数据同一性判别方法

摘要

本发明涉及一种不同信息源的房产数据同一性判别方法,属于互联网数据分析与挖掘技术领域。所述同一性判别方法基于链家、我爱我家、中原、麦田网站公布的房屋数据及其相关性;通过分析房屋数据的特点,通过区域去重、小区去重以及房屋去重的三大步骤剔除重复的房屋数据,所述房屋数据是对实际的房屋客体的特点描述,虽然描述的角度和方式存在差异,但数据之间存在很强的相关性。所述方法能对来源于不同网站的房屋数据去重,能够准确、高效的对来源于不同信息源的房屋数据的同一性判别,并能有效去除重复区域、小区,可以实现面向多源异构的房屋数据的有效融合,为房地产市场分析提供“干净”,“整齐”的数据。

著录项

  • 公开/公告号CN109977287B

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利号CN201910242011.3

  • 申请日2019-03-28

  • 分类号G06F16/951(20190101);G06F16/9535(20190101);G06F16/2458(20190101);G06F16/215(20190101);G06Q50/16(20120101);

  • 代理机构11639 北京正阳理工知识产权代理事务所(普通合伙);

  • 代理人王民盛

  • 地址 100029 北京市朝阳区裕民路甲3号

  • 入库时间 2022-08-23 11:31:06

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号