首页> 中国专利> 针对探索性查询的抽样方法

针对探索性查询的抽样方法

摘要

本发明属于数据仓库技术领域,具体为一种针对探索性查询的高效抽样方法。本发明方法包括:根据收集到的用户历史查询记录,将整个数据集划分成若干个抽样块,并构建一棵抽样块索引树来检索所有的抽样块;对于每一个抽样块,根据用户限定的总体样本空间大小限制,生成k个基于优化的分层抽样样本集;运行时,根据用户提交的查询,从抽样块索引树中找到所有有关的抽样块,从每个抽样块中的k个样本集合中取出最优的样本集进行近似结果计算并返回;选取最优样本集时,选出与目标查询分组条件下最优分层抽样策略距离最小的预生成策略;本发明能够成功匹配更多的探索性查询并返回更为精确的结果。

著录项

  • 公开/公告号CN108776707B

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 复旦大学;

    申请/专利号CN201810625076.1

  • 申请日2018-06-17

  • 分类号G06F16/2453(20190101);G06F16/2458(20190101);G06K9/62(20060101);

  • 代理机构31200 上海正旦专利代理有限公司;

  • 代理人陆飞;陆尤

  • 地址 200433 上海市杨浦区邯郸路220号

  • 入库时间 2022-08-23 12:11:21

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号