首页> 外文期刊>JMLR: Workshop and Conference Proceedings >Local Density Estimation in High Dimensions
【24h】

Local Density Estimation in High Dimensions

机译:高维局部密度估计

获取原文
           

摘要

An important question that arises in the study of high dimensional vector representations learned from data is: given a set D of vectors and a query q, estimate the number of points within a specified distance threshold of q. Our algorithm uses locality sensitive hashing to preprocess the data to accurately and efficiently estimate the answers to such questions via an unbiased estimator that uses importance sampling. A key innovation is the ability to maintain a small number of hash tables via preprocessing data structures and algorithms that sample from multiple buckets in each hash table. We give bounds on the space requirements and query complexity of our scheme, and demonstrate the effectiveness of our algorithm by experiments on a standard word embedding dataset.
机译:从数据中学习高维矢量表示的研究中出现的一个重要问题是:给定一组矢量D和一个查询q,估计在q的指定距离阈值内的点数。我们的算法使用位置敏感的哈希值对数据进行预处理,以通过使用重要性采样的无偏估计器来准确有效地估计此类问题的答案。一项关键创新是能够通过预处理数据结构和算法(从每个哈希表中的多个存储桶采样)来维护少量哈希表。我们对方案的空间要求和查询复杂性进行了界定,并通过在标准词嵌入数据集上进行实验来证明我们算法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号