Efficient Metric All-k-Nearest-Neighbor Search on Datasets Without Any Index

在线阅读 下载PDF 导出详情
摘要 all-k-nearest-neighbor(AkNN)询问为每个询问对象发现k最近的邻居。这个问题在许多区域自然地产生,例如GIS(地理信息系统),多媒体检索,和recommender系统。到各种各样的数据类型和灵活距离度量标准在真实应用程序包含了的支持,也就是,我们在公制的空格学习AkNN检索公制的AkNN(MAkNN)搜索。认为询问上的内在的索引设定,目标集合不能存在,它在许多情形是自然的。例如,询问集合和对象集合能是另外的询问的结果,并且这样,内在的索引不能预先被造。到没有任何内在的索引的数据集上的支持MAkNN搜索,我们建议一个有效基于磁盘的算法,作为基于分区的MAkNN算法(PMA)称为,它跟随一个分区搜索框架并且为加速搜索采用一系列修剪的规则。另外,我们扩大我们的技术处理MAkNN询问的有趣的变体,即,公制的self-AkNN(MSAkNN)搜索,在询问集合与对象相同的地方,设定。用真实、合成的数据集的广泛的实验表明我们的修剪的规则的有效性和建议算法的效率,与最先进的MAkNN和MSAkNN算法相比。
机构地区 不详
出版日期 2016年06月16日(中国期刊网平台首次上网日期,不代表论文的发表时间)