Faiss学习：一

在多个GPU上运行Faiss以及性能测试

一、Faiss的基本使用

1.1在CPU上运行

Faiss的所有算法都是围绕index展开的。不管运行搜索还是聚类，首先都要建立一个index。

import faiss

# make faiss available

index = faiss.IndexFlatL2(d)

# build the index

# d is the dimension of data

在运行上述代码后，就可以添加数据并运行搜索了。

index.add(xb)

# xb is the base data

D, I = index.search(xq, k)

# xq is the query data

# k is the num of neigbors you want to search

# D is the distance matrix between xq and k neigbors

# I is the index matrix of k neigbors

1.2在单个GPU上运行

在单个GPU上运行的语法基本与在GPU上运行类似。但是需要申明一个GPU资源的标识.

res = faiss.StandardGpuResources()

# we need only a StandardGpuResources per GPU

flat_config = 0

# flat_config is an ID. if you have 3 GPUs, flat_configs maybe 0, 1, 2

index = faiss.GpuIndexFlatL2(res, d, flat_config)

# build the index

index.add(xb)

D, I = index.search(xq, k)

1.3在多个GPU上运行

在多个GPU上运行时便有所不同，我们需要将数据集分割给多个GPU以完成并行搜索。

在Faiss中提供了两种方法实现：IndexProxy和IndexShards。

下面着重介绍IndexProxy。

res = [faiss.StandardGpuResources() for i in range(ngpu)]

# first we get StandardGpuResources of each GPU

# ngpu is the num of GPUs

indexes = [faiss.GpuIndexFlatL2(res[i], i, d, useFloat16)

           for i in range(ngpu)]

# then we make an Index array

# useFloat16 is a boolean value

index = faiss.IndexProxy()

for sub_index in indexes:

    index.addIndex(sub_index)

# build the index by IndexProxy

二、kmeans测试

1.jpg

如图所示数据为1M个，中心点为1K个。

在不同数据维度以及GPU数目下迭代20次所需要的时间。

三、暴力搜索测试

数据集为sift1M，该数据集共1M个，128维。（运行在两个K40M GPU上）

2.jpg

3.jpg

可以看到在每次查询10K个数据的1024个最近邻居时平均每个查询只需360ns。当需要查询的邻居数下降时，查询时间能够降至100ns。

四、IVFPQ搜索测试

数据集同上，运行环境同上。

基本参数：

numCentroids=4096

numQuantizers=64

首先我们测试nprob对性能的影响

4.jpg

当nprob上升时，每次查询时间会增加，同时查询的准确度也会上升。但上升到一定程度上升幅度便会迅速变小。我们取准确度的拐点值nprob=32进行下一步测试。

接下来我们测试查询的邻居数即k值对性能的影响。

5.jpg

可以看到查询时间不再是线性增长了。也就意味着对于IVFPQ邻居数不宜太多。

选定k=32进行下一步测试。

6.jpg

如图所示，随着每次查询的数量上升，平均查询时间先变小在变大，这可能是由于数据量小时开销比较大导致平均查询时间较大。可以看到随着查询的数量上升，平均查询时间上升但上升幅度放缓，估计会在250ns左右稳定。

作者：momo猪
链接：https://www.jianshu.com/p/4fb45b9070d1
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

Faiss学习：一的更多相关文章

faiss学习
faiss 学习 github wiki 介绍 Faiss:Facebook开源的相似性搜索类库安装在Mac系统编译安装Faiss faiss教程跟进--Makefile 编译 faiss安装 m ...
Faiss的学习和入门文章
可以看这里的文章: https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html https://waltyou.github.io/Faiss ...
faiss索引基于数量级和内存限制的选择
它是一个能使开发者快速搜索相似多媒体文件的算法库.而该领域一直是传统的搜索引擎的短板.借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search ...
Searching with Deep Learning 深度学习的搜索应用
本文首发于 vivo 互联网技术微信公众号 https://mp.weixin.qq.com/s/wLMvJPXXaND9xq-XMwY2Mg作者:Eike Dehling翻译:杨振涛本文由来自 T ...
Faiss教程：索引(1)
索引是faiss的关键知识,我们重点介绍下. 索引方法汇总有些索引名,我就不翻译了,根据英文名去学习更准确. 索引名类名 index_factory 主要参数字节数/向量精准检索备注精准的 ...
揭开Faiss的面纱探究Facebook相似性搜索工具的原理
https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html 本月初雷锋网报道,Facebook 开源了 AI 相似性搜索工具 Faiss.而在 ...
阿里Tree-based Deep Match(TDM) 学习笔记
阅读文献:https://zhuanlan.zhihu.com/p/35030348 参考文献:https://www.leiphone.com/news/201803/nlG3d4sZnRvgAqg ...
Youtube深度学习推荐系统论文
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf https://zh ...
Faiss流程与原理分析
1.Faiss简介 Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库.它包含多种搜索任意大 ...

随机推荐

【平面图最小割】BZOJ2007-[NOI2010]海拔
[题目大意] 城市被东西向和南北向的主干道划分为n×n个区域,包括(n+1)×(n+1)个交叉路口和2n×(n+1)条双向道路.现得到了每天每条道路两个方向的人流量.每一个交叉路口都有海拔,每向上爬h ...
轻巧的编辑器：Sublime Text3 user设置
开发到现在,编辑器倒用过不少,VIM.zend.my eclipse.EPP.editplus.notepad++.sublime text 2. 最初使用sublime是同学推荐的,说其何其的好,何 ...
bzoj3173 Splay 维护前缀中的最大值
大致题意: 有一个空序列,依次插入1~N到该序列中,每次指定插入的位置,每次插入完成返回当前序列的LIS的长度. 题解: 设dp[i]表示前缀1~i的最长上升子序列的长度. 因为是按照递增顺序插入的 ...
Codeforces Beta Round #37 C. Old Berland Language 暴力 dfs
C. Old Berland Language 题目连接: http://www.codeforces.com/contest/37/problem/C Description Berland sci ...
Codeforces 505A Mr. Kitayuta's Gift 暴力
A. Mr. Kitayuta's Gift time limit per test 1 second memory limit per test 256 megabytes input standa ...
opencv 支持向量机SVM分类器
支持向量机SVM是从线性可分情况下的最优分类面提出的.所谓最优分类,就是要求分类线不但能够将两类无错误的分开,而且两类之间的分类间隔最大,前者是保证经验风险最小(为0),而通过后面的讨论我们看到,使分 ...
[Visual Studio] VS2012调试时很慢的解决方案
1.转自http://guooge.com/archives/408.html VS2010调试极慢获取出现死机,因为启动了IntelliTrace Visual Studio 2010 Ulti ...
【原】使用Spring自带的JdbcTemplate。
使用Spring自带的JdbcTemplate,可以简化对数据库的操作,用起来十分方便.通过一下几个步骤的配置,即可以使用JdbcTemplate. (1)配置好Spring的数据源,加入mysql驱 ...
java8函数式接口小例子
// Function<T, R> -T作为输入,返回的R作为输出 Function<String,String> function = (x) -> {System.o ...
从 n 个数字中选出 m 个不同的数字，保证这 m 个数字是等概率的
问题如上. 这是我被面试的一个题目. 我的第一反应给出的解决的方法是.开启 n 个线程并标记序号,各个线程打印出它的序号.直到有 m 个线程被调度时,停止全部线程. 打印出的序号即是 m 个等概率出 ...