faiss学习
faiss 学习
介绍
安装
编译
- faiss安装
- makefile.inc的作用
- 按照教程可以分别生成libfaiss.a与libgpufaiss.a静态库文件
- Centos 7.3 编译 & 安装 & 测试 facebook faiss
索引学习
坑
- 首先想在本地mac上编译faiss(失败)
- 安装了cuda,但mac没有GPU
- gcc g++ 默认使用的cmake,通过设置环境变量解决
- 安装openblas boost thrift zookeeper
- 还有一些依赖问题没有解决
- 编译整个项目时出现找不到头文件的问题
- 在本地安装thrift0.9.2(失败)
- 分别可以从github与thrit官网下载包进行安装,但都没有安装成功
- 使用brew install thrift可以安装成功,但无法通过命令选择0.9.2版本
- 网上能找到方法,从github上clone下来brew的thrift版本,然后git log找到0.9.2版本对应的commit id,git checkout到这个id,执行命令,会出错
- 拉取centos7 docker镜像(失败)
- 由于生产环境中使用的是centos7,所以想拉取相同系统环境的镜像,好处是可以直接把线上的库文件scp到本地
- 安装cmake make gcc g++
- 但仍然需要安装cuda openblas thrift boost zookeeper等等依赖
- 依赖安装不完整,编译项目时出现找不到头文件问题
- 使用测试环境(通过)
- 好处是各种依赖已经安装好
- 有点麻烦的是在本地clion写好测试代码,复制到测试机上进行编译并执行测试
- 测试目的为faiss不同版本之间的性能,由于编译faiss(生成静态库文件)需要cuda openblas等依赖,因此也在测试机上执行
- 直接将原src目录下的makefile目录复制,并进行修改(makefile来自nmslib项目,其中还有很多编译选项不明白)
- 编译好不同版本的faiss静态库文件,完成性能测试(faiss库还有待继续深入学习)
- 使用测试环境(无法使用GPU建立索引)
- 原因是测试环境的机器没有GPU,还一直在google错误信息,浪费时间,心塞。。。
- 查看gpu以及类型
lspci | grep -i vga; lspci |grep -i nvidia
- 查看nvidia显卡状态
nvidia-smi
- 查看gpu以及类型
- 原因是测试环境的机器没有GPU,还一直在google错误信息,浪费时间,心塞。。。
- 相似度
- inner product: 越大越相似(越大夹角越小,方向越一致)
- cosine similarity: normalized vector, inner product, -1:1,越大越相似
待补充...
faiss学习的更多相关文章
- Faiss学习:一
在多个GPU上运行Faiss以及性能测试 一.Faiss的基本使用 1.1在CPU上运行 Faiss的所有算法都是围绕index展开的.不管运行搜索还是聚类,首先都要建立一个index. import ...
- Faiss的学习和入门文章
可以看这里的文章: https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html https://waltyou.github.io/Faiss ...
- faiss索引基于数量级和内存限制的选择
它是一个能使开发者快速搜索相似多媒体文件的算法库.而该领域一直是传统的搜索引擎的短板.借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search ...
- Searching with Deep Learning 深度学习的搜索应用
本文首发于 vivo 互联网技术微信公众号 https://mp.weixin.qq.com/s/wLMvJPXXaND9xq-XMwY2Mg作者:Eike Dehling翻译:杨振涛 本文由来自 T ...
- Faiss教程:索引(1)
索引是faiss的关键知识,我们重点介绍下. 索引方法汇总 有些索引名,我就不翻译了,根据英文名去学习更准确. 索引名 类名 index_factory 主要参数 字节数/向量 精准检索 备注 精准的 ...
- 揭开Faiss的面纱 探究Facebook相似性搜索工具的原理
https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html 本月初雷锋网报道,Facebook 开源了 AI 相似性搜索工具 Faiss.而在 ...
- 阿里Tree-based Deep Match(TDM) 学习笔记
阅读文献:https://zhuanlan.zhihu.com/p/35030348 参考文献:https://www.leiphone.com/news/201803/nlG3d4sZnRvgAqg ...
- Youtube深度学习推荐系统论文
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf https://zh ...
- Faiss流程与原理分析
1.Faiss简介 Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库.它包含多种搜索任意大 ...
随机推荐
- npm cnpm
npm 1.说明: npm(node package manager)是nodejs的包管理器,用于node插件管理(包括安装.卸载.管理依赖等) 2.使用npm安装插件:命令提示符执行npm ins ...
- SAX解析与DOM解析
SAX解析实例:http://www.iteye.com/topic/763895 Java Sax解析是按照xml文件的顺序一步一步的来解析,在解析xml文件之前,我们要先了解xml文件的节点的种类 ...
- Android入门(一) IDEA上创建Android应用之helloworld
Android入门(一) IDEA上创建Android应用之helloworld 首先看运行结果: 一.准备工作 下载安装IntelliJ IDEA :我这里用的是2018.2.7 下载安装Genym ...
- 红米note3发热严重,小米真垃圾!
红米note3全网通高配版,高通处理器骁龙650(MSM8956),夏天在有空调的房间,上网几分钟手机发烫,真垃圾! ROM已经是官方最新稳定版.MIUI8.5.2.0(LHNCNED) 红米NOTE ...
- 在WINDOWS下安装MYSQL8.0
1:创建文件夹D:\data\service\mysql-8.0.11-winx64\data 2:进到D:\data\service\mysql-8.0.11-winx64\bin 第三步:初始化. ...
- jmeter分布式、linux运行
一.jmeter分布式压测(多台电脑一起压测) 1.有多台电脑,每台电脑上都有jmeter,而且这几台电脑都互相能ping通 2.在我的电脑的jmeter,bin目录下,修改jmeter.proper ...
- 1、ZooKeeper 基本概念、使用方法、实践场景
ZooKeeper 基本概念 ZooKeeper 是面向分布式应用的协调服务,其实现了树形结构的数据模型(与文件系统类似),并且提供了简洁的编程原语.ZooKeeper 能够作为基础,用于构建更高层级 ...
- 关于CPU CACHE工作机制的学习
转自:http://blog.csdn.net/notbaron/article/details/48143409 1. 存储层次结构 由于两个不谋而合的因素如下: l 硬件:由于不同存储技术的访 ...
- hadoop的hdfs中的javaAPI操作
package cn.itcast.bigdata.hdfs; import java.net.URI; import java.util.Iterator; import java.util.Map ...
- java并发等待条件的实现原理(Condition)
本篇继续学习AQS中的另外一个内容-Condition.想必学过java的都知道Object.wait和Object.notify,同时也应该知晓这两个方法的使用离不开synchronized关键字. ...