Sphinx-简介及原理】的更多相关文章

一 sphinx 简介   在 使用mysql数据库过程中,如果想实现全文检索的优化,可以使用mysql自带全文索引,但是不支持中文..关于sphinx的安装网上很多教程写的都 不错比如:http://www.coreseek.cn/products-install/.这里就不再说明安装方法了.有兴趣的可以自己参考.      MySQL在高并发连接.数据库记录数较多的情况下,SELECT ... WHERE ... LIKE '%...%'的全文搜索方式不仅效率差,而且以通配符%和_开头作查询…
深入研究Sphinx的底层原理和高级使用…
1.简介与原理 互联网诞生之初就存在三大服务:WWW.FTP.邮件 FTP主要针对企业级,可以设置权限,对不同等级的资料针对不同权限人员显示. 但是像网盘这样的基本没有权限划分. 简介: FTP(File Transfer Protocol)文件传输协议,用于网上的控制文件的双向传输. “下载”文件就是从远程主机拷贝文件至自己的计算机上 “上传”文件就是将文件从自己的计算机中拷贝文件到远程主机上. 主动模式:(这里的主动被动是说服务器端,默认都是主动模式) 服务器从20端口主动向客户端发起连接…
经常面试别人或者被面试,对Mybatis简介与原理这个问题的回答千差万别,为了更好的服务与以后,来个原理介绍. 什么是Mybatis MyBatis 本是apache的一个开源项目iBatis, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为MyBatis .iBATIS一词来源于“internet”和“abatis”的组合,是一个基于Java的持久层框架.iBATIS提供的持久层框架包括SQL Maps和Data Acces…
Tomcat简介 作者:杨晓(http://blog.sina.com.cn/u/1237288325) 目录: ----Tomcat背景 ----Tomcat目录 ----Tomcat类加载 ----server.xml配置简介 ----web.xml配置简介 ----管理 ----tomcat原理解说 ----Tomcat Server的组成部分 ----Tomcat Server的结构图 ----配置文件$CATALINA_HOME/conf/server.xml的说明 ---Contex…
简介 RPC(Remote Procedure Call,远程过程调用)是建立在Socket之上的,在一台机器上运行的主程序,可以调用另一台机器上准备好的子程序,就像LPC(本地过程调用). 越底层,代码越复杂.灵活性越高.效率越高:越上层,抽象封装的越好.代码越简单.效率越差. Socket和RPC的区别再次说明了这点.在传统的编程概念中,过程是由程序员在本地编译完成,并只能局限在本地运行的一段代码,也即其主程序和过程之间的运行关系是本地调用关系.因此这种结构在网络日益发展的今天已无法适应实际…
StarlingMVC简介 StarlingMVC是一个为使用Starling来开发游戏的MVC框架.这个框架的特性方面,很像Swiz和RobotLegs,原理亦像Mate.其特性列表如下: 依赖注入(DI)/控制反转(IOC) 视图代理(View Mediation) 事件捕获(Event Handling) 非侵入性框架 配置简单 容易扩展 包含了很多对您的游戏有帮助的工具 官网地址:http://creativebottle.github.com/starlingMVC/ 在Starlin…
HBA,即主机总线适配器英文“Host Bus Adapter”缩写.是一个使计算机在服务器和存储装置间提供输入/输出(I/O)处理和物理连接的电路板和/或集成电路适配器. 简介 主机总线适配器(Host Bus Adapter,HBA)是一个在服务器和存储装置 HBA 间提供输入/输出(I/O)处理和物理连接的电路板和/或集成电路适配器.因为HBA减轻了主处理器在 数据存储和检索任务的负担,它能够提高服务器的性能.一个HBA和与之相连的 磁盘子系统有时一起被称作一个磁盘通道. 我们知道网卡是用…
struts简介 Struts是Apache软件基金会(ASF)赞助的一个开源项目.它最初是jakarta项目中的一个子项目,并在2004年3月成为ASF的顶级项目.它通过采用JavaServlet/JSP技术,实现了基于JavaEEWeb应用的MVC设计模式的应用框架,是MVC经典设计模式中的一个经典产品. Struts发展历史 Struts是作为ApacheJakarta项目的组成部分,项目的创立者希望通过对该项目的研究,改进和提高JavaServerPages.servlet.标签库以及面…
HBase简介 1.HBase是一个万亿行,百万列大表(Big Table),数据存放在hdfs集群中: 写操作使用MapReduce处理,将(增删改)处理结果放入HBase中,读就直接读HBase: HBase的并发量在1000左右,常用的关系型数据库MySql的并发量在300~500之间,之所以HBase的并发量比较大,原因在于HBase启用了缓存技术: HBase中的块的单位是64k,每次读取数据,以块为单位将hdfs集群中的数据加载到内存中,加载到内存中的数据形同一个散列表,散列表以Ke…
简介: SparkStreaming是一套框架. SparkStreaming是Spark核心API的一个扩展,可以实现高吞吐量的,具备容错机制的实时流数据处理. 支持多种数据源获取数据: Spark Streaming接收Kafka.Flume.HDFS等各种来源的实时输入数据,进行处理后,处理结构保存在HDFS.DataBase等各种地方. Dashboards:图形监控界面,Spark Streaming可以输出到前端的监控页面上. *使用的最多的是kafka+Spark Streamin…
简介 RPC(Remote Procedure Call,远程过程调用)是建立在Socket之上的,出于一种类比的愿望,在一台机器上运行的主程序,可以调用另一台机器上准备好的子程序,就像LPC(本地过程调用).越底层,代码越复杂.灵活性越高.效率越高:越上层,抽象封装的越好.代码越简单.效率越差.Socket和RPC的区别再次说明了这点.在传统的编程概念中,过程是由程序员在本地编译完成,并只能局限在本地运行的一段代码,也即其主程序和过程之间的运行关系是本地调用关系.因此这种结构在网络日益发展的今…
1.Appium简介 Appium是一个开源.跨平台的,适用于原生或混合移动应用(hybrid mobile apps)的自动化测试平台.Appium使用WebDriver(JSON wire protocol)驱动安卓和iOS移动应用.Appium的设计哲学是不要为了移动端的自动化测试而重新发明轮子,重新写一套惊天动地的api,也就是说webdriver协议里的api已经够好了,拿来改进一下就可以了.另外Appium可以把server放在任意机器上,哪怕是云服务器都可以,所以Appium和We…
前置概念 在学习dubbo前,需要先了解SOA和RPC这两个概念. SOA 1.英文名称(Service Oriented Ambiguity) 2.中文名称:面向服务架构 2.1 有一个专门提供服务单元. 2.2 其他所有单元都调用这个服务. 3.SOA定位: 3.1 如何设计项目,让开发时更有效率. 3.2 SOA是一种思想 4.之前项目架构设计 4.1 在公司项目不允许所有项目都访问数据库. 4.2 开发时,数据库访问层代码可能出现冗余 5.使用SOA架构 5.1 专门访问数据库服务(项目…
1.DWR简介 DWR(直接web远程访问),DWR是一个Java库,使服务器上的Java和JavaScript的浏览器进行交互和相互调用尽可能简单. DWR 是一个可以允许你去创建 AJAX WEB 站点的 Java 开源库.它可以让你在浏览器中的 JavaScript 代码调用 Web 服务器上的 Java 代码,就像在 Java 代码就在浏览器中一样. DWR官网: http://www.directwebremoting.org/dwr/index.html 英文如果还可以的话,可以看官…
1.JSP简介 (1)JSP的全称是Java Server Pages(运行在服务器端的页面),实际就是Servlet(学习JSP的关键就是时刻联想到Servlet) (2)JSP.Servlet各自作用 ==> Servlet:一般作为控制组件,处理业务逻辑 ==> JSP:一般作为显示组件,显示数据 (3)书写JSP就相当于书写html代码,只不过里面可以镶嵌java代码,为用户提供动态数据 (4)更改了jsp页面,新增了jsp页面都不需要重新部署启动服务器,直接访问即可 (5)JSP包括…
Sqoop简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql.postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中. Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache…
目录 一.动态语言和动态语言的比较 动态语言 静态语言 二.反射 简介 反射的常见使用 1. 代码编辑器 2. Spring等框架的IoC容器 3. 和注解的配合使用 原理 反射优缺点 调试查看 Class类 获取Class实例的方式 1. 通过对象获得 2. 通过Class.forname获得 3. 通过类名.class获得 4.基本内置类型的包装类用Type属性获得 5. 一个Class实例通过.getSuperclass()获得父类的Class实例 哪些类型可以有Class对象 java内…
博客1:http://www.oschina.net/question/12_11255 博客2: CompletionService简介 CompletionService与ExecutorService类似都可以用来执行线程池的任务,ExecutorService继承了Executor接口,而CompletionService则是一个接口,那么为什么CompletionService不直接继承Executor接口呢?主要是Executor的特性决定的,Executor框架不能完全保证任务执行…
前言 本文主要通过一个简单小例子,介绍JSP的原理. 1.项目结构 2.web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://java.sun.com/xml/ns/javaee" xsi:schemaLocation…
从这篇博文开始我们学习一下Mybatis,希望大家提出宝贵的建议. 什么是Mybatis MyBatis 本是apache的一个开源项目iBatis, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为MyBatis .iBATIS一词来源于"internet"和"abatis"的组合,是一个基于Java的持久层框架.iBATIS提供的持久层框架包括SQL Maps和Data Access Objec…
Eureka是Netflix开发的服务发现组件,本身是一个基于REST的服务.Spring Cloud将它集成在其子项目spring-cloud-netflix中,以实现Spring Cloud的服务发现功能.目前Eureka 项目相当活跃,代码更新相当频繁,目前最新的版本是1.9.8.Eureka 2.0也在紧锣密鼓地开发中,2.0将会带来更强的功能和更好的扩展性,但是由于还没有Release,故而不作讨论. 本文讲解的Spring Cloud Camden SR1所使用的Eureka版本是1…
目录 1.LockSupport功能简介 1.1 使用wait,notify阻塞唤醒线程 1.2 使用LockSupport阻塞唤醒线程 2. LockSupport的其他特色 2.1 可以先唤醒线程再阻塞线程 2.2 先唤醒线程两次再阻塞两次会发生什么 3. LockSupport阻塞和唤醒线程原理浅析 4. 总结 1.LockSupport功能简介 在java并发包下各种同步组件的底层实现中,LockSupport的身影处处可见.JDK中的定义为用来创建锁和其他同步类的线程阻塞原语. *Ba…
目录 目录 主机和集群 vCenter Datacenter Cluster Host Virtual Machine Folder Resource Pool Template 数据存储 Datastore Cluster Datastore 网络 标准交换机 分布式虚拟交换机 参考资料 主机和集群 vCenter vCenter 提供了对 Datacenter 便捷的单点控制平台,运行在 Windows 服务器中,可集中管理 VMware ESX/ESXi Host,并提供基本的 Datac…
1 )说明: Android开源代码:www.github.com 模拟一个异步http请求说明…
一.SpringBoot创建web开发(三部曲) 1.快速构建SpringBoot项目,并以jar包的形式构建 2.选择对应的功能模块 (选定场景,配置少量的配置就可运行,不配置有默认值) 3.编写自己的逻辑代码 二.SpringBoot对静态资源的映射规则 通过查看WebMvcAutoConfiguration类,可以查看SpringBoot对静态资源存放的位置 @Override public void addResourceHandlers(ResourceHandlerRegistry…
前面简单介绍了hadoop生态圈,大致了解hadoop是什么.能做什么.带着这些目的我们深入的去学习他.今天一起看一下hadoop的基石--文件存储.因为hadoop是运行与集群之上,处于分布式环境之中,所以他的文件存储也不同与普通的本地存储,而是分布式存储系统,HDFS(The Hadoop Distributed File System). 因为数据量越来越大,一台机器管理的磁盘数量是有限的,所有的数据由很多台机器管理.那么对于这么多台机器管理的数据如何进行协调处理呢?这个时候分布式文件管理…
1 引言 深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物体识别和物体定位的综合,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置. 为了完成这两个任务,目标检测模型分为两类.一类是two-stage,将物体识别和物体定位分为两个步骤,分别完成,这一类的典型代表是R-CNN, fast R-CNN, faster-RCNN家族.他们识别…
What/Sphinx是什么 定义 Sphinx是一个全文检索引擎. 特性 索引和性能优异 易于集成SQL和XML数据源,并可使用SphinxAPI.SphinxQL或者SphinxSE搜索接口 易于通过分布式搜索进行扩展 高速的索引建立(在当代CPU上,峰值性能可达到10 ~ 15MB/秒) 高性能的搜索 (在1.2G文本,100万条文档上进行搜索,支持高达每秒150~250次查询) Why/为什么使用Sphinx 遇到的使用场景 遇到一个类似这样的需求:用户可以通过文章标题和文章搜索到一片文…
What/Sphinx是什么 定义 Sphinx是一个全文检索引擎. 特性 索引和性能优异 易于集成SQL和XML数据源,并可使用SphinxAPI.SphinxQL或者SphinxSE搜索接口 易于通过分布式搜索进行扩展 高速的索引建立(在当代CPU上,峰值性能可达到10 ~ 15MB/秒) 高性能的搜索 (在1.2G文本,100万条文档上进行搜索,支持高达每秒150~250次查询) Why/为什么使用Sphinx 遇到的使用场景 遇到一个类似这样的需求:用户可以通过文章标题和文章搜索到一片文…