排序实现有N种形式,最低成本、最快响应时间是目标
 一份索引,支持N种排序策略并且在线互不干扰是要考虑的
每一种实现,处理的场景是不同的,不要千篇一律
020排序,从索引到效果,有不少坑,这篇文章没有细说,原因是有些内容不好公开
 
几点基础概念回顾
(1)排序定制化不同于实现业务排序。

     
实现业务排序可以是查阶段,通过boost、各种func 组合、离线score等单独或者组合实现排序目标,
      
或者索引构建阶段的 field boost、document boost
      
或者索引构建阶段的postion、freq、length等的处理
      
或者干预vsm、
      
或者实现自己的function,
      
或者自定义queryparser引入自定义的query和相关weight、score等。
      
或者自定义querycomponent,然后彻底从query链路调整查询和排序
      
或者以上的组合

(2)排序定制化
    
这里特指solr已经默认自带的排序机制,默认vsm、默认sortbyField、默认的function集合包括他们的组合、
    
默认的booleanquery、phrasequery、luceneparser、dismax parser等
都不能满足排序需求的。
    
然后需要开口子,引入自己的排序。

(3)排序是动态的过程
    
绝对不是一次设置,永久有效的。随着数据集的变化、业务场景的变化、市场的变化等因素,排序只是阶段

性满足业务需求。这意味着排序是不间断的过程,没有最好,只有更好。

(4)排序是 one doc one score just
   
这里是说获取到了doc,就获取了这个doc的得分,doc的得分只关联这个doc自身的内容。间接的意思,每个doc的得分是自身闭包的,与其他doc的得分情况无关。

基于solr实现排序定制的几种有效、低成本实现
 (1) 简单、直接的  extends
ValueSourceParser

  在solrconfig.xml
中配置自己的valueSourceParser,查询结点通过name 对应的关键词调用相关排序。
  作用域是在查询中设置,需要的时候就启用
  eg 配置

查询
 query.add("sort", "sortRank(id@itemType)
asc");

(2)vsm bm25 的参数调整 extends SimilarityFactory{
  
配置在schema.xml中,作用域是整个solrcore。

(3)SearchComponent 的重写 extends SearchComponent
   这里面可以实现
默认排序+topN的二次排序;或者直接定义自己的排序
  
这里面的实现是深度的干预查询链路,甚至cache。
   这里的干预设计到shard请求,需要仔细验证
  
这里的干预有的需要parser的干预联合,用来解析参数
   关于o2o个性化排序,建议走这个模式

(4)关于o2o个性化排序
  
 
schema的配置:距离算法、距离精度
 
  
排序策略:过滤优先 or 结果优先 or 速度优先 ,然后会有不同角度的平衡
   

涉及具体业务细节和排序公式,这里省略 1w字

solr特点三: 基于Solr实现排序定制化参考的更多相关文章

  1. 网易云基于 Kubernetes 的深度定制化实践

    本文由  网易云发布. 2017 年,Kubernetes 超越 Mesos 和 Docker Swarm成为最受欢迎的容器编排技术.网易云从 2015 下半年开始向 Kubernetes 社区贡献代 ...

  2. solr特点三: QueryElevation(编辑结果排序)

    在理想的情况下,搜索引擎只返回与用户查询相关的文档.而在现实的查询中,编辑(没发现更合适的表达)通常需要指定特定文档在搜索结果中的特定位置.这样做有很多原因.或许 “置顶” 的文档就是最好的查询结果. ...

  3. solr特点三: defType(查询权重排序)

    Solr的defType有dismax/edismax两种,这两种的区别,可参见:http://blog.csdn.net/duck_genuine/article/details/8060026 e ...

  4. Solr系列三:solr索引详解(Schema介绍、字段定义详解、Schema API 介绍)

    一.Schema介绍 1. Schema 是什么? Schema:模式,是集合/内核中字段的定义,让solr知道集合/内核包含哪些字段.字段的数据类型.字段该索引存储. 2. Schema 的定义方式 ...

  5. pytest+allure(allure-pytest基于这个插件)设计定制化报告

    一:环境准备 1.python3.6 2.windows环境 3.pycharm 4.allure-pytest 5.allure2.8.0 6.java1.8 allure-pytest快速安装 在 ...

  6. pytest+allure(pytest-allure-adaptor基于这个插件)设计定制化报告

    一:环境准备 1.python3.6 2.windows环境 3.pycharm 4.pytest-allure-adaptor 5.allure2.8.0 6.java1.8 pytest-allu ...

  7. Yoshino: 一个基于React的可定制化的PC组件库

    Github: https://github.com/Yoshino-UI... Docs: https://yoshino-ui.github.io/#/ Cli-Tool: https://git ...

  8. ERP_基于Oracle ADF的定制化企业级IT系统解决方案

    2014-12-31 Created By BaoXinjian

  9. Solr学习笔记(1) —— Solr概述&Solr的安装

    一.概述 使用Solr实现电商网站中商品信息搜索功能,可以根据关键字.分类.价格搜索商品信息,也可以根据价格进行排序. 1.1 实现方法 在一些大型门户网站.电子商务网站等都需要站内搜索功能,使用传统 ...

随机推荐

  1. 【转载】Python ConfigParser的使用

    1.基本的读取配置文件-read(filename) 直接读取ini文件内容-sections() 得到所有的section,并以列表的形式返回-options(section) 得到该section ...

  2. #用openfiledialog文件和savefileDialog打开和保存文件

    一.打开文件 Stream myStream = null;            OpenFileDialog openFileDialog1 = new OpenFileDialog();     ...

  3. 跟我学算法- tensorflow 实现RNN操作

    对一张图片实现rnn操作,主要是通过先得到一个整体,然后进行切分,得到的最后input结果输出*_w[‘out’] + _b['out']  = 最终输出结果 第一步: 数据载入 import ten ...

  4. FastJson bean序列化属性顺序问题

    fastjson序列化一个java bean,默认是根据fieldName的字母序进行序列化的,你可以通过ordinal指定字段的顺序,这个特性需要1.1.42以上版本.示例如下. import co ...

  5. U3D+SVN: 两份相同资源放在不同目录下导致META的更改

    U3D+SVN: 两份相同资源放在不同目录下导致META的更改. 实际情形:将地图文件map拷一份放在其它目录,回到UNITY编辑器,载入完成后加到磁盘,看到map文件夹下的所有meta都变红了. r ...

  6. 向ArcGIS的ToolBarControl中添加任意的windows组建的方法[转]

    向ArcGIS的ToolBarControl中添加任意的windows组建的方法[转] Link: http://www.cnblogs.com/mymhj/archive/2012/10/12/27 ...

  7. 使用cnpm代替npm

    淘宝 NPM 镜像 这是一个完整 npmjs.org 镜像,你可以用此代替官方版本(只读),同步频率目前为 10分钟 一次以保证尽量与官方服务同步. 当前 registry.npm.taobao.or ...

  8. nyoj36-最长公共子序列 (LCS)

    http://acm.nyist.net/JudgeOnline/problem.php?pid=36 最长公共子序列 时间限制:3000 ms  |  内存限制:65535 KB 难度:3   描述 ...

  9. Python操作符重载总结&列表模型

    操作符重载 二元运算符 特殊方法 + __add__,__radd__ - __sub__,__rsub__ * __mul__,__rmul__ / __div__,__rdiv__,__trued ...

  10. 116. Populating Next Right Pointers in Each Node (Tree; WFS)

    Given a binary tree struct TreeLinkNode { TreeLinkNode *left; TreeLinkNode *right; TreeLinkNode *nex ...