解析表达式到lucene.net的Query
查询的时候有自己的查询格式,为了统一并且方便的搜索lucene.net 于是就写了个解析格式,大体上覆盖了几乎所有的lucene.net的query了。当然少了公共扩展库里包含的regexQuery,这个有个坑,平时的时候用的比较少,所以就等下次专门写一篇regexQuery的用法吧。
public class SearchModule { private static readonly Regex _all = new Regex(@"^(-?\d+\.\d{1,8}|-?\d+)~(-?\d+\.\d{1,8}|-?\d+)$"); private static readonly Regex _num = new Regex(@"^(-?\d+\.\d{1,8}|-?\d+)$", RegexOptions.Compiled | RegexOptions.Singleline); public string Module { get; set; } [JsonConverter(typeof(StringEnumConverter))] public Occur Occur { get; set; } private RelationMapper[] _relation; public RelationMapper[] relation { get { return this._relation ?? new RelationMapper[] { }; } set { _relation = value; } } private static Query UpQueryMethod(string key, string value) { if (_num.IsMatch(value) == false) throw new Exception("错误的表达式"); else { if (value.Contains('.')) { return NumericRangeQuery.NewDoubleRange(key, double.Parse(value), double.MaxValue, false, false); } else { return NumericRangeQuery.NewIntRange(key, int.Parse(value), int.MaxValue, false, false); } } } private static Query UpEqualQueryMethod(string key, string value) { if (_num.IsMatch(value) == false) throw new Exception("错误的表达式"); else { if (value.Contains('.')) { return NumericRangeQuery.NewDoubleRange(key, double.Parse(value), double.MaxValue, true, true); } else { return NumericRangeQuery.NewIntRange(key, int.Parse(value), int.MaxValue, true, true); } } } private static Query DownQueryMethod(string key, string value) { if (_num.IsMatch(value) == false) throw new Exception("错误的表达式"); else { if (value.Contains('.')) { return NumericRangeQuery.NewDoubleRange(key, double.MinValue, double.Parse(value), false, false); } else { return NumericRangeQuery.NewIntRange(key, int.MinValue, int.Parse(value), false, false); } } } private static Query DownEqualQueryMethod(string key, string value) { if (_num.IsMatch(value) == false) throw new Exception("错误的表达式"); else { if (value.Contains('.')) { return NumericRangeQuery.NewDoubleRange(key, double.MinValue, double.Parse(value), true, true); } else { return NumericRangeQuery.NewIntRange(key, int.MinValue, int.Parse(value), true, true); } } } private static Query RangeQueryMethod(string key, string value) { if (_all.IsMatch(value) == false) throw new Exception("错误的表达式"); else { var group = _all.Match(value).Groups; var startValue = group[1].Value; var endValue = group[2].Value; if (startValue.Contains('.')) { var sValue = double.Parse(startValue); var eValue = double.Parse(endValue); return NumericRangeQuery.NewDoubleRange(key, sValue > eValue ? eValue : sValue, sValue > eValue ? sValue : eValue, true, true); } else { var sValue = int.Parse(startValue); var eValue = int.Parse(endValue); return NumericRangeQuery.NewIntRange(key, sValue > eValue ? eValue : sValue, sValue > eValue ? sValue : eValue, true, true); } } } private static Query DefaultMethod(string key, string value) { return new TermQuery(new Term(key, value)); } public static Query MultiPhraseQueryMethod(string key, string value) { var mulit = new MultiPhraseQuery(); mulit.Add(new Term(key, value)); return mulit; } public override string ToString() { Func<RelationMapper, Query> queryfunc = (r) => { var c = r.RelationChar; Func<string, string, Query> method; switch (c) { case ">": method = (key, value) => UpQueryMethod(key, value); break; case ">=": method = (key, value) => UpEqualQueryMethod(key, value); break; case "<": method = (key, value) => DownQueryMethod(key, value); break; case "<=": method = (key, value) => DownEqualQueryMethod(key, value); break; case "=": method = (key, value) => DefaultMethod(key, value); break; case "at": method = (key, value) => RangeQueryMethod(key, value); break; case "contains": method = (key, value) => MultiPhraseQueryMethod(key, value); break; case "like": method = (key, value) => DefaultMethod(key, value); break; default: throw new Exception("未知的查询表达式"); } return method(r.Key, r.Value); }; Func<IEnumerable<RelationMapper>, Query> func = (r) => { var query = new BooleanQuery(); foreach (var item in r) { var tquery = queryfunc(item); if (item.Occur == Occur.AND || item.Occur == Occur.OR) query.Add(tquery, Lucene.Net.Search.Occur.MUST); else if (item.Occur == Occur.NOT) query.Add(tquery, Lucene.Net.Search.Occur.MUST_NOT); } return query; }; var orcount = this.relation.Count(r => r.Occur == Occur.OR); Query[] result = new Query[orcount + 1]; if (orcount == 0) { result[0] = func(this.relation); } else { var last = 0; var at = 0; for (int i = 0; i < this.relation.Length; i++) { if (i == 0) { continue; } if (this.relation[i].Occur == Occur.OR) { result[at] = func(this.relation.Take(i).Skip(last)); at++; last = i; } } if (last != this.relation.Length) { result[at] = func(this.relation.Take(this.relation.Length).Skip(last)); } } Query resultQuery; if (result.Count() == 1) { resultQuery = result[0]; } else { var bquery = new BooleanQuery(); foreach (var query in result) { bquery.Add(query, Lucene.Net.Search.Occur.SHOULD); } resultQuery = bquery; } return resultQuery.ToString(); } }
解析表达式到lucene.net的Query的更多相关文章
- Lucene中的 Query对象
"Lucene中的 Query对象": 检 索前,需要对检索字符串进行分析,这是由queryparser来完成的.为了保证查询的正确性,最好用创建索引文件时同样的分析器. quer ...
- 理解Lucene中的Query
Query是一个接口,它有很多实现类. QueryParser是Query解析器,用于将一个字符串解析为一个Query对象,这个Query对象可能属于TermQuery,也可能属于PhraseQuer ...
- Lucene Query Term Weighting
方法 public static Query TermWeighting(Query tquery,Map<String,Float>term2weight){ BooleanQuery ...
- Lucene 06 - 使用Lucene的Query API查询数据
目录 1 Query对象的创建(方式一): 使用子类对象 1.1 常用的Query子类对象 1.2 常用的Query子类对象使用 1.2.1 使用TermQuery 1.2.2 使用NumericRa ...
- Lucene 搜索功能
搜索过程 图解: 主要 API: IndexSearcher: //所有搜索都通过 IndexSearcher 进行,他们将调用该类中重载的 search() 方法 Query: ...
- Lucene.net 多条件查询搜索
最近一直在研究lucene,目的是想让网站实现像搜索引擎那样的搜索,可以快速.准确的帮用户查询出想要的结果.废话不多说,上代码实例: 1.利用BooleanQuery进行多条件搜索(比较灵活) L ...
- 初识Lucene.net
最近想提高下自己的能力,也是由于自己的项目中需要用到Lucene,所以开始接触这门富有挑战又充满新奇的技术.. 刚刚开始,只是写了个小小的demo,用了用lucene,确实很好 创建索引 Data ...
- org.apache.lucene.queryParser.ParseException: Encountered "<EOF>" at line 1, column 0.
如果出现了下列错误,那是因为用错了函数.把queryParser.Query改称queryParser.parse就通过了 org.apache.lucene.queryParser.ParseExc ...
- lucene&solr-day1
全文检索课程 Lucene&Solr(1) 1. 计划 第一天:Lucene的基础知识 1.案例分析:什么是全文检索,如何实现全文检索 2.Lucene实现全文检索的流程 a) ...
随机推荐
- C++ 顺序容器
<C++ Primer 4th>读书笔记 顺序容器内的元素按其位置存储和访问.容器类共享公共的接口,每种容器类型提供一组不同的时间和功能折衷方案.通常不需要修改代码,只需改变类型声明,用一 ...
- 单线程&浏览器多线程
知乎答案:http://www.zhihu.com/question/31982417/answer/54136684 copy大牛的好文:from http://www.cnblogs.com/Ma ...
- jQuery/javascript实现简单网页计算器
<html> <head> <meta charset="utf-8"> <title>jQuery实现</title> ...
- Leetcode 235 Lowest Common Ancestor of a Binary Search Tree 二叉树
给定一个二叉搜索树的两个节点,找出他们的最近公共祖先,如, _______6______ / \ ___2__ ___8__ / \ / \ 0 4 7 9 / \ 3 5 2和8的最近公共祖先是6, ...
- 大家一起写mvc(二)
上一篇已经看了,我想大家都明白了mvc的原理,今天我们来说一下要写自己mvc框架必须要会的技术. mvc的目录是这样的 src目录是我们核心的mvc代码.这个代码明天讲,今天主要讲的代码都在test目 ...
- Inno Setup使用技巧
一.关于Inno Setup如何在安装时播放音乐 方法(1): 在脚本编译里的[Code]与[Files]段处添加以下代码: [Code] Function mciSendString(lpszCom ...
- [GO编程]GO编程环境
GO是一个开源项目,由Google大神发明的,他主要是用于应用程序级开放,可以编译成机器码,和C++一样不需要.NET或JAVA那样的运行框架,因此是个不错的编程语言.更何况发明者都是高手中的高手,而 ...
- python实现自动发送微博,当自己写博客时同步上去。
一.需求: 自己在github上搭建一个基于Jekyll的博客(http://beginman.cn/),每次写完博客后就要push上去,博客写的再好,基本上没人访问,为了增加访问量,就想利用起来微博 ...
- vertex compression所遇到的问题
对于数据压缩,其实就是把浮点的32位精度,改用16位定点数来表达. 例如0.0 = 0,1.0 = 32767,-1.0 = -32767 这是一种有损压缩,会丢失一些精度,一般情况下是可以接受的. ...
- Swift入门篇-集合
一:数组 一:可变数组 定义:数组使用有序列表存储相同类型的多重数据. 格式: 第一种格式 var 变量: 类型[] = [变量值,变量值,...] 第二种格式 var 变量 =[变量值,变量值,.. ...