apache url rewrite及正则表达式笔记
什么是mod_rewrite?
mod_rewrite是apache一个允许服务器端对请求url做修改的模块。入端url将和一系列的rule来比对。这些rule包含一个正则表达式以便检测每个特别的模式。如果在url中检测到该模式,并且适当的预设条件满足,name该模式将被一个预设的字符串或者行为所替换。
这个过程持续进行直到没有任何未处理的规则或者该过程被显式地停止。
这可以用三点来总结:
- 有一系列的顺序处理的规则rule集
- 如果有一条规则被匹配,将同时检查该规则对应的条件是否满足
- 如果一切处理结果都是go,那么将执行一条替换或者其他动作
mod_rewrite的好处
有一些比较明显的好处,但是也有一些并不是很明显:
mod_rewrite非常普遍地被用于转换丑陋的,难以明义的URL,形成所谓"友好或干净的url"。
另一方面,这些转换后的url将会是搜索引擎友好的
正则表达式token:
\s{2,} 2个以上的空格
\| backward referrence
\\ matches a '\'
\b word boundary position,比如whitespace或者字符串的开始或者结束
\B Not a word boundary position
(?=ABC) positive lookahead. Matches a group after your main expression without including it in the result
(?!ABC) Negative lookahead.Specifies a group that can not match after your main expression(ie. if it matches, the result is discarded)
(?<=ABC) Positive lookbehind. Matches a group before your main expression without including it in the result.
(?<!ABC) Negative lookbehind.Specifies a group that can not match before your main expression(ie.if it matches, the result is discarded)
*? :match zero or more of the preceeding token. This is a lazy match, and will match as few characters as possible before satisfying the next token
+? :match one or more of the preceeding token. This is a lazy match, and will match as few characters as possible before satisfying the next token
{5} :matches exactly 5 of the preceeding token;
{2,5} : matches 2 to 5 of the preceding token. Greedy match;
{2,5}? matches 2 to 5 of the preceding token. lazy match;
(ABC) groups multiple tokens together. This allows you to apply quantifiers to the fall group. Creates a capture group roll over a match highlight to see the capture group result
(?:ABC) groups multiple tokens without creating capture group;
$$ escaped $ symbol $`: insert the portion of the string that precedes the match
$&: inserts the matched substring $' : insert the portion of the string that follows the match
[$1]: inserts the result of the first capture group
m multiline
i ignore case
"S" match any character, except for line breaks if dotall is false
"g" search globally
var str='The price of tomato is 5, the price of apple is 10';
str.replace(/(\d+)/g, '$1.00'); // 5.00 10.00
? zero or one
\ escape
\. \\ \+ \* \? \^ \$ \[ \] \( \) \{ \} \/ \' \#
[ABC] Any single character in ABC set
/th(a|i)nk/=/th[ai]nk/
() :捕获 /(.+)@(163|126|188)\.com$/ 检查网易邮箱的格式
(?:)不捕获 /(.+)@(?:163|126|188)\.com$/
javascript中的str.match(regexp)获取被捕获的字符串以便使用
var url='http://blog.163.com/album?id=1#comment';
var reg=/(https?:)\/\/([^\/]+)(\/[^\?]*)?(\?[^#]*)?(#.*)?/;
var arr=rul.match(reg);
var protocal = arr[1]; //http
var host=arr[2];//blog.163.com
var pathname=arr[3]; // /album
var search=arr[4]; // id=1
var hash=arr[5]; //#comment
+ one or more
* zero or more
| or matches the full before or after '|' (https?|ftp)://
^ matches the beginning of the string
$ matches the end of the string
$1 refer to a match
$2 refer to another match
?: within parenthesis to not capture (^.+(?:jpg|png|gif)$)
[^ABC] Any single character not in the set
[a-z] any single character in the a-z range
[^b-e] any single character that is not in range b-e
[0-9]
[\w'-] any world characater, single quote or -
\t \r\n tab
\xFF specifying a character by its hexdecimal index
\xA9 => copyright symbol
如何匹配不包含连续出现的一串字符串?
^(?!.*ab).*$ :不匹配ab连续出现
如何lazy模式尽可能少的匹配到字符串?
alert( "123 456".match(/\d+ \d+?/g) ); // 123 4
注意上面代码中的?就起到了数字匹配lazy最少的模式!
http://javascript.info/regexp-greedy-and-lazy
https://24ways.org/2013/url-rewriting-for-the-fearful/ 号称是最适合人来阅读的关于url-rewrite的文章
apache url rewrite及正则表达式笔记的更多相关文章
- apache url rewrite 的RewriteRule参数详解
apache url rewrite 的RewriteRule参数详解 我们经常会在apache那边对一些url进行一些重写操作,那么就会涉及到很多的重写策略的选择,比如重定向的方式,参数的处理,规则 ...
- apache url rewrite问题
apache RewriteEngine Your browser sent a request that this server could not understand http://www.ra ...
- Apache URL rewrite 配置
下面是Apache的配置过程,可以参考下:1.httpd.conf配置文件中加载了mod_rewrite.so模块,使用虚拟主机 #LoadModule rewrite_module modules/ ...
- nginx和apache下的url rewrite
将服务器上面的数据同步到本地之后,发现打开首页显示不正常,本地服务器是apache,经过打开url rewrite之后本地首页正常显示. 原因是phpwind本身支持了url rewrite的功能,但 ...
- apache开启url rewrite模块
在把服务器数据转移到本地服务器之后,本地打开首页出现排版紊乱等问题,经过大神指点说是url rewrite的问题. 本篇文章主要写怎样开启apache的url rewrite功能. 打开Apache2 ...
- IIS 7.5 使用URL Rewrite模块简单设置网页跳转
原文 IIS 7.5 使用URL Rewrite模块简单设置网页跳转 我们都知道Apache可以在配置文件里方便的设置针对网页或网站的rewrite,但是最近接手了一组IIS服务器,发现这货简单的没有 ...
- Apache之Rewrite和RewriteRule规则梳理以及http强转https的配置总结
一. 简单实例介绍一般来说,apache配置好http和https后,如果想要做http强转到https,需要设置url重定向规则,大致需要下面几个步骤即可完成配置: 1)在httpd.conf文件里 ...
- Linux--nginx域名绑定-url rewrite
进入/usr/local/nginx/conf 编辑 nginx.conf 绑定域名: 添加一个 server元素,更改后的配置内容可能如下: server { listen 80; se ...
- (Nginx) URL REWRITE
URL重写的基础介绍 把URI地址用作参数传递:URL REWRITE 最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换: 这样几乎可以不修改程序的实现将 news. ...
随机推荐
- ubuntu安装maven
1.安装maven前需要安装JDK 2.下载mavenapache-maven-3.3.9-bin.tar.gz 3.解压maven到当前目录tar -zxvf apache-maven-3.3.9- ...
- mysql5.6常用查询sql
查看连接数,状态 1.查询进程 show processlist 查询到相对应的进程===然后 kill id 2.查询是否锁表show OPEN TABLES where In_use &g ...
- LDAP落地实战(二):SVN集成OpenLDAP认证
上一篇文章我们介绍了LDAP的部署以及管理维护,那么如何接入LDAP实现账号统一认证呢?这篇文章将带你完成svn的接入验证 subversion集成OpenLDAP认证 系统环境:debian8.4 ...
- Django配置celery执行异步任务和定时任务
原生celery,非djcelery模块,所有演示均基于Django2.0 celery是一个基于python开发的简单.灵活且可靠的分布式任务队列框架,支持使用任务队列的方式在分布式的机器/进程/线 ...
- 玩转mongodb(五):mongodb 3.0+ 查询性能分析
mongodb性能分析方法:explain() 为了演示的效果,我们先来创建一个有200万个文档的记录.(我自己的电脑耗了15分钟左右插入完成.如果你想插更多的文档也没问题,只要有耐心等就可以了.) ...
- 常用算法1 - 快速排序 & 二分查找
1. 二分查找法: 二分查找法是对一组有序的数字中进行查找,传递相应的数据,进行比较查找到与原数据相同的数据,查找到了返回对应的数组下标,没有找到返回-1. 二分查找法要求数据为一组有序的序列(大到小 ...
- MyEclipse中快速查看错误
当代码中有错误的时候,MyEclipse会用红线标示错误.这个时候在错误地方按下F2就会显示错误详情了.
- Hystrix使用详解
原文参考:http://hot66hot.iteye.com/blog/2155036 一:为什么需要Hystrix? 在大中型分布式系统中,通常系统很多依赖(HTTP,hession,Netty,D ...
- 根据多个点使用canvas贝赛尔曲线画一条平滑的曲线
众所周知想用canvas画一条曲线我们可以使用这些函数: 二次曲线:quadraticCurveTo(cp1x, cp1y, x, y) 贝塞尔曲线:bezierCurveTo(cp1x, cp1y, ...
- K先生的博客
努力,不是为了要感动谁,也不是要做给哪个人看,而是要让自己随时有能力跳出自己厌恶的圈子,并拥有选择的权利. 自己既然选择了这条路,那就要不忘初心坚定的走下去!或许坚持到最后自己会伤痕累累,但,那又怎么 ...