grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. 使用grep搜索某个关键字时,默认搜索出来的是所有包含该关键字的行,如下:搜索/var/named/veredholdings.cn_zone文件中172.16.50.24所在的行,默认会把所有包括172.16.50.24所在的行打印出来.[root@uat…
情景: 利用Solr做一批词的逆文档频率.Solr中存储的每条数据为一篇文章,此时需要查出某词在多少篇文章中出现过,然后用公式:某词逆文档频率 = 总文章数 / (出现过某词的文章数+1) 来计算. 以下两幅图为两种搜索方式的搜索结果对比: 结果:对某词进行搜索时,将某词用英文双引号括起来就是精确搜索. 直接调用API也是类似的:http://IP:8983/solr/IDFcollection/select?q=quanwen:"机械制造"&wt=json&inden…
使用grep实现精确过滤的五种方法 (1)当被过滤的内容占据一行时 [root@MySQL scripts]# cat oldboy.log        200 0200 2000 [root@MySQL scripts]# grep "\b200\b" oldboy.log  200 #<==正则按单词匹配 [root@MySQL scripts]# grep -w "200" oldboy.log                   200 #<=…
str1="abcdefgh" str2="def" result=$(echo $str1 | grep "${str2}") if [[ "$result" != "" ]];then echo "包含" else echo "不包含" fi 如果精确的匹配到def呢 其实答案很简单,用grep –w "def" 或者是grep "\…
http://blog.sina.com.cn/s/blog_62e7fe670101dg9d.html linux下二进制文件查找: strings 0000.ts | grep -o "T"  | wc -l grep _initcall_.*1$ ./aa > a1 2982  find . -regex '.*\.c|.*\.cxx|.*\.cpp|.*\.h' 2983  find . -regex '.*\.c\|.*\.cxx\|.*\.cpp\|.*\.h' 29…
删除文件中所有的空行:g/^\s*$/d 去掉所有的行尾空格::%s/\s\+$// 整个文件特定字符串的替换:%s/old_word/new_word/g 删除从当前行开始到最后一行的所有内容:.,$d 去掉所有的“//”注释::%s!\s*//.*!!(首先可以注意到,这儿分隔符改用了“!”,原因是在模式或字符串部 分使用了“/”字符,不换用其他分隔符的话就得在每次使用“/”字符本身时写成“\/”,上面的命令得写成“:%s/\s*\/\/.*//”,可读性较 低.命令本身倒是相当简单,用过正…
下面先简单描述一下mapping是什么? 自动或手动为index中的type建立的一种数据结构和相关配置,简称为mappingdynamic mapping,自动为我们建立index,创建type,以及type对应的mapping,mapping中包含了每个field对应的数据类型,以及如何分词等设置 当我们插入几条数据,让ES自动为我们建立一个索引 PUT /website/article/ { "post_date": "2019-08-21", "t…
设置grep高亮显示匹配项 方法1:设置别名 编辑vim~/.bashrc 添加如下一行内容: alias grep = 'grep --color=auto' source ~/.bashrc //使配置生效: 方法2:设置系统环境变量 添加如下一行内容: export GREP_OPTIONS='--color=always' GREP_COLOR='1;33' source ~/.bashrc //使配置生效: 参数说明: export GREP_OPTIONS='--color=XXX'…
sed 命令可以很好的进行行匹配,但从某一行中精确匹配某些内容,则使用 grep 命令并辅以 -o 和 -E 选项可达到此目的.其中 -o 表示“only-matching”,即“仅匹配”之意.光用它不够,配合 -E 选项使用扩展正则表达式则威力巨大. 比如下面有一条文本 tmp.txt ,其中内容为: {"aid":45,"path":"attachment/Mon_1112/2_1_5728040df3ab346.jpg"} 我们想从中过略出…
需求: 精确匹配查找某个字符串   精确匹配: 例如: 在抽取字符串“48”,返回结果包含诸如484和483等包含“48”的其他字符串,实际上应精确抽取只包含48的各行. 使用grep抽取精确匹配的一种有效方式是在抽取字符串前加 \ <, 在抽取字符串后加 \ > .假定现在精确抽取48, 方法如下: #grep ' \ <48\>' filename…