正則表達式 - C语言
http://blog.csdn.net/pipisorry/article/details/37073843
sscanf/scanf正则使用方法
%[ ] 的使用方法:%[ ]表示要读入一个字符集合, 假设[ 后面第一个字符是”^”,则表示反意思。
[ ]内的字符串能够是1或很多其它字符组成。
空字符集(%[])是违反规则的。可
导致不可预知的结果。%[^]也是违反规则的。
%[a-z] 读取在 a-z 之间的字符串,假设不在此之前则停止。如
char s[]="hello, my friend” ; // 注意: ,逗号在不 a-z之间
sscanf( s, “%[a-z]”, string ) ; // string=hello
%[^a-z] 读取不在 a-z 之间的字符串。假设碰到a-z之间的字符则停止,如
char s[]="HELLOkitty” ; // 注意: ,逗号在不 a-z之间
sscanf( s, “%[^a-z]”, string ) ; // string=HELLO
%*[^=] 前面带 * 号表示不保存变量。跳过符合条件的字符串。
char s[]="notepad=1.0.0.1001" ;
char szfilename [32] = "" ;
int i = sscanf( s, "%*[^=]", szfilename ) ; // szfilename=NULL,由于没保存
int i = sscanf( s, "%*[^=]=%s", szfilename ) ; // szfilename=1.0.0.1001
%40c 读取40个字符
The run-time library does not automatically append a null terminator to the string, nor does reading 40 characters automatically terminate the scanf() function. Because the library uses buffered input, you must press the ENTER key to terminate
the string scan. If you press the ENTER before the scanf() reads 40 characters, it is displayed normally。 and the library continues to prompt for additional input until it reads 40 characters
%[^=] 读取字符串直到碰到’=’号。’^’后面能够带很多其它字符,如:
char s[]="notepad=1.0.0.1001" ;
char szfilename [32] = "" ;
int i = sscanf( s, "%[^=]", szfilename ) ; // szfilename=notepad
假设參数格式是:%[^=:] ,那么也能够从 notepad:1.0.0.1001读取notepad
使用样例:
char s[]="notepad=1.0.0.1001" ;
char szname [32] = "" ;
char szver [32] = “” ;
sscanf( s, "%[^=]=%s", szname , szver ) ; // szname=notepad, szver=1.0.0.1001
总结:%[]有非常大的功能,可是并非非经常常使用到,主要由于:
1、很多系统的 scanf 函数都有漏洞. (典型的就是 TC 在输入浮点型时有时会出错).
2、使用方法复杂, easy出错.
3、编译器作语法分析时会非常困难, 从而影响目标代码的质量和运行效率.
个人认为第3点最致命,越复杂的功能往往运行效率越低下。而一些简单的字符串分析我们能够自已处理。
[sscanf/scanf正则使用方法]
补充:sscanf,scanf。fscanf中的正則表達式
每种语言都对正則表達式有着不同程度的支持。在C语言中,有输入功能的这三个函数对正則表達式的支持并不强大。可是我们还是有必要了解一下。
首先来看看他们的原型:
#include <stdio.h>
int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *str, const char *format, ...);
均能够接受变參。sscanf与scanf类似。能够将标准输入(stdin)作为输入源。最关键的部分,就是format这个參数了。它能够是一个或者多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符号}。
參数解释:
1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入參数中)
2、{a|b|c}表示a,b,c中选一。[d],表示能够有d也能够没有d。
3、width表示读取宽度。
4、{h | l | I64 | L}:參数的size,通常h表示单字节size。I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。
5、type : 就是%s,%d之类。
6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标參数中写入值
支持的集合操作:%[a-z] 表示匹配a到z中随意字符。贪婪性(尽可能多的匹配)%[aB'] 匹配a、B、'中一员,贪婪性%[^a] 匹配非a的随意字符,贪婪性
返回值
这三个函数返回成功匹配和分配的输入项。意思就是你在format參数列表中的格式。返回值能够比你提供的匹配项目数少(有些将会匹配失败)。提前匹配失败则返回0。
假设达到文件末尾。则返回EOF,当错误发生的时候也将返回EOF。你能够通过输出errno来查看错误代码。
假设使用fscanf来推断文件是否结束,将会存在安全隐患,假设每次读取的时候都是匹配失败,那么返回值永远都不会是EOF。
scanf族的函数都是要先将数据读入缓冲区。然后在冲缓冲里读取。
注意:scanf族函数会忽略一行開始的空白
from:http://blog.csdn.net/pipisorry/article/details/37073843
正則表達式 - C语言的更多相关文章
- python 学习笔记 10 -- 正則表達式
零.引言 在<Dive into Python>(深入python)中,第七章介绍正則表達式,开篇非常好的引出了正則表達式,以下借用一下:我们都知道python中字符串也有比較简单的方法, ...
- 【iOS】正則表達式抓取网页数据制作小词典
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/xn4545945/article/details/37684127 应用程序不一定要自己去提供数据. ...
- Go语言:正則表達式的使用
Go语言的正則表達式使用非常easy.演示样例代码: package test import ( "fmt" "regexp" ) func RegixBase ...
- Linux正則表達式-反复出现的字符
星号(*)元字符表示它前面的正則表達式能够出现零次或多次.也就是说,假设它改动了单个字符.那么该字符能够在那里也能够不在那里,而且假设它在那里,那可能会不止出现一个.能够使用星号元字符匹配出如今引號中 ...
- JAVA中正則表達式总结
昨天,我的朋友请教我正則表達式.我也好久没有写过正則表達式了,昨天刚好看了下如鹏网创始人杨中科老师关于正則表達式的解说.使我加深了正則表達式的印像.现我把他总结下: 很多语言,包含Perl.PHP.P ...
- Perl入门(四)Perl的正則表達式
正則表達式是Perl语言的特色.主要的语法不是非常难,可是编写一个符合需求.高效的正則表達式.还是有一些挑战的. Perl的三种匹配模式 1.查找 语法:m/正則表達式内容/; 作用:查找匹配内容中是 ...
- 轻松学习之Linux教程六 正則表達式具体解释
本系列文章由@超人爱因斯坦出品.转载请注明出处. 作者:超人爱因斯坦 个人站点:http://www.hpw123.net 文章链接:http://hpw123.net/a/L ...
- javascript 正則表達式补充
定义 JavaScript种正則表達式有两种定义方式,定义一个匹配类似 <%XXX%> 的字符串 1. 构造函数 var reg=new RegExp('<%[^%>]+%&g ...
- 黑马程序猿————Java基础日常笔记---反射与正則表達式
------Java培训.Android培训.iOS培训..Net培训.期待与您交流! ------- 黑马程序猿----Java基础日常笔记---反射与正則表達式 1.1反射 反射的理解和作用: 首 ...
随机推荐
- Mongodb查询提示com.MongoDB.MongoException: too much data for sort() with no index
解决办法: 查询数据量太大,添加索引即可解决问题 通过scrapy爬行完数据后,通过db.wooyun.drops.ensureIndex({"datetime":1})
- docker 安装配置
1. 安装docker 环境是ubuntu 14.04 参照: https://help.aliyun.com/document_detail/60742.html # step 1: 安装必要的一 ...
- HTML自定义滚动条(仿网易邮箱滚动条)转载
它是使用CSS中的伪元素来实现的,主要由以下三个来完成: 1. -webkit-scrollbar:定义滚动条的样式,如长宽. 2. -webkit-scrollbar-thumb:定义滚动条上滑块的 ...
- jquery 计算两个日期相差的天数
<!DOCTYPE html> <html> <head> <meta charset = "utf-8"> <title&g ...
- 查找常用字符(给定仅有小写字母组成的字符串数组 A,返回列表中的每个字符串中都显示的全部字符(包括重复字符)组成的列表。例如,如果一个字符在每个字符串中出现 3 次,但不是 4 次,则需要在最终答案中包含该字符 3 次。)
给定仅有小写字母组成的字符串数组 A,返回列表中的每个字符串中都显示的全部字符(包括重复字符)组成的列表. 例如,如果一个字符在每个字符串中出现 3 次,但不是 4 次,则需要在最终答案中包含该字符 ...
- js里面的判断最好做到完全控制
<li class="item"> <div id="zcdz" name="zcdz" class="mini ...
- 解决UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position
最近用Python写了些爬虫,在爬取一个gb2312的页面时,抛出异常: UnicodeEncodeError: 'ascii' codec can't encode characters in po ...
- POJ 2531-Network Saboteur(dfs)
题目链接:https://vjudge.net/problem/POJ-2531 最大流-最小割问题: https://wenku.baidu.com/view/54323c030722192e453 ...
- HDU 2289 Cup【二分】
<题目链接> 题目大意: 一个圆台型的杯子,它的上底半径和下底半径已经给出,并且给出它的高度,问你,体积为V的水倒入这个杯子中,高度为多少. 解题分析: 就是简单的二分答案,二分枚举杯中水 ...
- QLayout: Attempting to add QLayout XXX to XXX, which already has a layout
QLayout是Qt应用开发中一个非常重要的组件,然而平时使用的时候不小心经常会发现控制台有类似如下的警告: QLayout: Attempting to add QLayout "&quo ...