今天被@SVCHAO 勾起兴趣来了。。有把正则表达式兴趣捡起来了，试了下notepad++基本上语法倒是没有忘记，不过如果是用在嵌入式的方案的话，似乎还是有点费劲的。

先mark一个基础语法。

单个字符匹配

采用方括号描述，例如[0135678]表示0 1 3 5 6 7 8 都可以通过该次匹配

采用方括号排除，例如[^azAZ]表示除了a z A 和Z 全部可以通过该字节匹配

允许使用-表示范围，例如[0-9a-zA-Z]表示所有数字跟字母

常用单个字符存在通用表达方式，例如\w 表示[0-9a-zA-Z] 剩下的慢慢补充

采用{}表示匹配次数描述，例如\w{2}表示连续两个字符都是数字或者字母

采用()捕获比较结果…

以上内容自行科普。

为了适应使用场景为嵌入式找到了这个demo

slre（Github Super Light Regular Expression library）

但是我好像不支持{},而且没找到贪婪相关的… 所以暂时搁置

后来说熟悉一下GNU里面的regex.h

发现跟python的regex接口很像应该是posix的原因。

坑爹的虚拟机很久没更新了，折腾了一会环境之后总算是测试出效果了。

#include <stdio.h>

#include <sys/types.h>

#include <regex.h>

int main(int char_c,char** char_v)

{

    char* p_str = "  Url        =  www.google.com.hk ;";

    char* p_reg = " {0,}(\\S+) {0,}= {0,}(\\S+) {0,};";

    regex_t reg;

    regmatch_t matchs[20];

    memset(matchs,0,sizeof(matchs));

    int r;

    r = regcomp(&reg, p_reg, REG_EXTENDED);

    r = regexec(&reg, p_str, 20, matchs, 0);

    return 0;

}

因为是自己测试用的代码，所以并没有特地去做输出、直接断点打下来看就知道结果了，

其中REG_EXTENDED一定要加，不然某些特性用不了，

还有一个奇怪的点就是，matchs[0]中会存放一个整个p_reg的匹配范围，所以如果是只需要提取我们定义中()的目标结果的话、

从p_reg[1]开始就好了。

顺手吐槽下C的字符串语法、调了好久… 结果是\跟\\的锅… 不过似乎也没什么更高效的方案。

下一步如果再用到的话，可能就是手动往SLRE里面添加贪婪的部分、或者找到GNU的regex.c进行裁剪了…

到时候再说

#include <stdio.h>

#include <sys/types.h>

#include <regex.h>

#include <string.h>

int main(int char_c, char** char_v) {

    char* p_str = "  Url        =  www.google.com.hk ;";

    char* p_reg = " {0,}(\\S+) {0,}= {0,}(\\S+) {0,};";

    regex_t reg;

    regmatch_t matchs[20];

    int r, i;

    r = regcomp(&reg, p_reg, REG_EXTENDED);

    if (r != 0) {

        printf("err");

    }

    r = regexec(&reg, p_str, 20, matchs, 0);

    if (r != 0) {

        printf("err");

    }

    for (i = 0; i < 20; i++) {

        int start_index = matchs[i].rm_so;

        int end_index = matchs[i].rm_eo;

        int len = end_index - start_index;

        if (start_index >= 0) {

            char dis_buffer[256];

            strncpy(dis_buffer, &p_str[start_index], len);

            dis_buffer[len]='\0';

            printf("catch:%s\n",dis_buffer);

        }

    }

    return 0;

}

鉴于我抓输出抓了很久… 我决定还是把数据捕获的代码贴出来…

使用环境为G++ with eclipse-cdt

debug用习惯了就没换IDE

catch:  Url        =  www.google.com.hk ;

catch:Url

catch:www.google.com.hk

测试输出结果是正确的…

REGEX.C GNU 提取过滤数据的更多相关文章

测试开发Python培训：抓取新浪微博评论提取目标数据-技术篇
测试开发Python培训:抓取新浪微博评论提取目标数据-技术篇在前面我分享了几个新浪微博的自动化脚本的实现,下面我们继续实现新的需求,功能需求如下: 1,登陆微博 2,抓取评论页内容3,用正则表 ...
python操作MONGODB数据库，提取部分数据再存储
目标:从一个数据库中提取几个集合中的部分数据,组合起来一共一万条.几个集合,不足一千条数据的集合就全部提取,够一千条的就用一万减去不足一千的,再除以大于一千的集合个数,得到的值即为所需提取文档的个数. ...
[PY3]——过滤数据——列表推导、filter()、itertools.compress()
问题你有一个数据序列,想利用一些规则从中提取出需要的值或者是缩短序列解决方案最简单的过滤数据的方法,就是使用列表推导. 使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集 ...
5.MySQL必知必会之过滤数据-WHERE
本章将讲授如何使用SELECT语句的WHERE子句指定搜索条件. 1.使用WHERE子句数据库表一般包含大量的数据,很少需要检索表中所有行.通常只会根据特定操作或报告的需要提取表数据的子集.只检索 ...
asp.net过滤数据中有异常数据字符串
/// <summary> /// 过滤数据 /// </summary> /// <param name="_str"></param& ...
转：SQL SERVER数据库中实现快速的数据提取和数据分页
探讨如何在有着1000万条数据的MS SQL SERVER数据库中实现快速的数据提取和数据分页.以下代码说明了我们实例中数据库的“红头文件”一表的部分数据结构: CREATE TABLE [dbo]. ...
用php自带的filter函数验证、过滤数据 -转载
PHP过滤器包含两种类型 Validation:用来验证验证项是否合法 Sanitization:用来格式化被验证的项目,因此它可能会修改验证项的值,将不合法的字符删除等. input_filters ...
ADO.NET 快速入门（十）：过滤数据
我们有很多方法来过滤数据.一种是在数据库命令级别,利用 where 子句查询过滤数据.另一种是在数据填充到 DataSet 以后过滤数据.本篇讨论后者. 一旦数据填充到 DataSet,你可以使用 ...
Android利用Filter过滤数据
MainActivity如下: package cc.testfilterable; import java.util.ArrayList; import java.util.HashMap; imp ...

随机推荐

C# WebBrowser控件使用教程与技巧收集
常用的方法 Navigate(string urlString):浏览urlString表示的网址 Navigate(System.Uri url):浏览url表示的网址 Navigate(strin ...
扩展django的User的部分方法
这做项目时发现django自带的User中的字段不够用,默认的auth_user表总共只有11个字段,如果需要更多的字段该怎么办,在网上搜了一下,有这么几种方法. 1. 直接修改django 源码,修 ...
CSS之过渡简单应用—日落西山
代码: <!DOCTYPE html><html><head> <title>日落西山</title> <meta charset=& ...
asp.net MVC code first Migrations : Model 同步到DB中
找来找去,看来用这个功能的人很少. http://www.it165.net/pro/html/201403/10653.html 步骤: 1,在程序包管理控制台上,Enable-Migrations ...
jquery 触发/失去焦点事件例子详解
触发焦点: $("Element").focus() 触发每一个匹配元素获得焦点事件. $("Element").focus(function) 事件会在获得焦 ...
安装R语言扩展包vegan
这周的作业我开始得好迟啊...然而还是要努力做啊... ××××××××××××××我是萌萌哒分割线×××××××××××××××××××××××××××××××××××× 首先,百度进入官方页面,看 ...
Log4j快速使用精简版
Log4j快速使用精简版 1.导入log4j-1.2.17.jar包 2.在src根目录下创建log4j.properties文件 log4j.rootLogger=INFO, CONSOLE, FI ...
android技巧（五）一个异步+接口回调的例子
public class DataBaseUtils { // 当前数据库地址 private String DB_PATH; // 备份后数据库保存地址 private String DB_BACK ...
ios控制器生命周期详解
#import "MyOneViewController.h" @interface MyOneViewController () @property (nonatomic, st ...
iOS中修改头部tabBarButton 默认按钮的颜色和默认字体颜色
+(void)initialize { //初始化设置主题 UINavigationBar *navBar = [UINavigationBar appearance]; [navBar setBac ...

REGEX.C GNU 提取过滤数据

单个字符匹配

REGEX.C GNU 提取过滤数据的更多相关文章

随机推荐

热门专题