C++常用字符串分割方法

一、用strtok函数进行字符串分割

原型： char *strtok(char *str, const char *delim);

功能：分解字符串为一组字符串。

参数说明：str为要分解的字符串，delim为分隔符字符串。

返回值：从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

其它：strtok函数线程不安全，可以使用strtok_r替代。

strtok内部记录上次调用字符串的位置，所以不支持多线程，可重入版本为strtok_r,有兴趣的可以研究一下。它适用于分割关键字在字符串之间是“单独”或是 “连续“在一起的情况。

注意：因为函数内部会修改原字符串变量，所以传入的参数不能是不可变字符串（即不能是字符串常量区）。

如 char *tokenremain ="abcdefghij"//编译时为文字常量，不可修改。

strtok(tokenremain,"cde");

strsep(&tokenremain,"cde");

编译通过,运行时会报段错误。

这种情况必须先把字符串赋值为可修改的变量。

//借助strtok实现split

#include <string.h>

#include <stdio.h>

int main()

{

    char s[] = "Golden Global   View,disk * desk";

    const char *d = " ,*";

    char *p;

    p = strtok(s,d);

    while(p)

    {

        printf("%s\n",p);

        p=strtok(NULL,d);  //注意这里，strtok内部记录了上次的位置

    }

    return ;

}

还有strsep函数，自己百度一下例子。[http://www.cnblogs.com/longzhao1234/archive/2012/05/31/2528317.html]

strsep返回值为分割后的开始字符串，并将函数的第一个参数指针指向分割后的剩余字符串。它适用于分割关键字在两个字符串之间只严格出现一次的情况。

二、用STL进行字符串的分割

涉及到string类的两个函数find和substr：
1、find函数
原型：size_t find ( const string& str, size_t pos = 0 ) const;
功能：查找子字符串第一次出现的位置。
参数说明：str为子字符串，pos为初始查找位置。
返回值：找到的话返回第一次出现的位置，否则返回string::npos

2、substr函数
原型：string substr ( size_t pos = 0, size_t n = npos ) const;
功能：获得子字符串。
参数说明：pos为起始位置（默认为0），n为结束位置（默认为npos）
返回值：子字符串

#include <iostream>

#include <string>

#include <vector>

//字符串分割函数

std::vector<std::string> split(std::string str,std::string pattern)

{

  std::string::size_type pos;

  std::vector<std::string> result;

  str+=pattern;//扩展字符串以方便操作

  int size=str.size();

  for(int i=; i<size; i++)

  {

    pos=str.find(pattern,i);

    if(pos<size)

    {

      std::string s=str.substr(i,pos-i);

      result.push_back(s);

      i=pos+pattern.size()-;

    }

  }

  return result;

}

int main()

{

  std::string str;

  std::cout<<"Please input str:"<<std::endl;

  //std::cin>>str;

  getline(std::cin,str);

  std::string pattern;

  std::cout<<"Please input pattern:"<<std::endl;

  //std::cin>>pattern;

  getline(std::cin,pattern);//用于获取含空格的字符串

  std::vector<std::string> result=split(str,pattern);

  std::cout<<"The result:"<<std::endl;

  for(int i=; i<result.size(); i++)

  {

    std::cout<<result[i]<<std::endl;

  }

  std::cin.get();

  std::cin.get();

  return ;

}

三、用Boost进行字符串的分割

用boost库的正则表达式实现字符串分割

#include <iostream>

#include <cassert>

#include <vector>

#include <string>

#include "boost/regex.hpp"

std::vector<std::string> split(std::string str,std::string s)

{

    boost::regex reg(s.c_str());

    std::vector<std::string> vec;

    boost::sregex_token_iterator it(str.begin(),str.end(),reg,-);

    boost::sregex_token_iterator end;

    while(it!=end)

    {

        vec.push_back(*it++);

    }

    return vec;

}

int main()

{

    std::string str,s;

    str="sss/ddd/ggg/hh";

    s="/";

    std::vector<std::string> vec=split(str,s);

    for(int i=,size=vec.size();i<size;i++)

    {

        std::cout<<vec[i]<<std::endl;

    }

    std::cin.get();

    std::cin.get();

    return ;

}

boost里面有自带的split的函数，如果用boost的话，还是直接用split的好

#include <iostream>

#include <string>

#include <vector>

#include <boost/algorithm/string/classification.hpp>

#include <boost/algorithm/string/split.hpp>

using namespace std;

int main()

{

 string s = "sss/ddd,ggg";

 vector<string> vStr;

 boost::split( vStr, s, boost::is_any_of( ",/" ), boost::token_compress_on );

 for( vector<string>::iterator it = vStr.begin(); it != vStr.end(); ++ it )

  cout << *it << endl;

 return ;

}

使用Boost库

1）使用boost::split。根据字符来split，注意is_any_of的意思是集合中的任何一个，而不是equals的意思，那如何根据字符串split原字符串？请看2和3。

#include <iostream>

#include <vector>

#include <string>

#include <boost/algorithm/string.hpp>

using namespace std;

int main()

{

    string str( "dfa&fda|dfdf");

    vector<string> tokens;

    boost::split(tokens, str, boost::is_any_of("&|"));

    for (size_t i = ; i < tokens.size(); ++ i)

    {

        cout << tokens[i] << endl;

    }

    return ;

}

2) 使用boost::tokenize，注意 boost::char_separator<char>分隔符一样是集合的概念！但划分方法和boost::split不大一样，详看boost文档。

#include <iostream>

#include <vector>

#include <string>

#include <boost/tokenizer.hpp>

using namespace std;

int main()

{

    string str("dfa||fda||dfdf");

    vector<string> tokens;

    boost::char_separator<char> sep("|");

    boost::tokenizer<boost::char_separator<char> > tok(str, sep);

    tokens.clear();

    std::copy(tok.begin(), tok.end(), std::back_inserter(tokens));

    for (size_t i = ; i < tokens.size(); ++ i)

    {

        cout << tokens[i] << endl;

    }

    return ;

}

3）使用boost::regex

#include <iostream>

#include <vector>

#include <string>

#include <boost/regex.hpp>

using namespace std;

int main()

{

    string str("dfa||fda||dfdf");

    vector<string> tokens;

    boost::regex reg("\\|\\|");

    boost::sregex_token_iterator it(str.begin(), str.end(), reg, -);

    boost::sregex_token_iterator end;

    while (it!=end)

    {

        tokens.push_back(*it++);

    }

    for (size_t i = ; i < tokens.size(); ++ i)

    {

        cout << tokens[i] << endl;

    }

    return ;

}

C++常用字符串分割方法的更多相关文章

[转]C++常用字符串分割方法实例汇总
本文实例汇总了C++常用字符串分割方法,分享给大家供大家参考.具体分析如下: 我们在编程的时候经常会碰到字符串分割的问题,这里总结下,也方便我们以后查询使用. 一.用strtok函数进行字符串分割原 ...
C++常用字符串分割方法实例汇总
投稿:shichen2014 字体:[增加减小] 类型:转载时间:2014-10-08我要评论这篇文章主要介绍了C++常用字符串分割方法实例汇总,包括了strtok函数.STL.Boost等常用 ...
C++常用字符串分割方法（转）
1.用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim); 功能:分解字符串为一组字符串. 参数说明:str为要分解的字符串, ...
JavaScript字符串分割方法
使用split('')方法.此方法与Java的字符串分割方法方法名一样.
（数据科学学习手札131）pandas中的常用字符串处理方法总结
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介在日常开展数据分析的过程中,我们经常需要对 ...
【2019-5-26】python：字典、常用字符串处理方法及文件操作
一.数据类型:字典 1.字典: 1.1定义字典:dict={'key':'value'} 1.2字典与列表相比,字典取值快,可直接找到key 1.3字典是无序的,不能根据顺序取值 1.4多个元素用逗号 ...
JS常用字符串处理方法应用总结
这篇文章主要总结了JS常用字符串的处理方法,需要的朋友可以参考下 1.indexOf()方法,从前往后查找字符串位置,大小写敏感,从0开始计数.同理,lastIndexOf() 方法从后往前,两个 ...
标准C中字符串分割方法
◆ 使用strtok函数分割. 原型:char *strtok(char *s, char *delim); strtok在s中查找包含在delim中的字符并用NULL('\0')来替换,直到找遍整个 ...
js常用字符串处理方法
JS自带函数concat将两个或多个字符的文本组合起来,返回一个新的字符串.var a = "hello";var b = ",world";var c = a ...

随机推荐

usb3.0驱动
usb3.0驱动下载地址华硕注入usb3.0驱动工具下载地址 https://dlsvr04.asus.com/pub/ASUS/misc/utils/ASUS_EZInstaller_V10306 ...
Linux配置使用SSH Key登录并禁用root密码登录(替换同理)
Linux系统大多说都支持OpenSSH,生成公钥.私钥的最好用ssh-keygen命令,如果用putty自带的PUTTYGEN.EXE生成会不兼容OpenSSH,从而会导致登录时出现server r ...
Python3与SQLServer、Oracle、MySql的连接方法
环境: python3.4 64bit pycharm2018社区版 64bit Oracle 11 64bit SQLServer· Mysql 其中三种不同的数据库安装在不同的服务器上,通过局域网 ...
(转) 改变UITextField placeHolder颜色、字体、输入光标位置等
我们有时需要定制化UITextField对象的风格,可以添加许多不同的重写方法,来改变文本字段的显示行为.这些方法都会返回一个CGRect结构,制定了文本字段每个部件的边界范围,甚至修改placeHo ...
杭电 1051 Wooden Sticks
Description There is a pile of n wooden sticks. The length and weight of each stick are known in adv ...
cs229_part5
这部分主要补充一些cs229没涉及到,但是实际上非常重要,而且是实际中真正会用的一些算法,即集成学习. 集成学习问题背景既然我们已经知道了很多学习算法,这些算法最终会输出一个结果.能不能把这些结果 ...
lnmp环境运行laravel open_basedir restriction in effect 问题
环境配置:centos 7 : php 7.1.5 Warning: require(): open_basedir restriction in effect. File(/home/wwwroot ...
TOJ 2446: Mint
2446: Mint Time Limit(Common/Java):2000MS/20000MS Memory Limit:65536KByteTotal Submit: 4 ...
【Bzoj】1001狼抓兔子（平面图最小割转对偶图最短路）
YEAH 题目链接终于做对这道题啦建图的艰辛难以言表- - 顺便说一句我队列转STL啦狼抓兔子的地图符合平面图定义,于是将该图转成对偶图并求出对偶图的最短路即可. 这篇博客给了我极大的帮助 ...
mybatis学习（一）——mybatis简介
1.简介 MyBatis 本是apache的一个开源项目iBatis, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为MyBati ...

C++常用字符串分割方法

C++常用字符串分割方法的更多相关文章

随机推荐

热门专题