最近在建词典,使用Trie字典树,需要把字符串分解成单个字.由于传入的字符串中可能包含中文或者英文,它们的字节数并不相同.一开始天真地认为中文就是两个字节,于是很happy地直接判断当前位置的字符的ASCII码是否处于0~127之间,如果是就提取一个字符,否则提取两个.在测试分字效果的时候,这种方法出了问题.比如我传一个"abcde一二三四五"进去,abcde可以正常分解成 a b c d e,而后面的"一二三四五"则成了乱码. 于是我开启了谷歌之旅,搜索"…
最近在建词典,使用Trie字典树,需要把字符串分解成单个字.由于传入的字符串中可能包含中文或者英文,它们的字节数并不相同.一开始天真地认为中文就是两个字节,于是很happy地直接判断当前位置的字符的ASCII码是否处于0~127之间,如果是就提取一个字符,否则提取两个.在测试分字效果的时候,这种方法出了问题.比如我传一个“abcde一二三四五”进去,abcde可以正常分解成 a b c d e,而后面的“一二三四五”则成了乱码. 于是我开启了谷歌之旅,搜索“如何在C++中将string中的中文分…
string类中有很多好用的函数,这里介绍在string类字符串中查找字符串的函数. string类字符串中查找字符串一般可以用: 1.s.find(s1)函数,从前往后查找与目标字符串匹配的第一个位置: 2.s.rfind(s1)函数,从后往前查找与目标字符串匹配的最后一个位置: 3.s.find_first_of(s1),查找在s1中任意一个字符在s中第一次出现的位置 4.s.find_last_of(s1)       查找在s1中任意一个字符在s中最后一次出现的位置 下面给出一道例题:…
今天在看<图解设计模式>,里面出了一个问题“String类用final修饰,导致它无法被继承(扩展),这样做违反了开闭原则,这么做有什么正当理由?” 答案是效率和安全性  首先是效率,由于String类它基本上是最频繁使用的几个类之一,如果使用的不好,会出现很明显的性能问题.所以干脆做成final类的.可以在JVM里做很多优化(比如放在栈中重用),类似的还有StringBuilder,虽然都是操作字符串,但是存放机制和使用场景都不同. 另外再说安全性,引用网上一段段“Java并不是操作系统本地…
毫无疑问,String类是java里面最重要的类之一.因此它有很多方法需要了解和掌握. 字符串一旦被赋值,值就不能发生改变: package cn.itcast_02; /* * 字符串的特点:一旦被赋值,就不能改变. */ public class StringDemo { public static void main(String[] args) { String s = "hello";//hello是在字符串常量池中待着的.赋值hello后就没法在改变了. s += &quo…
Java字符串就是Unicode字符序列,例如“Java”就是4个Unicode字符J,a,v,a组成的. Java没有内置的字符串类型,而是在标准Java类库中提供了一个预定义的类String,每个用双引号括起来的字符串都是String类的一个实例. package chap01; public class StringTest { /** * @param args */ public static void main(String[] args) { // TODO Auto-genera…
首先因为printf函数输出字符串是针对char *的,即printf只能输出c语言的内置数据,而string不是c语言的内置数据. 其次string类型的对象不止包含字符串,还包含了许多用于操作的函数,所以&str并非字符串的首地址 因此该怎么打印string字符串呢? 1.利用string的成员函数c_str()打印,如下: string q = "123ABCD"; printf("%s", q.c_str()); 2.强转,将string类型强转成c…
基本使用方法 一.输入 string s: cin >> s; getline(cin, s) ; //使用默认的'\n'作为终止符 getline(cin, s, '!') ; //以'!'作为终止符 二.复制 string s1 = "hello World" ; string s2 = s1 ; //"hello World" 复制, string s3(s1); //"hello World" 拷贝构造函数, ); //&qu…
String类是在java开发过程中,使用最最频繁的一个类,不管是 用户名 密码 还是http报文接收过来的数据,其本质就是字符序列 所以做为一个java开发者,我们要重点掌握好String的方法使用,方便我们在项目开发中,游刃自如. String本质就是一个 char数组,普普通通,也是简简单单的. char[] c=new char[8]; c[0]='您'; c[1]='好'; c[2]=','; c[3]='我'; c[4]='是'; c[5]='刘'; c[6]='诗'; c[7]='…
将其他编码类型转换成UTF-8或者其他类型的工具类 public static String changeUTF(String str) { String newStr = null; try { newStr = new String(str.getBytes("iso8859-1"),"utf-8"); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } return newStr;…