字符集转换字符类型转换 utf-8 gb2312 url

vs默认是GB2312编码，你看到的程序源代码是，输出结果是，内部存储是，

1 如果你想改变内部存储可以用下面的这些函数

2 如果你想改变源代码的存储方式你可以用文本编辑工具修改之后重新编译

3 如果你想修改输出编码，你还没发让她输出UTF-8的目前

4 但是这并不影响你的程序跨平台的处理，因为你总是将任何字符类型的编码字符串保存在单字节的string中，如果你知道需要处理固定双字节的字符，你可以使用wstring

strCoding.h

//这是个类strCoding (strCoding.h文件)

#pragma once

#include <iostream>

#include <string>

#include <windows.h>

using namespace std;

class strCoding

{

public:

	strCoding(void);

	~strCoding(void);

	void UTF_8ToGB2312(string &pOut, char *pText, int pLen);//utf_8转为gb2312

	void GB2312ToUTF_8(string& pOut,char *pText, int pLen); //gb2312 转utf_8

	string UrlGB2312(char * str);                           //urlgb2312编码

	string UrlUTF8(char * str);                             //urlutf8 编码

	string UrlUTF8Decode(string str);                  //urlutf8解码

	string UrlGB2312Decode(string str);                //urlgb2312解码

private:

	void Gb2312ToUnicode(WCHAR* pOut,char *gbBuffer);

	void UTF_8ToUnicode(WCHAR* pOut,char *pText);

	void UnicodeToUTF_8(char* pOut,WCHAR* pText);

	void UnicodeToGB2312(char* pOut,WCHAR uData);

	char  CharToInt(char ch);

	char StrToBin(char *str);

};

strCoding.cpp

//这是个类strCoding (strCoding.cpp文件)

//#include "StdAfx.h"

#include ".\strcoding.h"

strCoding::strCoding(void)

{

}

strCoding::~strCoding(void)

{

}

void strCoding::Gb2312ToUnicode(WCHAR* pOut,char *gbBuffer)

{

	::MultiByteToWideChar(CP_ACP,MB_PRECOMPOSED,gbBuffer,2,pOut,1);

	return;

}

void strCoding::UTF_8ToUnicode(WCHAR* pOut,char *pText)

{

	char* uchar = (char *)pOut;

	uchar[1] = ((pText[0] & 0x0F) << 4) + ((pText[1] >> 2) & 0x0F);

	uchar[0] = ((pText[1] & 0x03) << 6) + (pText[2] & 0x3F);

	return;

}

void strCoding::UnicodeToUTF_8(char* pOut,WCHAR* pText)

{

	// 注意 WCHAR高低字的顺序,低字节在前，高字节在后

	char* pchar = (char *)pText;

	pOut[0] = (0xE0 | ((pchar[1] & 0xF0) >> 4));

	pOut[1] = (0x80 | ((pchar[1] & 0x0F) << 2)) + ((pchar[0] & 0xC0) >> 6);

	pOut[2] = (0x80 | (pchar[0] & 0x3F));

	return;

}

void strCoding::UnicodeToGB2312(char* pOut,WCHAR uData)

{

	WideCharToMultiByte(CP_ACP,NULL,&uData,1,pOut,sizeof(WCHAR),NULL,NULL);

	return;

}

//做为解Url使用

char strCoding:: CharToInt(char ch){

	if(ch>='0' && ch<='9')return (char)(ch-'0');

	if(ch>='a' && ch<='f')return (char)(ch-'a'+10);

	if(ch>='A' && ch<='F')return (char)(ch-'A'+10);

	return -1;

}

char strCoding::StrToBin(char *str){

	char tempWord[2];

	char chn;

	tempWord[0] = CharToInt(str[0]);                         //make the B to 11 -- 00001011

	tempWord[1] = CharToInt(str[1]);                         //make the 0 to 0  -- 00000000

	chn = (tempWord[0] << 4) | tempWord[1];                //to change the BO to 10110000

	return chn;

}

//UTF_8 转gb2312

void strCoding::UTF_8ToGB2312(string &pOut, char *pText, int pLen)

{

	char buf[4];

	char* rst = new char[pLen + (pLen >> 2) + 2];

	memset(buf,0,4);

	memset(rst,0,pLen + (pLen >> 2) + 2);

	int i =0;

	int j = 0;

	while(i < pLen)

	{

		if(*(pText + i) >= 0)

		{

			rst[j++] = pText[i++];

		}

		else

		{

			WCHAR Wtemp;

			UTF_8ToUnicode(&Wtemp,pText + i);

			UnicodeToGB2312(buf,Wtemp);

			unsigned short int tmp = 0;

			tmp = rst[j] = buf[0];

			tmp = rst[j+1] = buf[1];

			tmp = rst[j+2] = buf[2];

			//newBuf[j] = Ctemp[0];

			//newBuf[j + 1] = Ctemp[1];

			i += 3;

			j += 2;

		}

	}

	rst[j]='\0';

	pOut = rst;

	delete []rst;

}

//GB2312 转为 UTF-8

void strCoding::GB2312ToUTF_8(string& pOut,char *pText, int pLen)

{

	char buf[4];

	memset(buf,0,4);

	pOut.clear();

	int i = 0;

	while(i < pLen)

	{

		//如果是英文直接复制就可以

		if( pText[i] >= 0)

		{

			char asciistr[2]={0};

			asciistr[0] = (pText[i++]);

			pOut.append(asciistr);

		}

		else

		{

			WCHAR pbuffer;

			Gb2312ToUnicode(&pbuffer,pText+i);

			UnicodeToUTF_8(buf,&pbuffer);

			pOut.append(buf);

			i += 2;

		}

	}

	return;

}

//把str编码为网页中的 GB2312 url encode ,英文不变，汉字双字节  如%3D%AE%88

string strCoding::UrlGB2312(char * str)

{

	string dd;

	size_t len = strlen(str);

	for (size_t i=0;i<len;i++)

	{

		if(isalnum((BYTE)str[i]))

		{

			char tempbuff[2];

			sprintf(tempbuff,"%c",str[i]);

			dd.append(tempbuff);

		}

		else if (isspace((BYTE)str[i]))

		{

			dd.append("+");

		}

		else

		{

			char tempbuff[4];

			sprintf(tempbuff,"%%%X%X",((BYTE*)str)[i] >>4,((BYTE*)str)[i] %16);

			dd.append(tempbuff);

		}

	}

	return dd;

}

//把str编码为网页中的 UTF-8 url encode ,英文不变，汉字三字节  如%3D%AE%88

string strCoding::UrlUTF8(char * str)

{

	string tt;

	string dd;

	GB2312ToUTF_8(tt,str,(int)strlen(str));

	size_t len=tt.length();

	for (size_t i=0;i<len;i++)

	{

		if(isalnum((BYTE)tt.at(i)))

		{

			char tempbuff[2]={0};

			sprintf(tempbuff,"%c",(BYTE)tt.at(i));

			dd.append(tempbuff);

		}

		else if (isspace((BYTE)tt.at(i)))

		{

			dd.append("+");

		}

		else

		{

			char tempbuff[4];

			sprintf(tempbuff,"%%%X%X",((BYTE)tt.at(i)) >>4,((BYTE)tt.at(i)) %16);

			dd.append(tempbuff);

		}

	}

	return dd;

}

//把url GB2312解码

string strCoding::UrlGB2312Decode(string str)

{

	string output="";

	char tmp[2];

	int i=0,idx=0,ndx,len=str.length();

	while(i<len){

		if(str[i]=='%'){

			tmp[0]=str[i+1];

			tmp[1]=str[i+2];

			output += StrToBin(tmp);

			i=i+3;

		}

		else if(str[i]=='+'){

			output+=' ';

			i++;

		}

		else{

			output+=str[i];

			i++;

		}

	}

	return output;

}

//把url utf8解码

string strCoding::UrlUTF8Decode(string str)

{

	string output="";

	string temp =UrlGB2312Decode(str);//

	UTF_8ToGB2312(output,(char *)temp.data(),strlen(temp.data()));

	return output;

}

main.cpp

//test

//#include "stdafx.h"

#include "strCoding.h"

using namespace std;

int main()

{ 

	strCoding cfm;

	string keyword="大家好,欢迎你";

	string Temp="";

	string Output="";

	//把关键字做url的utf8编码

	Temp= cfm.UrlUTF8((char *)keyword.data());

	cout<<Temp<<endl;

	//把url的utf8编码的结果解码

	Temp =cfm.UrlUTF8Decode(Temp);

	cout<<Temp<<endl;

	//把关键字做url的gb2312编码

	Temp =cfm.UrlGB2312((char *)keyword.data());

	cout<<Temp<<endl;

	//把url的gb2312编码的结果解码

	Temp =cfm.UrlGB2312Decode(Temp);

	cout<<Temp<<endl;

	//把关键字GB2312转UTF_8

	cfm.GB2312ToUTF_8(Output,(char *)keyword.data(),strlen(keyword.data()));

	cout<<Output<<endl;

	//把GB2312转UTF_8转为中文

	cfm.UTF_8ToGB2312(Temp,(char *)Output.data(),strlen(Output.data()));

	cout<<Temp<<endl;

	//system("pasue");

	getchar();

	return 0;

	//

}

字符集转换字符类型转换 utf-8 gb2312 url的更多相关文章

C语言-字符编码转换：UTF与GB2312
依赖库libiconv,libiconv库的交叉编译不做描述,网上很多 #include <stdio.h> #include <stdlib.h> #include < ...
打印GBK、GB2312字符集全字符
根据编码表填充数据就可以了~~~~(>_<)~~~~~\(≧▽≦)/~啦啦啦 #include <stdio.h> #include <stdlib.h> #inc ...
Java应用开发中的字符集与字符编码
事出有因在向HttpURLConnection的输出流写入内容时,因没有设置charset,导致接收方对数据的验签不一致. URL url = new URL(requestUrl); //打开连接 ...
[转]字符集、字符编码、XML中的中文编码
字符集.字符编码.XML中的中文编码作为程序员的你是不是对于ASCII .UNICODE.GB2321.UTF-7.UTF-8等等不时出现在你面前的这些有着奇怪意义的词感到很讨厌呢,是不是总觉得好象 ...
字符集、字符编码、XML中的中文编码
字符集.字符编码.XML中的中文编码作为程序员的你是不是对于ASCII .UNICODE.GB2321.UTF-7.UTF-8等等不时出现在你面前的这些有着奇怪意义的词感到很讨厌呢,是不是总觉得好象 ...
关于Unicode，字符集，字符编码，每个程序员都应该知道的事
关于Unicode,字符集,字符编码,每个程序员都应该知道的事作者:Jack47 李笑来的文章如何判断一个人是否聪明?中提到: 必要.清晰.且准确的概念,是一切思考的基石.所谓思考,很大程度上,就是 ...
mysql已有数据字符集转换
下面模拟把latin1字符集的数据转换为utf8字符集一.创建测试表和测试数据: 1.修改会话级别的连接字符集 mysql > set names latin1; 查看一下: 2.创建测试表: ...
刨根究底字符编码之十——Unicode字符集的字符编码方式CEF
Unicode字符集的字符编码方式CEF 一.字符编码方式CEF的选择 1. 由于Unicode字符集非常大,有些字符的编号(码点值)需要两个或两个以上字节来表示,而要对这样的编号进行编码,也必须使用 ...

随机推荐

ajax跨域传值
<script type="text/javascript"> function xmlpage(){ $.ajax({ url:'http://localhost/3 ...
浅析CSS中的haslayout
作为一名web开发人员,最大的希望不是自己的水平有多高,而是希望浏览器厂家能够统一标准,相信任何一个只要是接触过web程序开发的人员都有那样的感受,就是浏览器之间的兼容性问题总是让我们的工作平添诸多的 ...
SGU 160.Magic Multiplying Machine
时间限制:0.5s 空间限制6M 题意: 给出n个(1<=n<=10000)1~m(2<m<1000)范围内的数,选择其中任意个数,使它们的乘积模m 最大,输 ...
Fedora 18 安装前指南
Secure Boot 与 Win 8 随着 Win8 的发布,先前关于 Secure Boot 和 UEFI 的诸多猜测也得到了证实,Fedora 18 也将如同当初计划的那样使用 shim + ...
python str + int
TypeError: cannot concatenate 'str' and 'int' objects 1. print 'Is your secret number " + str(p ...
java中处理http连接超时的方法
声明一个boolean公共变量,表明当前httpconnection是否得到服务器回应. 你的连接线程中在连接之前置这个变量为false; 另起一个监视线程,拿到那个HttpConnection的连接 ...
MS Writer Code Test
#include<iostream> using namepspace std; int main() { cout<<"Hello World"<& ...
A Good Beginning Helps To Make A Good End
Hello Guys, It seems nothing would be not good after posting this blog link in my MS application. Se ...
最好用的手机编程软件-C4droid
Q:c4droid是什么? A:c4droid(以下简称c4)是安卓平台上最强大的c/c++ 编译器,你可以在手机上用手机编写自己的C/C++程序,并且可以把程序导出成apk文件. 下载地址:http ...
notepad++使用心得
最近和网友谈论软件编译器的时候,很多人都推荐使用notepad++这款软件,于是怀着一份好奇心安装了这款软件耍了耍,感觉确实不错.特将网友的分享以及自己的心得总结如下: 1)首先notepad++支持 ...

字符集转换 字符类型转换 utf-8 gb2312 url

字符集转换 字符类型转换 utf-8 gb2312 url的更多相关文章

随机推荐

热门专题

字符集转换字符类型转换 utf-8 gb2312 url

字符集转换字符类型转换 utf-8 gb2312 url的更多相关文章