RFC3986编码 C 语言实现(支持大部分中文)
前些时间做 xauth 认证程序的编写,网上找到RFC3986编码不支持中文的编码,所以便查找了一些资料.自己写了一个,代码如下.
#include <stdlib.h>
#include <string.h>
#include <stdio.h>
#include <android/log.h>
#include "RFC3986Encoder.h" bool isReverseChar(char c);
char* charToHexString(char c);
bool isChinese(char c); //#define snprintf _snprintf
/**
* Escape 'string' according to RFC3986 and
* http://oauth.net/core/1.0/#encoding_parameters.
*
* @param string The data to be encoded
* @return encoded string otherwise NULL
* The caller must free the returned string.
*/ static void *xmalloc_fatal(size_t size) {
if (size==) return NULL;
fprintf(stderr, "Out of memory.");
exit();
} void *xrealloc (void *ptr, size_t size) {
void *p = realloc (ptr, size);
if (p == NULL) return xmalloc_fatal(size);
return p;
} void *xmalloc (size_t size) {
void *ptr = malloc (size);
if (ptr == NULL) return xmalloc_fatal(size);
return ptr;
} char *xstrdup (const char *s) {
void *ptr = xmalloc(strlen(s)+);
strcpy((char *)ptr, s);
return (char*)ptr;
} char *oauth_url_escape(const char *string) {
size_t alloc, newlen;
char *ns = NULL, *testing_ptr = NULL;
unsigned char in;
size_t strindex=;
size_t length; if (!string) return xstrdup(""); alloc = strlen(string)+;
newlen = alloc; ns = (char*) xmalloc(alloc); length = alloc-;
while(length--) {
in = *string; switch(in){
case '': case '': case '': case '': case '':
case '': case '': case '': case '': case '':
case 'a': case 'b': case 'c': case 'd': case 'e':
case 'f': case 'g': case 'h': case 'i': case 'j':
case 'k': case 'l': case 'm': case 'n': case 'o':
case 'p': case 'q': case 'r': case 's': case 't':
case 'u': case 'v': case 'w': case 'x': case 'y': case 'z':
case 'A': case 'B': case 'C': case 'D': case 'E':
case 'F': case 'G': case 'H': case 'I': case 'J':
case 'K': case 'L': case 'M': case 'N': case 'O':
case 'P': case 'Q': case 'R': case 'S': case 'T':
case 'U': case 'V': case 'W': case 'X': case 'Y': case 'Z':
case '_': case '~': case '.': case '-':
ns[strindex++]=in;
break;
default:
newlen += ; /* this'll become a %XX */
if(newlen > alloc) {
alloc *= ;
testing_ptr = (char*) xrealloc(ns, alloc);
ns = testing_ptr;
} //转换成16进制. 58-->3A
//%3A 这是3个.这里好像是自动 加 '/0' 如果生成的的字符串,大于4则不会,自动加/0
//在linux 下,这个方法,的count 包括 '/0'所以最后的结果也是正确的. int result = snprintf(&ns[strindex], , "%%%02X", in); /*
printf("%d\n",result); printf("%d\n",in); printf("strlen(buf) = %d\n",strlen(ns));
printf("%s\n",ns);
*/ strindex+=;
break;
}
string++;
}
ns[strindex]=;
return ns;
} #ifndef ISXDIGIT
# define ISXDIGIT(x) (isxdigit((int) ((unsigned char)x)))
#endif //自己写的代码 3
char* rfc3986Encoder(const char* input)
{
//__android_log_print(ANDROID_LOG_INFO, "Test_jni","encoder start %s\n", input); if (!input) return xstrdup(""); //char* sb = (char*)malloc(1024);
char* sb = new char[];
sb[]= '\0';
int length = strlen(input);
for (int i = ; i<length; i++)
{
char c = input[i];
if(isReverseChar(c)){
const char* temp;
if(isChinese(c))
{
//这里认为汉字 utf-8为三字节,首位为连续三个1,取unicode的后8位
//这里相于 utf-8 到 unicode 的转换,只是转换了后8位.
int high = (input[i+]&0x03)<<;
int low = input[i+]&0x3f;
char chinese = (high+low)&0xff;
temp = charToHexString(chinese);
i+=;
}else{
temp = charToHexString(c);
}
strcat(sb,temp);
}
else{
int len = strlen(sb);
const char* p = &c; //字符看不到结束符,所以会错.
strcat(sb,p);
sb[len+] = '\0';
}
}
//__android_log_print(ANDROID_LOG_INFO, "Test_jni","encoder end %s\n", sb);
return sb;
} bool isReverseChar(char c)
{
return !((c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z') || (c >= '' && c <= '')
|| c == '-' || c == '_' || c == '.' || c == '~');
} char* charToHexString(char src){
int v = src & 0xFF;
char* hv = new char[];
snprintf(hv, ,"%%%02X",v);
return hv ;
}
bool isChinese(char c)
{
int x = c&0xE0;
if(x == )
return true;
else
return false;
}
如程序中体现的,oauth_url_escape() 这个方法不支持对中文的编码 ,所以我便另外写了个方法 rfc3986Encoder().如程序中所说,我这里认为UTF8 汉字为 3 byte ,所以已经包含了大部分的汉字.具体的参考资料当时没做笔记,大该就是关于 UTF8 汉字编码的问题.程序思想,也比较好懂.研读java 的RFC3986编码实现,发现其获取utf8汉字的编码实际为unicode 编码的后8位.所以我这里把 utf8 向 unicode 编码的转化,只取了后8位,再转换成 hex 的形式.代码我做了部分测试,目前还没有发现什么问题.
RFC3986编码 C 语言实现(支持大部分中文)的更多相关文章
- GJM :用JIRA管理你的项目(二)JIRA语言包支持及插件支持 [转载]
感谢您的阅读.喜欢的.有用的就请大哥大嫂们高抬贵手"推荐一下"吧!你的精神支持是博主强大的写作动力以及转载收藏动力.欢迎转载! 版权声明:本文原创发表于 [请点击连接前往] ,未经 ...
- Cassandra在CQL语言层面支持多种数据类型
Cassandra在CQL语言层面支持多种数据类型. CQL类型 对应Java类型 描述 ascii String ascii字符串 bigint long 64位整数 blob ByteBuffer ...
- Ruby 对多语言的支持
这是一篇翻译文章,原文链接 http://blog.grayproductions.net/articles/understanding_m17n.原文是一个系列,翻译过来整合成了一篇文章,对文章内容 ...
- 用JIRA管理你的项目——(二)JIRA语言包支持及插件支持
昨天兴奋地把JIRA环境搭好,瞅了一眼管理界面--全英文,真是汗! 尚且不说全中文版管理界面让人操作起来多少会有困难,更别说是全英文! 昨天赞叹JIRA语言包支持丰富,今天终于找到了号称100%的语言 ...
- 系统区域设置 本地语言的支持依赖于 /etc/locale.conf,/etc/locale.conf 包含不少于此相关的环境变量
https://linux.cn/lfs/LFS-BOOK-7.7-systemd/chapter07/locale.html 7.7. 系统区域设置 本地语言的支持依赖于 /etc/locale.c ...
- Windows server 2012 添加中文语言包(英文转为中文)(离线)
Windows server 2012 添加中文语言包(英文转为中文)(离线) 相关资料: 公司环境:亚马孙aws虚拟机 英文版Windows2012 中文SQL Server2012安装包,需要安装 ...
- 现有语言不支持XXX方法
史上最强大的IDE也会有bug的时候哈,今天遇到这个问题特别郁闷,百度了下,果然也有人遇到过这个问题 解决方法: 1.调用的时候参数和接口声明的参数不一致(检查修改) 2.继承接口中残留一个废弃的方法 ...
- ueditor的工具栏显示乱码解决方法 小问题.. 是你的页面编码与语言包js编码不符所导致的
ueditor的工具栏显示乱码解决方法 小问题.. 是你的页面编码与语言包js编码不符所导致的解决方法:用记事本将ueditor\..\lang\zh-cn\zh-cn.js打开,然后保存为ANSI ...
- Java SE 6 新特性: 对脚本语言的支持
2006 年底,Sun 公司发布了 Java Standard Edition 6(Java SE 6)的最终正式版,代号 Mustang(野马).跟 Tiger(Java SE 5)相比,Musta ...
随机推荐
- Objective-C( protocol协议)
protocol 协议 protocol:用来声明方法 1.协议的定义 @protocol 协议名称 <NSObject> // 方法声明列表.... @end 2.如何遵守协议 1> ...
- C#中combobox不可编辑与不可选择
不可编辑:comboBox.DropDownStyle = System.Windows.Forms.ComboBoxStyle.DropDownList; 将Style属性改为csDropDownL ...
- java写hadoop全局排序
前言: 一直不会用java,都是streaming的方式用C或者python写mapper或者reducer的可执行程序.但是有些情况,如全排序等等用streaming的方式往往不好处理,于是乎用原生 ...
- iOS开发UI篇—UITableview控件简单介绍
iOS开发UI篇—UITableview控件简单介绍 一.基本介绍 在众多移动应⽤用中,能看到各式各样的表格数据 . 在iOS中,要实现表格数据展示,最常用的做法就是使用UITableView,UIT ...
- cocos2d-x 的两大基类
cocos2d-x 有两个重要的基类,一个管理引用计数的 Ref,别一个则定义许多基本属性的 Node. 在 cocos2d-x 中的基本概念 说到 create 函数的时候提到 cocos2d-x ...
- Mutual Training for Wannafly Union #1解题报告
---恢复内容开始--- q神等人组织的vjudge上的多校训练,题目基本上都来自于CF,#1是上周进行的,参加后感觉收获很多,因为上周准备期中比较忙,解题报告现在补上. 比赛地址(兼题目地址) A题 ...
- DeepLearning之路(三)MLP
DeepLearning tutorial(3)MLP多层感知机原理简介+代码详解 @author:wepon @blog:http://blog.csdn.net/u012162613/articl ...
- 关于MySQL中的left join、on、where的一点深入
原文地址:http://www.oschina.net/question/89964_65912?sort=default&p=3#answers 即使你认为自己已对 MySQL 的 LEFT ...
- Python开发入门与实战11-单元测试
11. 单元测试 本章节我们来讲讲django工程中如何实现单元测试,单元测试如何编写以及在可持续项目中单元测试的重要性. 下面是单元测试的定义: 单元测试是开发者编写的一小段代码,用于检验被测代码的 ...
- Unparsed aapt error(s)! Check the console for output解决方法
在Eclipse平台进行Android 应用开发时,编辑,修改或增删 res/下资源文件时有时会遇到如下错误提示:“Unparsed aapt error(s)! Check the console ...