解决NSData转NSString返回nil的问题
// 字符串转Data
NSString *str =@"jesfds";
NSData *data =[str dataUsingEncoding:NSUTF8StringEncoding];
//NSData 转NSString
NSString *result =[[ NSString alloc] initWithData:data encoding:NSUTF8StringEncoding]; //data 转char
NSData *data;
char *test=[data bytes]; // char 转data
byte* tempData = malloc(sizeof(byte)*);
NSData *content=[NSData dataWithBytes:tempData length:];
在使用initWithData等方法将NSData转换成NSString时,如果NSData的内容含有非encoding编码的字符,将会返回nil。
----------SDK文档如下-------------
- (instancetype)initWithData:(NSData *)data
encoding:(NSStringEncoding)encoding;
Return Value
An NSString
object initialized by converting the bytes in data
into Unicode characters using encoding
. The returned object may be different from the original receiver. Returns nil
if the initialization fails for some reason (for example if data
does not represent valid data for encoding
).
-----------------------------
这个结果在很多时候可能并不是我们所希望的,比如在获取网页源码进行分析等方面,如果页面采用了utf-8编码,只是含有个别非utf-8字符,我们更希望转换NSString成功,抛弃(或替换)那些非法字符。
按照utf8格式标准
Unicode/UCS-4
|
bit数
|
UTF-8
|
byte数
|
范围(16进制)
|
0000 ~
007F
|
0~7
|
0XXX XXXX
|
1
|
0x - 7x |
0080 ~
07FF
|
8~11
|
110X XXXX
10XX XXXX
|
2
|
Cx 8x - Dx Bx |
0800 ~
FFFF
|
12~16
|
1110XXXX
10XX XXXX
10XX XXXX
|
3
|
Ex 8x 8x - Ex Bx Bx
|
1 0000 ~
1F FFFF
|
17~21
|
1111 0XXX
10XX XXXX
10XX XXXX
10XX XXXX
|
4
|
F8 8x 8x 8x 8x - FB Bx Bx Bx Bx
|
20 0000 ~
3FF FFFF
|
22~26
|
1111 10XX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
|
5
|
FC 8x 8x 8x 8x 8x - FD Bx Bx Bx Bx Bx |
400 0000 ~
7FFF FFFF
|
27~31
|
1111 110X
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
|
6
|
如果一个字节小于0x80,那么他就是一个字符;
如果大于C0小于E0,表示2个字节组成的utf8字符(第一个是110开头的,第二个是10开头的);
如果大于E0小于F0,表示3个字节组成的utf8字符(第一个是1110开头的,第二个是10开头的,第三个是10开头的);
以此类推,如果不符合utf-8规则,则表示一个非法字符,只要替换这样的字符即可。
实现方法如下(此实现可用但不够严谨,如用于工程中建议进行优化):
- //替换非utf8字符
- //注意:如果是三字节utf-8,第二字节错误,则先替换第一字节内容(认为此字节误码为三字节utf8的头),然后判断剩下的两个字节是否非法;
- - (NSData *)replaceNoUtf8:(NSData *)data
- {
- char aa[] = {'A','A','A','A','A','A'}; //utf8最多6个字符,当前方法未使用
- NSMutableData *md = [NSMutableData dataWithData:data];
- int loc = 0;
- while(loc < [md length])
- {
- char buffer;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0x80) == 0)
- {
- loc++;
- continue;
- }
- else if((buffer & 0xE0) == 0xC0)
- {
- loc++;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0xC0) == 0x80)
- {
- loc++;
- continue;
- }
- loc--;
- //非法字符,将这个字符(一个byte)替换为A
- [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
- loc++;
- continue;
- }
- else if((buffer & 0xF0) == 0xE0)
- {
- loc++;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0xC0) == 0x80)
- {
- loc++;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0xC0) == 0x80)
- {
- loc++;
- continue;
- }
- loc--;
- }
- loc--;
- //非法字符,将这个字符(一个byte)替换为A
- [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
- loc++;
- continue;
- }
- else
- {
- //非法字符,将这个字符(一个byte)替换为A
- [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
- loc++;
- continue;
- }
- }
- return md;
- }
转换后的NSData就可以正确转换为NSString了。
*如果是非utf-8编码,请自行对对应照编码协议转换。
解决NSData转NSString返回nil的问题的更多相关文章
- iOS解决NSData转NSString后字符为空
iOS中,将NSData转NSString的一般方法为[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];但是当dat ...
- 为什么有时候NSData转换成NSString的时候返回nil
为什么有时候NSData转换成NSString的时候返回nil 有时候,NSData明明有值,可是,当转换成NSString的时候,却没有值,现在来进行测试:) -现在提供测试用素材- 源码如下: / ...
- 解决 pathForResource 返回 nil的问题
点击(此处)折叠或打开 NSString* path = [[NSBundle mainBundle] pathForResource:@"sample" ofType:@&quo ...
- NSData和NSString 、 NSFileManager
1 NSData和NSMutableData的基本使用 1.1 问题 NSData类是IOS提供的用于以二进制的形式操作文件数据的类,NSData有两个常用的属性length和bytes,length ...
- NSData、NSString 、 NSFileManager
1 NSData和NSMutableData的基本使用 1.1 问题 NSData类是IOS提供的用于以二进制的形式操作文件数据的类,NSData有两个常用的属性length和bytes,leng ...
- ios 数据类型转换 UIImage转换为NSData NSData转换为NSString
1.UIImage转换为NSData NSData *data;if (UIImagePNGRepresentation(image) == nil) { data = UIImageJPEGRepr ...
- NSData NSDate NSString NSArray NSDictionary 相互转换
// NSData NSDate NSString NSArray NSDictionary json NSString *string = @"hello word"; NSDa ...
- NSData NSDate NSString NSArray NSDictionary 相互转化
// NSData NSDate NSString NSArray NSDictionary json NSString *string = @"hello word"; ...
- 如何解决结果由block返回情况下的同步问题(转)
开发中经常会遇到一种简单的同步问题: 系统在获取资源时,采用了block写法,外部逻辑需要的结果是在block回调中返回的 举个例子: 请求获取通讯录权限的系统弹窗 调用系统方法请求通讯录权限: AB ...
随机推荐
- myeclipse 2014 除了 默认加载的derby
myeclipse 2014 去掉 默认加载的derby作为有轻微强迫症的我来说,server下面有一个我始终用不到的东西我是很不舒服的.最终我网查到解决办法,现在分享给大家.============ ...
- SQLite剖析之动态内存分配
SQLite通过动态内存分配来获取各种对象(例如数据库连接和SQL预处理语句)所需内存.建立数据库文件的内存Cache.保存查询结果. 1.特性 SQLite内核和它的内存分配子系统提供以下特性 ...
- JavaScript之命名空间模式 浅析
来源于:http://www.cnblogs.com/syfwhu/p/4885628.html 前言 命名空间可以被认为是唯一标识符下代码的逻辑分组.为什么会出现命名空间这一概念呢?因为可用的单词数 ...
- XUtils框架之初步探索
Xutils分为四大模块. BitmapUtils DBUtils ViewUtils HttpUtils
- VS使用技巧——统计代码行数
通常为了统计一个文件或者一整个解决管理方案中代码行量,可能会选择定位来获取行量,但是当文件尤其大时,传统方式就不行了,这里推荐使用正则表达式搜索统计,可以快速获取目标文档的总代码量. Tips: ct ...
- CentOS 6.5安装在VMWare中Bridge模式下网卡eth0不能自动激活的问题
VMWare 12.5.2 CentOS 6.5 basic VMWare网卡配置选择Bridge方式 问题: 默认情况下ifconfig命令只能看到网络设备lo,看不到eth0,也没有分配合理的IP ...
- 关于GeoWebCache的部署说明
最近因为工作需要学习了GeoWebCache,有了一些实战经验跟大家分享一下. 废话不多说,直接上问题! 1.切片的缓存问题 当地图服务(这里默认指WMS)的数据更新时,GeoWebCache的切片如 ...
- HttpResponse的使用方法
HttpResponse的使用方法: HttpRequest类是一个封闭HTTP提交信息的类型,而封闭HTTP输出信息的类型就是HttpResponse类,使用HttpResponse类可以实现三种类 ...
- Map工具系列-01-Map代码生成工具说明
所有cs端工具集成了一个工具面板 -打开(IE) Map工具系列-01-Map代码生成工具说明 Map工具系列-02-数据迁移工具使用说明 Map工具系列-03-代码生成BySQl工具使用说明 Map ...
- Spring单例模式与线程安全
问题背景 这段时间在做项目的时候,考虑到Spring中的bean默认是单例模式的,那么当多个线程调用同一个bean的时候就会存在线程安全问题.如果是Spring中bean的创建模式为非单例的,也就不存 ...