将UTF8编码的3字节中英文转成2字节中英文.
1. 首先要考虑将String转成一个bytes的数组, 每个汉字是3个bytes, 英文或者标点是1个byte.
2. 然后去判断一下每一个byte的前面几个bit, 看下面的表, 1个byte的字符, 就是英文跟标点, 它的第1个bit是0;
3. 重点是3个bytes的字符, 就是汉字, 或者说CJK, 它的第1个byte的前面4个bit, 是1110, 那么我们可以根据这个来判断.看起来好像下面的代码, 居然是java跟oc可以共用的 :)
if((bytes[i]>>4)==0x0E){
highPos=(bytes[i]<<4)|((bytes[i+1]&0x3f)>>2);
lowPos=((bytes[i+1]&0x03)<<6)|(bytes[i+2]&0x3f);
//NSLog(@"highPos: %x lowPos: %x",highPos,lowPos);
chnCodeArray[chnCodeIndex]=highPos;
chnCodeArray[chnCodeIndex+1]=lowPos;
chnCodeIndex=chnCodeIndex+2;
i=i+3;
}else if(bytes[i]>>7==0){
chnCodeArray[chnCodeIndex]=0;
chnCodeArray[chnCodeIndex+1]=bytes[i];
chnCodeIndex=chnCodeIndex+2;
i++;
}
chnCodeArray就是用来存放结果的byte的数组.
4. 根据协议包, 先发送字符串开始, 数据, 结束的数据包.
[self sendPackage:UTF8_CODE_TRANS_START_CMD withCmdNumber:number withLength:length];
[self sendUTF8Data:utf8Bytes];
[self sendPackage:UTF8_CODE_TRANS_END_CMD withCmdNumber:number withLength:length];
可以看得出, 分别发送cmdPackage跟dataPackage, 可以写得更好的, 希望在安卓的版本中有更好的设计方法.
5. 简单看一下, sendPackage这个方法:
for(int i=0;i<3;i++){
UInt64 startTime=[[NSDate date] timeIntervalSince1970]*1000;
if(packageType==UTF8_CODE_TRANS_START_CMD){
_packageID=[self sendUTF8TransStartCMDPackage:cmdNumber withLength:length];
}else if(packageType==UTF8_CODE_TRANS_END_CMD){
_packageID=[self sendUTF8TransEndCMDPackage:cmdNumber withLength:length];
}
if([self waitForACK:startTime]){
return;
}
}
重试3次, 如果有ACK就算发送成功.
-(bool)waitForACK:(UInt64) startTime{
[self readFFF1Value];
while(_ack==0){
UInt64 endTime=[[NSDate date] timeIntervalSince1970]*1000;
if((endTime-startTime)>1000){
NSLog(@"Over time");
return 0;
}
if(_ack==1){
//NSLog(@"ack==1");
return 1;
}
}
return 0;
}
sendUTF8TransStartCMDPackage方法的精髓是, 妈的, 自己看吧:
_packageSendingType.packageType=UTF8_CODE_TRANS_START_CMD;
_packageSendingType.warningCode=cmdNumber;
_packageSendingType.packageLength=length;
int packageID=arc4random()%255;
NSData *data=[_blePackageFactory createPackage:_packageSendingType withPackageID:packageID];
[self writeCharFFF1:data];
_ack=0;
return packageID;
这里会返回一个随机产生的packageID, 因为app校验ack的时候, 要用到这个packageID.
-(void) checkACK:(NSData*)charValue{
Byte byteBuffer[20];
//NSLog(@"checkACK thread is: %@",[NSThread currentThread]);
//NSLog(@"%d",(int)[notifObj length]);
[charValue getBytes:byteBuffer length:20];
if((byteBuffer[3]==_packageID)&&(byteBuffer[4]==TYPE_DATA_ACK)&&(byteBuffer[5]==ACK_YES)){
_ack=1;
NSLog(@"ACK check ok");
_transferErrorCount=0;
[[NSNotificationCenter defaultCenter] postNotificationName:@"BLECharValue" object:@"ACK!"];
}else{
_transferErrorCount++;
if(_transferErrorCount>5){
_transferErrorCount=0;
[[NSNotificationCenter defaultCenter] postNotificationName:@"BLECharValue" object:@"传输错误"];
}else{
//[self sendStartPackage];
[self resendPackage];
}
}
}
这个方法是在读取char值的回调中运行的, 所以用上了一个外部的全局变量, 叫_ack
6. 总结一下, 配合之前规定的通讯协议, 这个蓝牙通讯, 无非两种包, 一种是命令包, 即通讯开始, 通讯结束, 一种是数据的传输.
关键是中间有很多信息, 例如, 包ID, 校验码, 字符串编号, 开始位, 停止位, 诸如此类...
将UTF8编码的3字节中英文转成2字节中英文.的更多相关文章
- 【异常记录(六)】vs文件乱码:文件加载,使用Unicode(UTF-8)编码加载文件xxx时,有些字节已用Unicode替换字符替换。保存该文件将不会保留原始文件内容。
VS2013偶遇这种情况,页面汉字编码出现乱码. .... 按照网上查到的: 工具>选项>文本编辑器> 勾选了 然并卵,还是乱码... 其实炒鸡简单 用记事本打开另存为,选择 ...
- 如何将一个用utf-8编码的文本用java程序转换成ANSI编码的文本
jdk有一个关于UTF-8的bug所以加了一句 br.skip(1); bugID: http://bugs.java.com/view_bug.do?bug_id=4508058 public st ...
- Java不同编码方式,中英文字符所占字节数
测试代码 public class Test { public static void main(String[] args){ String[] charsetNames={ "UTF-8 ...
- 【Java】如何检测、替换4个字节的utf-8编码(此范围编码包含emoji表情)
> 参考的优秀文章 1.十分钟搞清字符集和字符编码 2.Java中byte与16进制字符串的互相转换 3.[异常处理]Incorrect string value: '\xF0\x90\x8D\ ...
- 在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编
在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编 ...
- python中文utf8编码后是占3个字符,unicode汉字为2字节
一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf-8') ...
- 刨根究底字符编码之十一——UTF-8编码方式与字节序标记
UTF-8编码方式与字节序标记 一.UTF-8编码方式 1. 接下来将分别介绍Unicode字符集的三种编码方式:UTF-8.UTF-16.UTF-32.这里先介绍应用最为广泛的UTF-8. 为满足基 ...
- 1个汉字在UTF-8编码占3个字节
http://blog.csdn.net/ns_code/article/details/14162087 http://www.ruanyifeng.com/blog/2007/10/ascii_u ...
- ASCII、Unicode和UTF-8编码的区别;中英文混合截取
ASCII编码是128个字符 中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准..... Unicode是为了解决各国乱码的,但浪费存储空间 UTF-8编码把一个Unicode字符 ...
随机推荐
- sdut2169:Sequence(dp)
题目:http://acm.sdut.edu.cn/sdutoj/problem.php?action=showproblem&problemid=2169 #include <iost ...
- 30天,APP创业从0到1【7.26苏州站】
活动概况 时间:2015年7月26日13:30-16:30 地点:创客巢(苏州吴中区玉山路646号金枫广告产业园B栋4楼) 主办:APICloud.融云.鱼多多 网址:www.apicloud.com ...
- cocos2dx 3.x(获取当前系统时间)
// // MainScene.cpp // helloworld // // Created by apple on 16/10/21. // // #include "MainScene ...
- How do you evaluate music?
I’ve seen several “can’t stand” or “best of” threads in regard to music, and based on some related d ...
- UILabel详解
// ----------------------UILabel--------------------------- UILabel *label = [[UILabel alloc] initWi ...
- 伪类写border, transform: scale3d() 及兼容性
.top::before { content: ""; position: absolute; left: 0; width: 200%; height: 0; border-to ...
- 设置 BitmapData 没填充部分为透明色
默认 BitmapData 是以白色填充的 在初始化时,设定上每3,4个参数即可透明: new BitmapData(w,h,true,0) 第4个参数要为0
- <s:iterator> 对list操作的一种方法
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAA6IAAAH3CAIAAAAuRnW9AAAgAElEQVR4nOzdf4gk1333+wLDDffhPp
- csuoj 1396: Erase Securely
http://acm.csu.edu.cn/OnlineJudge/problem.php?id=1396 1396: Erase Securely Time Limit: 1 Sec Memory ...
- [转]MongoDB for Java】Java操作MongoDB
原文地址: MongoDB for Java]Java操作MongoDB 开发环境: System:Windows IDE:eclipse.MyEclipse 8 Database:mongoDB 开 ...