将UTF8编码的3字节中英文转成2字节中英文.
1. 首先要考虑将String转成一个bytes的数组, 每个汉字是3个bytes, 英文或者标点是1个byte.
2. 然后去判断一下每一个byte的前面几个bit, 看下面的表, 1个byte的字符, 就是英文跟标点, 它的第1个bit是0;
3. 重点是3个bytes的字符, 就是汉字, 或者说CJK, 它的第1个byte的前面4个bit, 是1110, 那么我们可以根据这个来判断.看起来好像下面的代码, 居然是java跟oc可以共用的 :)
if((bytes[i]>>4)==0x0E){
highPos=(bytes[i]<<4)|((bytes[i+1]&0x3f)>>2);
lowPos=((bytes[i+1]&0x03)<<6)|(bytes[i+2]&0x3f);
//NSLog(@"highPos: %x lowPos: %x",highPos,lowPos);
chnCodeArray[chnCodeIndex]=highPos;
chnCodeArray[chnCodeIndex+1]=lowPos;
chnCodeIndex=chnCodeIndex+2;
i=i+3;
}else if(bytes[i]>>7==0){
chnCodeArray[chnCodeIndex]=0;
chnCodeArray[chnCodeIndex+1]=bytes[i];
chnCodeIndex=chnCodeIndex+2;
i++;
}
chnCodeArray就是用来存放结果的byte的数组.
4. 根据协议包, 先发送字符串开始, 数据, 结束的数据包.
[self sendPackage:UTF8_CODE_TRANS_START_CMD withCmdNumber:number withLength:length];
[self sendUTF8Data:utf8Bytes];
[self sendPackage:UTF8_CODE_TRANS_END_CMD withCmdNumber:number withLength:length];
可以看得出, 分别发送cmdPackage跟dataPackage, 可以写得更好的, 希望在安卓的版本中有更好的设计方法.
5. 简单看一下, sendPackage这个方法:
for(int i=0;i<3;i++){
UInt64 startTime=[[NSDate date] timeIntervalSince1970]*1000;
if(packageType==UTF8_CODE_TRANS_START_CMD){
_packageID=[self sendUTF8TransStartCMDPackage:cmdNumber withLength:length];
}else if(packageType==UTF8_CODE_TRANS_END_CMD){
_packageID=[self sendUTF8TransEndCMDPackage:cmdNumber withLength:length];
}
if([self waitForACK:startTime]){
return;
}
}
重试3次, 如果有ACK就算发送成功.
-(bool)waitForACK:(UInt64) startTime{
[self readFFF1Value];
while(_ack==0){
UInt64 endTime=[[NSDate date] timeIntervalSince1970]*1000;
if((endTime-startTime)>1000){
NSLog(@"Over time");
return 0;
}
if(_ack==1){
//NSLog(@"ack==1");
return 1;
}
}
return 0;
}
sendUTF8TransStartCMDPackage方法的精髓是, 妈的, 自己看吧:
_packageSendingType.packageType=UTF8_CODE_TRANS_START_CMD;
_packageSendingType.warningCode=cmdNumber;
_packageSendingType.packageLength=length;
int packageID=arc4random()%255;
NSData *data=[_blePackageFactory createPackage:_packageSendingType withPackageID:packageID];
[self writeCharFFF1:data];
_ack=0;
return packageID;
这里会返回一个随机产生的packageID, 因为app校验ack的时候, 要用到这个packageID.
-(void) checkACK:(NSData*)charValue{
Byte byteBuffer[20];
//NSLog(@"checkACK thread is: %@",[NSThread currentThread]);
//NSLog(@"%d",(int)[notifObj length]);
[charValue getBytes:byteBuffer length:20];
if((byteBuffer[3]==_packageID)&&(byteBuffer[4]==TYPE_DATA_ACK)&&(byteBuffer[5]==ACK_YES)){
_ack=1;
NSLog(@"ACK check ok");
_transferErrorCount=0;
[[NSNotificationCenter defaultCenter] postNotificationName:@"BLECharValue" object:@"ACK!"];
}else{
_transferErrorCount++;
if(_transferErrorCount>5){
_transferErrorCount=0;
[[NSNotificationCenter defaultCenter] postNotificationName:@"BLECharValue" object:@"传输错误"];
}else{
//[self sendStartPackage];
[self resendPackage];
}
}
}
这个方法是在读取char值的回调中运行的, 所以用上了一个外部的全局变量, 叫_ack
6. 总结一下, 配合之前规定的通讯协议, 这个蓝牙通讯, 无非两种包, 一种是命令包, 即通讯开始, 通讯结束, 一种是数据的传输.
关键是中间有很多信息, 例如, 包ID, 校验码, 字符串编号, 开始位, 停止位, 诸如此类...
将UTF8编码的3字节中英文转成2字节中英文.的更多相关文章
- 【异常记录(六)】vs文件乱码:文件加载,使用Unicode(UTF-8)编码加载文件xxx时,有些字节已用Unicode替换字符替换。保存该文件将不会保留原始文件内容。
VS2013偶遇这种情况,页面汉字编码出现乱码. .... 按照网上查到的: 工具>选项>文本编辑器> 勾选了 然并卵,还是乱码... 其实炒鸡简单 用记事本打开另存为,选择 ...
- 如何将一个用utf-8编码的文本用java程序转换成ANSI编码的文本
jdk有一个关于UTF-8的bug所以加了一句 br.skip(1); bugID: http://bugs.java.com/view_bug.do?bug_id=4508058 public st ...
- Java不同编码方式,中英文字符所占字节数
测试代码 public class Test { public static void main(String[] args){ String[] charsetNames={ "UTF-8 ...
- 【Java】如何检测、替换4个字节的utf-8编码(此范围编码包含emoji表情)
> 参考的优秀文章 1.十分钟搞清字符集和字符编码 2.Java中byte与16进制字符串的互相转换 3.[异常处理]Incorrect string value: '\xF0\x90\x8D\ ...
- 在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编
在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编 ...
- python中文utf8编码后是占3个字符,unicode汉字为2字节
一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf-8') ...
- 刨根究底字符编码之十一——UTF-8编码方式与字节序标记
UTF-8编码方式与字节序标记 一.UTF-8编码方式 1. 接下来将分别介绍Unicode字符集的三种编码方式:UTF-8.UTF-16.UTF-32.这里先介绍应用最为广泛的UTF-8. 为满足基 ...
- 1个汉字在UTF-8编码占3个字节
http://blog.csdn.net/ns_code/article/details/14162087 http://www.ruanyifeng.com/blog/2007/10/ascii_u ...
- ASCII、Unicode和UTF-8编码的区别;中英文混合截取
ASCII编码是128个字符 中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准..... Unicode是为了解决各国乱码的,但浪费存储空间 UTF-8编码把一个Unicode字符 ...
随机推荐
- Buffer too small
在项目中用到了CString,后来发现在Format的时候会报Buffer too small的错误,在网上查资料发现时这样的 CString output ; int size = m_NicInf ...
- Android 使用PullToRefresh实现下拉刷新和上拉加载(ExpandableListView)
PullToRefresh是一套实现非常好的下拉刷新库,它支持: 1.ListView 2.ExpandableListView 3.GridView 4.WebView 等多种常用的需要刷新的Vie ...
- Android Service Intent must be explicit的解决方法
今天在学习Android的Service组件的时候,在AndroidMainfest.xml中定义了 <service android:name=".BindService" ...
- Java多线程 wait, notify 和 notifyAll
Java的Object类 public class Object { public final native void notify(); public final native void notif ...
- [Shapefile C Library]读取shp图形(.net Wapper)
ShapeLib的.net Wapper版可以在官网下载到,在WorldWind中也有使用.ORG据说也是使用的ShapeLib实现的shp文件的读写. 官网:http://shapelib.mapt ...
- 关于StdAfx.h和StdAfx.cpp
http://www.cplusplus.com/articles/2z86b7Xj/ https://msdn.microsoft.com/en-us/library/h552b3ca.aspx h ...
- 修改了系统自带头文件后,Xcode会报错
1.Xcode自带头文件的路径 /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Develo ...
- autolayout也会锁死
This application is modifying the autolayout engine from a background thread, which can lead to engi ...
- chart crash
* thread #155: tid = 0x1fcc10, 0x0000000107626745 gpxj`static gpxj.ChartUtils.decimals (gpxj.ChartUt ...
- NLS_LANG参数说明
NLS_LANG参数说明 格式: NLS_LANG = language_territory.charset 它有三个组成部分(语言.地域和字符集),每个成分控制了NLS子集的特性.其中: Lang ...