iOS全角符与半角符之间的转换

相关资料:

问题

  • 1、17-03-15,「有人在群里边问怎么把『半角』符字符串转换成『全角』字符串?」,百度的结果如下:

    • 全角转半角方法如下(略有出入,原文使用的是『MRC』,现在使用的『ARC』):

        NSString * string = @"abcdefg,";
      
        NSMutableString *convertedString = [string mutableCopy];
      
        CFStringTransform((CFMutableStringRef)convertedString, NULL, kCFStringTransformFullwidthHalfwidth, false);
      
        NSLog(@"ddc:%@",convertedString);
      • 输出结果:ddc:abcdefg,

      • 结果转换成功。

    • 半角转全角只需要把 kCFStringTransformFullwidthHalfwidth 换成kCFStringTransformHiraganaKatakana 即可。

        NSString * string = @"abcdefg,";
      
        NSMutableString *convertedString = [string mutableCopy];
      
        CFStringTransform((CFMutableStringRef)convertedString, NULL, kCFStringTransformHiraganaKatakana, false);
      
        NSLog(@"ddc:%@",convertedString);
      • 输出结果:ddc:abcdefg,

      • 结果转换失败。

解决

  • 1、首先来看一下函数『CFString​Transform』的说明:

    正如它的 CF 前缀所表述的一样,CFStringTransform 是 Core Foundation 中的一部分。这个函数传入以下参数,并返回一个 Boolean 来表示转换是否成功:

    • string: 需要转换的字符串。由于这个参数是 CFMutableStringRef 类型,一个 NSMutableString 类型也可以通过自由桥接的方式传入。
    • range: 转换操作作用的范围。这个参数是 CFRange,而不是 NSRange。
    • transform: 需要应用的变换。这个参数使用了包含下面将提到的字符串常量的 ICU transform string。
    • reverse: 如有需要,是否返回反转过的变换。
  • 2、我们来看一下『Transform identifiers for CFStringTransform』:

      k​CFString​Transform​Strip​Combining​Marks
    The identifier of a transform to strip combining marks (accents or diacritics). k​CFString​Transform​To​Latin
    The identifier of a transform to transliterate all text possible to Latin script. Ideographs are transliterated as Mandarin Chinese. k​CFString​Transform​Fullwidth​Halfwidth
    The identifier of a reversible transform to convert full-width characters to their half-width equivalents. k​CFString​Transform​Latin​Katakana
    The identifier of a reversible transform to transliterate text to Katakana from Latin. k​CFString​Transform​Latin​Hiragana
    The identifier of a reversible transform to transliterate text to Hiragana from Latin. k​CFString​Transform​Hiragana​Katakana
    The identifier of a reversible transform to transliterate text to Katakana from Hiragana. k​CFString​Transform​Mandarin​Latin
    The identifier of a transform to transliterate text to Latin from ideographs interpreted as Mandarin Chinese. This transform is not reversible. k​CFString​Transform​Latin​Hangul
    The identifier of a reversible transform to transliterate text to Hangul from Latin. k​CFString​Transform​Latin​Arabic
    The identifier of a reversible transform to transliterate text to Arabic from Latin. k​CFString​Transform​Latin​Hebrew
    The identifier of a reversible transform to transliterate text to Hebrew from Latin. k​CFString​Transform​Latin​Thai
    The identifier of a reversible transform to transliterate text to Thai from Latin. k​CFString​Transform​Latin​Cyrillic
    The identifier of a reversible transform to transliterate text to Cyrillic from Latin. k​CFString​Transform​Latin​Greek
    The identifier of a reversible transform to transliterate text to Greek from Latin. k​CFString​Transform​To​XMLHex
    The identifier of a reversible transform to transliterate characters other than printable ASCII to XML/HTML numeric entities. k​CFString​Transform​To​Unicode​Name
    The identifier of a reversible transform to transliterate characters other than printable ASCII (minus braces) to their Unicode character name in braces. k​CFString​Transform​Strip​Diacritics
    The identifier of a transform to remove diacritic markings.

具体的自己翻译哈啊(附表一部分翻译结果 来源):

|Transformation	|Input|	Output|

|----------------|-----|--------|

|kCFStringTransformLatinArabic| mrḥbạ| مرحبا |

|kCFStringTransformLatinCyrillic| privet| привет|

|kCFStringTransformLatinGreek| geiá sou| γειά σου|

|kCFStringTransformLatinHangul| annyeonghaseyo|안녕하세요|

|kCFStringTransformLatinHebrew| şlwm| שלום|

|kCFStringTransformLatinHiragana| hiragana| ひらがな|

|kCFStringTransformLatinKatakana |katakana| カタカナ|

|kCFStringTransformLatinThai| s̄wạs̄dī| สวัสดี|

|kCFStringTransformHiraganaKatakana| にほんご| ニホンゴ|

|kCFStringTransformMandarinLatin| 中文| zhōng wén|

  • 3、于是乎 kCFStringTransformHiraganaKatakana 实际上是『片假名』与『平假名』之间的转换,『CFString​Transform』函数中的 reverse 参数意思是转换过程是否可逆;

      NSString * string = @"abcdefg,";
    
      NSMutableString *convertedString = [string mutableCopy];
    
      CFStringTransform((CFMutableStringRef)convertedString, NULL, kCFStringTransformFullwidthHalfwidth, true);
    
      NSLog(@"ddc:%@",convertedString);
    • 输出结果:ddc:abcdefg,

    • 结果转换成功。

彩蛋

  • 请尝试下列代码:

      NSString * string = @"我是中文";
    
      NSMutableString *convertedString = [string mutableCopy];
    
      CFStringTransform((CFMutableStringRef)convertedString, NULL, kCFStringTransformMandarinLatin, false);
    
      NSLog(@"转换结果:%@",convertedString);
    
      CFStringTransform((CFMutableStringRef)convertedString, NULL, kCFStringTransformStripDiacritics, false);
    
      NSLog(@"转换结果:%@",convertedString);

备注

  • 请注意不是所有的『Transform identifiers』都支持逆转

iOS全角符与半角符之间的转换的更多相关文章

  1. Java 全角字符转半角字符

    1.java代码里有时候会遇到代码注入的安全问题,为了防止这种问题,增加了一个过滤功能.主要是过滤全角字符,把url不能识别的全角字符转换成半角字符 public class Test { publi ...

  2. php全角字符转换为半角函数

    <?php /** * 全角字符转换为半角 * * @param string $str * @return string public function Sbc2Dbc($str) { $ar ...

  3. php全角字符转换为半角函数 实例代码

    PHP全角半角转换函数,把目前能找到的所有全角都列出来了一个个替换吧. 之前试过网上找的通过ASCII之类的字符替换,发现很多莫名其妙的问题.最后还是换成下面的字符替换方式了,把目前能找到的所有全角都 ...

  4. js全角字符转为半角字符

    //全角转半角 function CtoH(str){ var result=""; for (var i = 0; i < str.length; i++){ if (st ...

  5. 关于JAVA正则匹配空白字符的问题(全角空格与半角空格)

    今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件 显示“\u3000” ,这是什么? 这是全角空格!!! 查了一下    \s    不支持全角 1.& ...

  6. c# winform 全角自动转化半角问题(C#中ImeMode的值):转载

    调用 this.ImeMode = ImeMode.OnHalf; ImeMode 枚举:指定一个值,该值是用来确定在选定了对象时该对象的输入法编辑器 (IME) 的状态. 以下是微软的解释: 成员名 ...

  7. C# 全角符号转半角

    public static string SBCCaseToNumberic(string SBCCase) { char[] c = SBCCase.ToCharArray(); ; i < ...

  8. JS INPUT输入的时候全角自动转为半角

    function CtoH(obj){var str=obj.value;var result="";for (var i = 0; i < str.length; i++) ...

  9. Java全角、半角字符的关系以及转换

    如果搞明白了Java中全角字符和半角字符之间的关系,那他们之间的转换就不是个麻烦事儿.你只需要对这个关系有那么一个印象就足够了. 全角字符与半角字符的关系 通过下面的代码能看到Java中所有字符以及对 ...

随机推荐

  1. 使用cordova开发app

    前言 公司之前用的app就是一个套壳挂个链接就能用的app,后来需要添加微信分享方便传播,没办法只好做成混合式的app了, 因为之前做.net用vs可以创建cordova项目也试着玩过,就决定用cor ...

  2. JAVA_file(1)

    1.基本概念的理解 绝对路径:绝对路径就是你的主页上的文件或目录在硬盘上真正的路径,(URL和物理路径)例如:C:xyz est.txt 代表了test.txt文件的绝对路径.http://www.s ...

  3. 理解volatile

    *:first-child { margin-top: 0 !important; } body>*:last-child { margin-bottom: 0 !important; } /* ...

  4. java 非缓冲与缓冲数据写入比较

    //非缓冲计时package com.swust; import java.io.*; /* *功能:创建一个程序,写10000个随机双精度的数到一个文件中,同时测试运用缓冲和非缓冲技术 * 进行这种 ...

  5. C# 获取文件MD5与SHA1

    之前刚开始学习编程的时候,总想着自己写一些小软件小工具. 而这个就是经典的文件MD5校验,顺便加上了一个SHA1. 在网络上下载一些东西时,会有作者提供MD5值. 它的作用就在于我们可以在下载该软件后 ...

  6. Java String类和Object类

    String类: 方法: 1.charAt(int index):取index下标的char类型值 2.endsWith(String prefix) /startsWith(String prefi ...

  7. VS2008 + WDK 配置 及其编译错误

    VS2008 + SP1 + Win7 X64 1. 安装WDK,并配置系统环境变量:WDKROOT-D:\WinDDK\7600.16385.1 2. 启动VS2005,在菜单栏“工具”-“选项”内 ...

  8. Zigbee折腾之旅:(一)CC2530最小系统

    最近在倒腾Zigbee,准备参加物联网全国大赛,学校有给我们发Zigbee开发板,但是对于喜欢折腾的我来说,用开发板还是不过瘾,起码也得知道怎么去画一块板子.于是乎,在百度一番后就有了下面这篇文章. ...

  9. Linux配置vnc

    yum install tigervnc-server vim /etc/sysconfig/vncservers 查看配置文件,修改最后面两行配置文件参数如下: VNCSERVERS="1 ...

  10. 微软MSBI商业智能视频

    第一讲:BI介质安装.BI基础知识讲解.BI方法论讲解.项目讲解                 1.BI基础知识讲解.BI方法论实施2.微软BI的介绍(数据仓库介绍.SSIS介绍.SSAS介绍.SS ...