UCS2转UTF-8方法

前两天工作时需要将UCS2编码转为UTF-8编码在网页显示。网上找了好久没有好方法，后来还是同事给了一个自己的函数，顺利解决问题。把函数贴在这里，愿帮助遇到同样问题的工友们~

/**
     * UCS2转码为utf-8
     *
     * @author Shangxj
     * @param theString
     * @return String
     */
    public static String UCS2ToUtf8(String theString) {

// 对theString参数进行处理
        String strU = "\\u";
        String resultStr = "";
        int j = 0;
        int length = theString.trim().length();
        StringBuffer outBuffer = new StringBuffer(length);

try {
if (!(theString == null || theString.trim().equals(""))) {

for (int i = -4; i < length - 4; i = i + 4) {
                    String temStr = theString.trim().substring(i + 4, j + 4);
                    resultStr = resultStr + strU + temStr;
                    j = j + 4;
                }
                char aChar;
                int len = resultStr.length();
                for (int x = 0; x < len;) {
                    aChar = resultStr.charAt(x++);
                    if (aChar == '\\') {
                        aChar = resultStr.charAt(x++);
                        if (aChar == 'u') {
                            // Read the xxxx
                            int value = 0;
                            for (int i = 0; i < 4; i++) {
                                aChar = resultStr.charAt(x++);
                                switch (aChar) {
                                case '0':
                                case '1':
                                case '2':
                                case '3':
                                case '4':
                                case '5':
                                case '6':
                                case '7':
                                case '8':
                                case '9':
                                    value = (value << 4) + aChar - '0';
                                    break;
                                case 'A':
                                case 'B':
                                case 'C':
                                case 'D':
                                case 'E':
                                case 'F':
                                    value = (value << 4) + 10 + aChar - 'A';
                                    break;
                                default:
                                    throw new IllegalArgumentException(
                                            "Malformed \\uxxxx encoding.");
                                }
                            }
                            outBuffer.append((char) value);
                        } else {
                            if (aChar == 't')
                                aChar = '\t';
                            else if (aChar == 'r')
                                aChar = 'r';
                            else if (aChar == 'n')
                                aChar = 'n';
                            else if (aChar == 'f')
                                aChar = 'f';
                            outBuffer.append(aChar);
                        }
                    } else
                        outBuffer.append(aChar);
                }
            }
        } catch (StringIndexOutOfBoundsException siobe) {
            siobe.printStackTrace();
        }
        return outBuffer.toString();
    }
}

UCS2转UTF-8方法的更多相关文章

replace() 方法用在字符串中用一些字符替换另一些字符实例
后台给返回的格式是这样的控制台打印出来格式是这样的现在需要将这个字符串的数据显示在界面上,1-网站:2-APP:3-客户端 for(var i = 0; i < list.length; i ...
Unicode(UTF&UCS)深度历险
Unicode(UTF&UCS)深度历险计算机网络诞生后,大家慢慢地发现一个问题:一个字节放不下一个字符了!因为需要交流,本地化的文字需要能够被支持. 最初的字符集使用7bit来存储字符,因 ...
字符编码笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
转载:http://witmax.cn/character-encoding-notes.html 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问 ...
几个字符串的误区，以及setlocale函数的使用
转自 http://www.blogjava.net/baicker/archive/2007/08/09/135642.html 转自 http://witmax.cn/character-enco ...
字符编码终极笔记：ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
1.字符编码.内码,顺带介绍汉字编码字符必须编码后才能被计算机处理.计算机使用的缺省编码方式就是计算机的内码.早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB231 ...
用好lua+unity，让性能飞起来——luajit集成篇/平台相关篇
luajit集成篇大家都知道luajit比原生lua快,快在jit这三个字上. 但实际情况是,luajit的行为十分复杂.尤其jit并不是一个简单的把代码翻译成机器码的机制,背后有很多会影响性能的因 ...
javaSE27天复习总结
JAVA学习总结 2 第一天 2 1:计算机概述(了解) 2 (1)计算机 2 (2)计算机硬件 2 (3)计算机软件 2 (4)软件开发(理解) 2 (5) ...
Mysql外键约束设置使用方法
如果表A的主关键字是表B中的字段,则该字段称为表B的外键,表A称为主表,表B称为从表.外键是用来实现参照完整性的,不同的外键约束方式将可以使两张表紧密的结合起来,特别是修改或者删除的级联操作将使得日常 ...
从Java String实例来理解ANSI、Unicode、BMP、UTF等编码概念
转(http://www.codeceo.com/article/java-string-ansi-unicode-bmp-utf.html#0-tsina-1-10971-397232819ff9a ...

随机推荐

SharedPreference对象及其xml文件
SharedPreferences对象----->getXXX SharedPreferences.Editor对象---->putXXX
Check .NET Version with Inno Setup
原文 http://www.kynosarges.org/DotNetVersion.html Inno Setup by Jordan Russell is a great installation ...
让C/C++程序一次编译可以发布到多版本Linux之上
最近页游开放平台比较多, 每个平台要求的Linux版本各不相同, 这给开发人员部署服务器带来了很大的困难. 在本机Linux编译的程序,发布时即便将依赖的so附带到目标Linux环境,仍然会碰到依赖及 ...
cf459E Pashmak and Graph
E. Pashmak and Graph time limit per test 1 second memory limit per test 256 megabytes input standard ...
Stackoverflow上人气最旺的10个Java问题（转ImportNew）
本文转自:http://www.importnew.com/16841.html 写的确实太好了 1.为什么两个(1927年)时间相减得到一个奇怪的结果? 如果执行下面的程序,程序解析两个间隔1秒的日 ...
使用xmanager 远程redhat6.3
之前装过一次,特别麻烦,装上只有远程还卡卡的,这次按照教程居然装的灰常顺利,不符合我bug体质的特性,一定要记下来啊~~~ 1.先关闭防火墙 # service iptables stop #chkc ...
AJAX提交到Handler.ashx一般处理程序返回json数据 (字符串拼接方式)
<%@ WebHandler Language="C#" Class="Handler" %> using System; using System ...
CvMat、Mat、IplImage之间的转换详解及实例
见原博客:http://blog.sina.com.cn/s/blog_74a459380101obhm.html OpenCV学习之CvMat的用法详解及实例 CvMat是OpenCV比较基础的函数 ...
卸载mysql残留
一.在控制面板中查看是否有mysql,有则进行卸载.或执行同样版本号的mysql安装文件,选择"remove"进行卸载. 二.卸载mysql后其服务仍在,解决的方法: 点击&quo ...
求链表的倒数第k个节点
问题描述:给定一个链表的头节点,求出链表的倒数第k个节点. 分析:这是链表里的经典问题,存在多种解法,下面给大家分享下我的想法. 解法一:很直观的一种做法是从头到尾扫描链表,然后求倒数第k个,但是由于 ...

UCS2转UTF-8方法

UCS2转UTF-8方法的更多相关文章

随机推荐

热门专题