JNI/NDK开发指南(四)——字符串处理
转载请注明出处:http://blog.csdn.net/xyang81/article/details/42066665
从第三章中能够看出JNI中的基本类型和Java中的基本类型都是一一相应的,接下来先看一下JNI的基本类型定义:
- typedef unsigned char jboolean;
- typedef unsigned short jchar;
- typedef short jshort;
- typedef float jfloat;
- typedef double jdouble;
- typedef int jint;
- #ifdef _LP64 /* 64-bit Solaris */
- typedef long jlong;
- #else
- typedef long long jlong;
- #endif
- typedef signed char jbyte;
基本类型非常easy理解。就是对C/C++中的基本类型用typedef又一次定义了一个新的名字,在JNI中能够直接訪问。
JNI把Java中的全部对象当作一个C指针传递到本地方法中,这个指针指向JVM中的内部数据结构,而内部的数据结构在内存中的存储方式是不可见的。
仅仅能从JNIEnv指针指向的函数表中选择合适的JNI函数来操作JVM中的数据结构。第三章的演示样例中。訪问java.lang.String相应的JNI类型jstring时,没有像訪问基本数据类型一样直接使用,由于它在Java是一个引用类型。所以在本地代码中仅仅能通过GetStringUTFChars这种JNI函数来訪问字符串的内容。
以下先看一个样例:
Sample.java:
- package com.study.jnilearn;
- public class Sample {
- public native static String sayHello(String text);
- public static void main(String[] args) {
- String text = sayHello("yangxin");
- System.out.println("Java str: " + text);
- }
- static {
- System.loadLibrary("Sample");
- }
- }
com_study_jnilearn_Sample.h和Sample.c:
- /* DO NOT EDIT THIS FILE - it is machine generated */
- #include <jni.h>
- /* Header for class com_study_jnilearn_Sample */
- #ifndef _Included_com_study_jnilearn_Sample
- #define _Included_com_study_jnilearn_Sample
- #ifdef __cplusplus
- extern "C" {
- #endif
- /*
- * Class: com_study_jnilearn_Sample
- * Method: sayHello
- * Signature: (Ljava/lang/String;)Ljava/lang/String;
- */
- JNIEXPORT jstring JNICALL Java_com_study_jnilearn_Sample_sayHello
- (JNIEnv *, jclass, jstring);
- #ifdef __cplusplus
- }
- #endif
- #endif
- // Sample.c
- #include "com_study_jnilearn_Sample.h"
- /*
- * Class: com_study_jnilearn_Sample
- * Method: sayHello
- * Signature: (Ljava/lang/String;)Ljava/lang/String;
- */
- JNIEXPORT jstring JNICALL Java_com_study_jnilearn_Sample_sayHello
- (JNIEnv *env, jclass cls, jstring j_str)
- {
- const char *c_str = NULL;
- char buff[128] = {0};
- jboolean isCopy; // 返回JNI_TRUE表示原字符串的拷贝。返回JNI_FALSE表示返回原字符串的指针
- c_str = (*env)->GetStringUTFChars(env, j_str, &isCopy);
- printf("isCopy:%d\n",isCopy);
- if(c_str == NULL)
- {
- return NULL;
- }
- printf("C_str: %s \n", c_str);
- sprintf(buff, "hello %s", c_str);
- (*env)->ReleaseStringUTFChars(env, j_str, c_str);
- return (*env)->NewStringUTF(env,buff);
- }
执行结果例如以下:
演示样例解析:
1> 訪问字符串
sayHello函数接收一个jstring类型的參数text,但jstring类型是指向JVM内部的一个字符串,和C风格的字符串类型char*不同。所以在JNI中不能通把jstring当作普通C字符串一样来使用。必须使用合适的JNI函数来訪问JVM内部的字符串数据结构。
GetStringUTFChars(env, j_str, &isCopy) 參数说明:
env:JNIEnv函数表指针
j_str:jstring类型(Java传递给本地代码的字符串指针)
isCopy:取值JNI_TRUE和JNI_FALSE,假设值为JNI_TRUE,表示返回JVM内部源字符串的一份拷贝。并为新产生的字符串分配内存空间。假设值为JNI_FALSE,表示返回JVM内部源字符串的指针,意味着能够通过指针改动源字符串的内容,不推荐这么做,由于这样做就打破了Java字符串不能改动的规定。但我们在开发其中。并不关心这个值是多少。通常情况下这个參数填NULL就可以。
由于Java默认使用Unicode编码,而C/C++默认使用UTF编码,所以在本地代码中操作字符串的时候。必须使用合适的JNI函数把jstring转换成C风格的字符串。JNI支持字符串在Unicode和UTF-8两种编码之间转换。GetStringUTFChars能够把一个jstring指针(指向JVM内部的Unicode字符序列)转换成一个UTF-8格式的C字符串。
在上例中sayHello函数中我们通过GetStringUTFChars正确取得了JVM内部的字符串内容。
2> 异常检查
调用完GetStringUTFChars之后不要忘记安全检查,由于JVM须要为新诞生的字符串分配内存空间,当内存空间不够分配的时候,会导致调用失败。失败后GetStringUTFChars会返回NULL,并抛出一个OutOfMemoryError异常。JNI的异常和Java中的异常处理流程是不一样的,Java遇到异常假设没有捕获,程序会马上停止执行。
而JNI遇到未决的异常不会改变程序的执行流程,也就是程序会继续往下走,这样后面针对这个字符串的全部操作都是非常危急的,因此。我们须要用return语句跳过后面的代码,并马上结束当前方法。
3> 释放字符串
在调用GetStringUTFChars函数从JVM内部获取一个字符串之后。JVM内部会分配一块新的内存,用于存储源字符串的拷贝,以便本地代码訪问和改动。即然有内存分配。用完之后马上释放是一个编程的好习惯。通过调用ReleaseStringUTFChars函数通知JVM这块内存已经不使用了。你能够清除了。注意:这两个函数是配对使用的,用了GetXXX就必须调用ReleaseXXX,并且这两个函数的命名也有规律。除了前面的Get和Release之外,后面的都一样。
4> 创建字符串
通过调用NewStringUTF函数。会构建一个新的java.lang.String字符串对象。这个新创建的字符串会自己主动转换成Java支持的Unicode编码。假设JVM不能为构造java.lang.String分配足够的内存。NewStringUTF会抛出一个OutOfMemoryError异常。并返回NULL。在这个样例中我们不必检查它的返回值。假设NewStringUTF创建java.lang.String失败,OutOfMemoryError这个异常会被在Sample.main方法中抛出。假设NewStringUTF创建java.lang.String成功,则返回一个JNI引用,这个引用指向新创建的java.lang.String对象。
其他字符串处理函数:
1> GetStringChars和ReleaseStringChars:这对函数和Get/ReleaseStringUTFChars函数功能差点儿相同,用于获取和释放以Unicode格式编码的字符串。
后者是用于获取和释放UTF-8编码的字符串。
2> GetStringLength:由于UTF-8编码的字符串以'\0'结尾。而Unicode字符串不是。
假设想获取一个指向Unicode编码的jstring字符串长度,在JNI中可通过这个函数获取。
3> GetStringUTFLength:获取UTF-8编码字符串的长度。也能够通过标准C函数strlen获取
4> GetStringCritical和ReleaseStringCritical:提高JVM返回源字符串直接指针的可能性
Get/ReleaseStringChars和Get/ReleaseStringUTFChars这对函数返回的源字符串会后分配内存,假设有一个字符串内容相当大。有1M左右。并且仅仅须要读取里面的内容打印出来,用这两对函数就有些不太合适了。此时用Get/ReleaseStringCritical可直接返回源字符串的指针应该是一个比較合适的方式。
只是这对函数有一个非常大的限制,在这两个函数之间的本地代码不能调用不论什么会让线程堵塞或等待JVM中其他线程的本地函数或JNI函数。
由于通过GetStringCritical得到的是一个指向JVM内部字符串的直接指针,获取这个直接指针后会导致暂停GC线程,当GC被暂停后,假设其他线程触发GC继续执行的话,都会导致堵塞调用者。所以在Get/ReleaseStringCritical这对函数中间的不论什么本地代码都不能够执行导致堵塞的调用或为新对象在JVM中分配内存,否则,JVM有可能死锁。
另外一定要记住检查是否由于内存溢出而导致它的返回值为NULL。由于JVM在执行GetStringCritical这个函数时,仍有发生数据复制的可能性,尤其是当JVM内部存储的数组不连续时。为了返回一个指向连续内存空间的指针。JVM必须复制全部数据。以下代码演示这对函数的正确使用方法:
- JNIEXPORT jstring JNICALL Java_com_study_jnilearn_Sample_sayHello
- (JNIEnv *env, jclass cls, jstring j_str)
- {
- const jchar* c_str= NULL;
- char buff[128] = "hello ";
- char* pBuff = buff + 6;
- /*
- * 在GetStringCritical/RealeaseStringCritical之间是一个关键区。
- * 在这关键区之中,绝对不能呼叫JNI的其他函数和会造成当前线程中断或是会让当前线程等待的不论什么本地代码。
- * 否则将造成关键区代码执行区间垃圾回收器停止运作。不论什么触发垃圾回收器的线程也会暂停。
- * 其他触发垃圾回收器的线程不能前进直到当前线程结束而激活垃圾回收器。
- */
- c_str = (*env)->GetStringCritical(env,j_str,NULL); // 返回源字符串指针的可能性
- if (c_str == NULL) // 验证是否由于字符串拷贝内存溢出而返回NULL
- {
- return NULL;
- }
- while(*c_str)
- {
- *pBuff++ = *c_str++;
- }
- (*env)->ReleaseStringCritical(env,j_str,c_str);
- return (*env)->NewStringUTF(env,buff);
- }
JNI中没有Get/ReleaseStringUTFCritical这种函数,由于在进行编码转换时非常可能会促使JVM对数据进行复制,由于JVM内部表示的字符串是使用Unicode编码的。
5> GetStringRegion和GetStringUTFRegion:分别表示获取Unicode和UTF-8编码字符串指定范围内的内容。
这对函数会把源字符串拷贝到一个预先分配的缓冲区内。以下代码用GetStringUTFRegion又一次实现sayHello函数:
- JNIEXPORT jstring JNICALL Java_com_study_jnilearn_Sample_sayHello
- (JNIEnv *env, jclass cls, jstring j_str)
- {
- jsize len = (*env)->GetStringLength(env,j_str); // 获取unicode字符串的长度
- printf("str_len:%d\n",len);
- char buff[128] = "hello ";
- char* pBuff = buff + 6;
- // 将JVM中的字符串以utf-8编码拷入C缓冲区,该函数内部不会分配内存空间
- (*env)->GetStringUTFRegion(env,j_str,0,len,pBuff);
- return (*env)->NewStringUTF(env,buff);
- }
GetStringUTFRegion这个函数会做越界检查,假设检查发现越界了,会抛出StringIndexOutOfBoundsException异常,这种方法与GetStringUTFChars比較类似,不同的是,GetStringUTFRegion内部不分配内存,不会抛出内存溢出异常。
注意:GetStringUTFRegion和GetStringRegion这两个函数由于内部没有分配内存。所以JNI没有提供ReleaseStringUTFRegion和ReleaseStringRegion这种函数。
字符串操作总结:
1、对于小字符串来说,GetStringRegion和GetStringUTFRegion这两对函数是最佳选择,由于缓冲区能够被编译器提前分配,并且永远不会产生内存溢出的异常。
当你须要处理一个字符串的一部分时。使用这对函数也是不错。
由于它们提供了一个開始索引和子字符串的长度值。另外。复制少量字符串的消耗 也是非常小的。
2、使用GetStringCritical和ReleaseStringCritical这对函数时,必须非常小心。一定要确保在持有一个由 GetStringCritical 获取到的指针时,本地代码不会在 JVM 内部分配新对象,或者做不论什么其他可能导致系统死锁的堵塞性调用
3、获取Unicode字符串和长度,使用GetStringChars和GetStringLength函数
4、获取UTF-8字符串的长度。使用GetStringUTFLength函数
5、创建Unicode字符串。使用NewStringUTF函数
6、从Java字符串转换成C/C++字符串,使用GetStringUTFChars函数
7、通过GetStringUTFChars、GetStringChars、GetStringCritical获取字符串。这些函数内部会分配内存。必须调用相相应的ReleaseXXXX函数释放内存
演示样例代码下载地址:https://code.csdn.net/xyang81/jnilearn
JNI/NDK开发指南(四)——字符串处理的更多相关文章
- JNI/NDK开发指南(开山篇)
转载请注明出处:http://blog.csdn.net/xyang81/article/details/41759643 相信很多做过Java或Android开发的朋友经常会接触到JNI方面的技术, ...
- JNI/NDK开发指南(一)—— JNI开发流程及HelloWorld
转载请注明出处:http://blog.csdn.net/xyang81/article/details/41777471 JNI全称是Java Native Interface(Java本地接口)单 ...
- JNI/NDK开发指南(十)——JNI局部引用、全局引用和弱全局引用
转自:http://blog.csdn.net/xyang81/article/details/44657385 这篇文章比较偏理论,详细介绍了在编写本地代码时三种引用的使用场景和注意事项.可能看 ...
- JNI/NDK开发指南(九)——JNI调用性能測试及优化
转载请注明出处:http://blog.csdn.net/xyang81/article/details/44279725 在前面几章我们学习到了.在Java中声明一个native方法,然后生成本地接 ...
- JNI/NDK开发指南(2)
1.生成动态库.so,存放于手机的system/lib/中(APP怎样将.so存入该文件夹,奇怪?????),Java层调用JNI的类会运行静态代码System.loadLibrary("* ...
- JNI/NDK开发指南(三)——JNI数据类型及与Java数据类型的映射关系
转载请注明出处:http://blog.csdn.net/xyang81/article/details/42047899 当我们在调用一个Java native方法的时候.方法中的參数是怎样传递给C ...
- JNI/NDK开发指南(二)——JVM查找java native方法的规则
通过第一篇文章,大家明白了调用native方法之前,首先要调用System.loadLibrary接口加载一个实现了native方法的动态库才能正常访问,否则就会抛出java.lang.Unsatis ...
- Android JNI/NDK开发教程
JNI/NDK开发指南:http://blog.csdn.net/xyang81/article/details/41759643
- JNI/NDK开发
公司的新需求终于解决完了,离测试和发布还有段时间,第一次体验了下没需求没bug的感觉,真是舒爽~然后翻了翻有什么可以学的.无意翻到了Android后期发展的五大趋势.一.性能优化.二.高级UI.三.J ...
随机推荐
- bzoj1044
好题 第一问不难,毕竟二分答案类的题目在USACO上都练了好多遍了 第二问充分的暴露了我dp渣的本性 一开始楞是没想出来 f[i,j]表示到第i根木棒切了j刀满足最长段小于等于ans的方案数 式子是这 ...
- UVa 1605 (构造) Building for UN
题意: 有n个国家,要设计一栋长方体的大楼,使得每个单位方格都属于其中一个国家,而且每个国家都要和其他国家相邻. 分析: 紫书上有一种很巧妙的构造方法: 一共有2层,每层n×n.一层是每行一个国家,另 ...
- 【转】 Homebrew – OSX下简单的包管理系统
很多linux用户很喜欢 (Debian/Ubuntu)系列的apt包管理系统和(Redhat/Fedora)系列的yum包管理系统. 包括Windows用户都有多种方便的软件管理工具,如:360软件 ...
- HDU 5636 Shortest Path 分治+搜索剪枝
题意:bc round 74 分析(官方题解): 你可以选择分类讨论, 但是估计可能会写漏一些地方. 只要抽出新增边的端点作为关键点, 建立一个新图, 然后跑一遍floyd就好了. 复杂度大概O(6^ ...
- FZU 2214 Knapsack dp (转化背包)
就是一个背包裸题,由于物品的重量太大,开不了这么大的数组 所以转化一下,由于价值总和不大于5000,所以把价值看作重量,重量看作价值,那么就是同样的价值下,求一个最轻的重量 #include<c ...
- STM32 串口DMA方式接收(转)
STM32 是一款基于ARM Cortex-M3内核的32位MCU,主频最高可达72M.最近因为要在车机上集成TPMS功能, 便开始着手STM32的开发工作,STM32F10x系列共有5个串口(USA ...
- C++ 继承之虚继承与普通继承的内存分布
仅供互相学习,请勿喷,有观点欢迎指出~ class A { virtual void aa(){}; }; class B : public virtual A { ]; //加入一个变量是为了看清楚 ...
- Leetcode OJ : Repeated DNA Sequences hash python solution
Total Accepted: 3790 Total Submissions: 21072 All DNA is composed of a series of nucleotides abb ...
- bzoj 1833 [ZJOI2010]count 数字计数(数位DP)
[题目链接] http://www.lydsy.com/JudgeOnline/problem.php?id=1833 [题意] 统计[a,b]区间内各数位出现的次数. [思路] 设f[i][j][k ...
- 关于ANSI 和 Unicode
关于ANSI和Unicode 1.ANSI American National Standards Institute(美国国家标准学会),ANSI编码不是一种具体的编码方式,而是一种指定在某些环境下 ...