左右c++与java中国的垃圾问题的分析与解决

DionysosLai(906391500@qq.com)  2014/8/1

问题分析:

之所以会出现中文乱码问题,归根结底在于中文的编码与英文的编码方式存在差异。

在java内部是使用16bit的unicode编码(即utf-16)来表示字符串。不管英文还是中文都是2字节。

C/C++使用的是原始数据,ascii是一个字节,中文通常是GB2312编码,用2个字节表示一个汉字。

Jni内部是使用utf-8编码表示字符串的,utf-8是扁长的unicode。一般ascii是1字节。中文是3字节。

以下给出在不同字符集编码下的字节数:

英文字母:

字节数 : 1;编码:GB2312              字节数: 1;编码:GBK            字节数 : 1;编码:GB18030

字节数 : 1;编码:ISO-8859-1        字节数: 1;编码:UTF-8         字节数 : 4;编码:UTF-16

字节数 : 2;编码:UTF-16BE           字节数: 2;编码:UTF-16LE

中文汉字:

字节数 : 2;编码:GB2312              字节数: 2;编码:GBK            字节数 : 2;编码:GB18030

字节数 : 1;编码:ISO-8859-1        字节数: 3;编码:UTF-8         字节数 : 4;编码:UTF-16

字节数 : 2;编码:UTF-16BE           字节数: 2;编码:UTF-16LE

二者数据传递分析:

Java->C++数据传递

有上文可知,java使用的是utf-16编码。jvm把数据传递给jni,c++dedao的是输入參数u是jstring。此时,能够利用jni提供的两种函数,一个是GetStringUTFChars,这个函数将得到一个UTF-8编码的字符串;还有一个是GetStringChars这个将得到UTF-16编码的字符串。不管那个函数,假设字符串包括中文,都须要进一步转化成C\C++的编码格式:GB2312。

C++->java数据传递

C\C++的英文编码方式是ascii码,对于中文则是GB2312。Jni返回给java的字符串,c\c++首先应该负责把这个字符串扁长utf-8或者utf-16格式,然后通过NewStringUTF或者NewString将字符串封装成jstring,返回给java就可以。

假设没有中文字符,就仅仅有标准的ascii码值,那么使用GetStringUTFChars/NewStringUTF能够轻松搞定。由于在这样的情况下。utf-8编码和ascii编码是一致,不须要转换。

假设存在中文字符。那么在C\C++部分进行编码就是必须的,一个是把utf-8/16的编码转成GB2312。一个是把GB2312转成utf-8/16。

问题解决:

最终到解决这个问题的时刻了。(我的大斧已经饥渴难耐了)。

对于编码转换,推荐使用iconv库,iconv库是一个免费独立的编码转化库。支持多种平台。多种编码,并且其行为不论什么不受外部环境影响。使用iconv库的另外一个优点就是cocos2dx在win32平台下已经集成了其库环境,不须要开发人员额外加入。可是在Android平台就须要开发人员自己加入。至于怎样在Android平台上加入iconv库,在以下会具体解说(也能够看网上教程。基本方法都是怎样在Eclipse上加入库)。

以下给出怎样将中文编码格式GB2312,转化成utf-8编码方式。

int CCDirector::GBKToUTF8(std::string &gbkStr)
{
iconv_t iconvH; iconvH = iconv_open("utf-8","gb2312");
if(iconvH == 0){
return -1;
}
const char* strChar = gbkStr.c_str();
const char** pin = &strChar; size_t strLength = gbkStr.length();
char* outbuf = (char*)malloc(strLength*4);
char* pBuff = outbuf;
memset(outbuf,0,strLength*4);
size_t outLength = strLength*4;
<span style="color:#ff6666;"><strong>#if(CC_TARGET_PLATFORM == CC_PLATFORM_WIN32)
if(-1 == iconv(iconvH,pin,&strLength,&outbuf,&outLength)){
iconv_close(iconvH);
return -1;
}
#else
if(-1 == iconv(iconvH,(char **)pin,&strLength,&outbuf,&outLength)){
iconv_close(iconvH);
return -1;
}
#endif</strong></span> gbkStr = pBuff;
iconv_close(iconvH);
return 0;
}

注意红色字体代码,在win32平台和android平台传递的參数是不一样的。这个主要原因是因为pin參数是constchar**型,在java中,没有这样的类型參数。因此要强制装换成char**类型。

在Eclipse中加入iconv库

Iconv库下载地址例如以下:

Cocos2dx引擎在win32平台,本身自带了iconv库,库地址在E:\EngilshLogicGame\EnglishGame\cocos2d-x-2.2.3\cocos2dx\platform\third_party\win32,在这里面还包含其它的一些库文件,例如说网络库,解析png库等。引擎在Android平台,没有自带iconv库(个人推測原因是因为ndk自带iconv库了,因此事实上能够不用自己下载iconv库,但这里。我们给出方法是使用自己下载的iconv库),iconv库的下载地址上文已经给出。

通过更改projectproj.android/jni/Android.mk文件,将iconv库文件载入进Eclipse中。在mk文件里增加了以下两句话,如图所看到的:


注意:这里我将下载的iconv库文件放在了引擎的external文件下(当然,也能够发在别的地方,仅仅须要更改相应的文件夹文件就可以),如图所看到的:

下一步。是要更改我们下载的iconv库文件里的mk文件(假设是从我这下载的iconv库,我已经更改好了)。

更改方式,如图所看到的:

注意:画圈的两个keyword,与之前改动的proj.android/jni/Android.mk文件里的keyword是一致的。

到这里,iconv库在Android平台就加入完成了。

在之前给出的函数GBKToUTF8中。用到了iconv库函数,因此在文件里要包括iconv头文件,详细代码例如以下所看到的:

#if(CC_TARGET_PLATFORM == CC_PLATFORM_WIN32)
#include "iconv.h"
#else
#include "../external/libiconv/include/iconv.h"
#endif

至此,关于“关于c++与java中文乱码问题分析与解决”话题。就到此为止。希望能对大家有点帮助。

也感谢公司的同事给帮助到,一些博客和在线。

版权声明:本文博主原创文章,博客,未经同意不得转载。

左右c++与java中国的垃圾问题的分析与解决的更多相关文章

  1. 文《左右c++与java中国的垃圾问题的分析与解决》一bug分析

    文<左右c++与java中国的垃圾问题的分析与解决>一bug分析 DionysosLai(906391500@qq.com) 2014/10/21 在前几篇一博客<关于c++与jav ...

  2. Java 虚拟机 - GC 垃圾回收机制分析

    Java 垃圾回收(Garbage Collection,GC) Java支持内存动态分配.垃圾自动回收,而 C++ 不支持.我想这可能也是 为什么 Java 脱胎于 C++ 的一个原因吧. GC 的 ...

  3. Java并发-ConcurrentModificationException原因源码分析与解决办法

    一.异常原因与异常源码分析 对集合(List.Set.Map)迭代时对其进行修改就会出现java.util.ConcurrentModificationException异常.这里以ArrayList ...

  4. (转)postfix疯狂外发垃圾邮件之分析与解决

    从进程中看到,好像是postfix有问题.我这postfix主要是用来给程序发达邮件用的,如报警,程序外发邮件等.平时postfix进程不会像现在这样异常,这在postf主进程CPU占用高,其它的相关 ...

  5. 在java中使用RBL服务器(中国反垃圾邮件联盟的CBL+使用)

    这是06年写的,不知道现在RBL改了没,不过恢复过来做记录,以后可能需要. 实时黑名单(RBL)实际上是一个可供查询的IP地址列表,通过DNS的查询方式来查找一个IP地址的A记录是否存在来判断其是否被 ...

  6. Java编程思想学习笔记_1(Java内存和垃圾回收)

    1.Java中对象的存储数据的地方: 共有五个不同的地方可以存储数据. 1)寄存器.最快,因为位于处理器的内部,寄存器按需求分配,不能直接控制. 2)堆栈.位于通用RAM,通过堆栈指针可以从处理器那里 ...

  7. Java虚拟机之垃圾回收详解一

    Java虚拟机之垃圾回收详解一 Java技术和JVM(Java虚拟机) 一.Java技术概述: Java是一门编程语言,是一种计算平台,是SUN公司于1995年首次发布.它是Java程序的技术基础,这 ...

  8. struts2注解redirect传递参数解决方案时,中国的垃圾问题

    struts2注解redirect传递参数解决方案时,中国的垃圾问题 试过很多方法  tomcat 编码  .字符串转换 .URLEncoder  .. 但是,没有解决方案,然后仔细阅读   stru ...

  9. 【java虚拟机序列】java中的垃圾回收与内存分配策略

    在[java虚拟机系列]java虚拟机系列之JVM总述中我们已经详细讲解过java中的内存模型,了解了关于JVM中内存管理的基本知识,接下来本博客将带领大家了解java中的垃圾回收与内存分配策略. 垃 ...

随机推荐

  1. C语言 &#183; 回文数

    问题描述 1221是一个非常特殊的数,它从左边读和从右边读是一样的,编程求所有这样的四位十进制数. 输出格式 按从小到大的顺序输出满足条件的四位十进制数.   方案一: int main(){ int ...

  2. 阿里云安装Tomcat

    1.Apache官方网站下载Tomcat http://mirrors.hust.edu.cn/apache/tomcat/tomcat-8/v8.0.35/bin/apache-tomcat-8.0 ...

  3. php面向对象的三大特征 封装,继承,多态

    对象的主要三个特性 对象的行为:可以对 对象施加那些操作,开灯,关灯就是行为. 对象的形态:当施加那些方法是对象如何响应,颜色,尺寸,外型. 对象的表示:对象的表示就相当于身份证,具体区分在相同的行为 ...

  4. java 高精度

    package BigDecimal; import java.math.BigDecimal; import java.lang.Object; public class BigDecimalTes ...

  5. postgresql 将同一个字段的值组合和将多个字段的值组合

    多字段值根据连接符拼接 concat_ws(':',aaa,bbb) 单字段值根据连接符拼接 string_agg(ccc,' \r\n ') 如果要将多个字段的值拼接成一个: string_agg( ...

  6. 【转】myget编译过程中make出错的解决办法

    源链接:http://www.tangqizhong.info/?p=741 myget(至今不明白为什么它对应的命令是mytget…)是我从用linux之后就开一直在用的命令行下载工具(其次也会用到 ...

  7. 存储结构比较vector,list,dequeue,stack(转)

        vector适用:对象数量变化少,简单对象,随机访问元素频繁list适用:对象数量变化大,对象复杂,插入和删除频繁最大的区别是,list是双向的,而vector是单向的.因此在实际使用时,如何 ...

  8. C++版 - 剑指Offer 面试题39:二叉树的深度(高度)(二叉树深度优先遍历dfs的应用) 题解

    剑指Offer 面试题39:二叉树的深度(高度) 题目:输入一棵二叉树的根结点,求该树的深度.从根结点到叶结点依次经过的结点(含根.叶结点)形成树的一条路径,最长路径的长度为树的深度.例如:输入二叉树 ...

  9. java、php、.net关于web开发的区别

    一提到web开发,目前在世界上流行性的三个帮派就是php,java和asp.net,这个世界上的百分之99的网站或者类似的应用都是由这三种语言的开发,这里请原谅我忽视某些小众语言如python之类.三 ...

  10. 小程序实践(六):view内部组件排版

    涉及知识点: 1.垂直排列,水平排列 2.居中对齐 示例: 1.默认排版 , 一个父组件里面两个子view 显示效果: 2.先给父view设置一个高度和颜色值,用于看效果 3.实现水平排列和垂直排列的 ...