GBK与UTF-8转换时乱码

下面一段代码,将字符串在GBK与UTF-8之间进行两次转换,第一次生成乱码(UTF-8的字节码用GBK解析),第二次反推这个过程,应该会生成正确的字符串.
但是有些中文字却变成了'???'一类的乱码.只是其中的一些...

public class UTF8SimpleTry {
public static void main(String[] args) throws UnsupportedEncodingException {
String str = new String("可怜");
System.out.println(">>>>>"+str);
String str1 = new String(str.getBytes("UTF-8"),"GBK");
String str2 = new String(str1.getBytes("GBK"),"UTF-8");
System.out.println("====="+str2);

}
}

上面的代码会打印出:
>>>>>可怜
=====可???

但是如果str为"我我我我我"就不会有乱码...

我的问题是:这个乱码是如何产生的?
(请认真看完上面的描述再给答案,最好是能针对此问题,也不拒绝有意义的转贴...谢谢....)

举报该问题

推荐答案 2013-07-29

åºè¯¥ç¼ç è½¬æ¢çæ¶åä¸¢å¤±äºåè,ä½ æ²¡æåç°ä½ è¾å¥çæ¯å¶æ°ä¸ªåçæ¶åæ£å¸¸,å¥æ°ä¸ªçæ¶åä¹±ç ,å·ä½çåç é¿åº¦æä¹ä¸æ¯å¾äºè§£
String str1 = new String(str.getBytes("UTF-8"),"GBK");
System.out.println(str1.length());
String str2 = new String(str1.getBytes("GBK"),"UTF-8");
System.out.println(str2.length());); æå°åºæ¥çåç¬¦ä¸²é¿åº¦å°±ä¸ä¸æ ·ç
UTF8æ¯ä¸ªæ±åå ç¨3ä¸ªåèï¼è¿æ ·å¨æäºå°æ¹æåä¸ªæ°çè®¡ç®å°±åGBKç¼ç çä¸ä¸æ ·,UTF-8ä½¿ç¨å¯åé¿åº¦åèæ¥å¨å Unicodeåç¬¦ï¼ä¾å¦ASCIIåæ¯ç»§ç»ä½¿ç¨1åèå¨åï¼éé³æåãå¸èåæ¯æè¥¿éå°åæ¯çä½¿ç¨2åèæ¥å¨åï¼èå¸¸ç¨çæ±åå°±è¦ä½¿ç¨3åèãè¾å©å¹³é¢åç¬¦åä½¿ç¨4åèã GB 18030æ åéç¨ååèãååèåååèä¸ç§æ¹å¼å¯¹åç¬¦ç¼ç ãååèé¨åä½¿ç¨0Ã00è³0Ã7Fç (å¯¹åºäºASCIIç çç¸åºç )ãååèé¨åï¼é¦åèç ä»0Ã81è³0ÃFEï¼å°¾åèç ä½åå«æ¯0Ã40è³0Ã7Eå0Ã80è³0ÃFEãååèé¨åéç¨GB/T 11383æªéç¨ç0Ã30å°0Ã39ä½ä¸ºå¯¹ååèç¼ç æ©åçåç¼ï¼è¿æ ·æ©åçååèç¼ç ï¼å¶èå´ä¸º0Ã81308130å°0ÃFE39FE39ãå¶ä¸ç¬¬ä¸ãä¸ä¸ªåèç¼ç ç ä½åä¸º0Ã81è³0ÃFEï¼ç¬¬äºãåä¸ªåèç¼ç ç ä½åä¸º0Ã30è³0Ã39ã
æç§ç¨åºåçç§°å¼ï¼GB2312ãGBKå°GB18030é½å±äºååèåç¬¦é (DBCS)ã

温馨提示：答案为网友推荐，仅供参考

当前网址：http://66.wendadaohang.com/zd/sxDsn9ipx.html

相似回答

UTF-8与GBK互转会乱码,为什么?编码不一致答：乱码的本质就是：读取二进制的时候采用的编码和最初将字符转换成二进制时的编码不一致。UTF-8和GBK是两套中文支持较好的编码，所以经常会进行它们之间的转换.1.UTF-8转换成GBK：鎴戜滑鏄腑锲戒汉 UTF-8转换成GBK再转成UTF-8：我们是中国人 2. 以GBK编码再以UTF-8解码，再以UTF-8编码...

如何解决GBK转换UTF-8乱码问题答：一、模板文件转换（1）用DW打开模板文件，选择修改——页面属性——标题/编码（2）我们只要将编码选择为UTF-8即可，下面还有一个选择就是：是否包含Unicode签名（BOM），选择不带bom的格式保存。（3）若发现有的文字出现了乱码自己手动更改为对应的中文，从而将全部的模板文章转换为UTF-8格式！二...

如何解决代码GBK/UTF-8等字符,编码显示乱码答：打开，中文注释一堆乱码，看得我这个纠结在右下角有个显示当前编码的地方，如图，这次是 -> "UTF-8"，双击它，弹出可选择编码的对话框，选择"GB2312"选择完毕后看着舒心顺畅了，这时候你可以查看注释内容了。或者复制文件内容，复制到别的编码格式的文件中然后说说Notepad++，Notepad++作为一款非常轻...

网页gbk编码改成UTF-8后网页显示乱码,怎么做才能gbk或者gb2312改成后...答：因为网页内容的编码方式使用的是gbk编码，你选择网页的编码其实就是选择对应的解码器，这样的话使用utf-8自然就出错啦~~~要保证正常显示的话，可以写一段代码将网页内容的编码方式改成utf-8

python2.7 utf-8转gbk 乱码答：windows的本地默认编码是cp936（gbk编码），Windows中直接打印utf-8的字符串是乱码将你文件申明为UTF-8保存 coding:utf-8 def respeak(self):cText =pyperclip.paste()gt = cText.decode('utf-8').encode('gbk')self.ui.mainT.setText(QtCore.QString(gt))

gbk和utf8乱码问题答：把网页另存为utf-8编码格式，meta里charset写utf-8。

大家正在搜

word文件转换乱码为什么pdf转换成word是乱码复制PDF时出现乱码怎么办程序输出时出现乱码为什么下载时出现乱码打印时打印出乱码自动求和时出现乱码怎么办输入数字时出现乱码 excel乱码怎么解决