utf-8中文字符占几个字节

这是我的测试:
byte[] b=str.getBytes("utf-8");
System.out.println("utf-8:"+b.length);

//str无论是平常用的汉字还是〇,怎么打印出来的都是3呢?不是utf-8的汉字占2到4个字节吗?

第1个回答  2013-08-29
是3个字节追问

谢谢您的回答,不过我还是想问清楚。

我百度的时候看到这样的答案:
占2个字节的:〇
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个

请问他说的对吗?

相似回答