utf-8中文字符占几个字节

这是我的测试：
byte[] b=str.getBytes("utf-8");
System.out.println("utf-8:"+b.length);

//str无论是平常用的汉字还是〇，怎么打印出来的都是3呢？不是utf-8的汉字占2到4个字节吗？

举报该问题

第1个回答 2013-08-29

是3个字节追问

谢谢您的回答，不过我还是想问清楚。

我百度的时候看到这样的答案：
占2个字节的：〇
占3个字节的：基本等同于GBK，含21000多个汉字
占4个字节的：中日韩超大字符集里面的汉字，有5万多个

请问他说的对吗？

相似回答

utf-8中的汉字占用多少字节答：utf-8是变长编码，并不是固定的，一般汉字占三个字节。

一个汉字到底占几个字节答：中文在utf-8中占3or4个字节。 utf8字符是变长字符，在这里补充一下uft-8的编码方式。一字节：0*** 两字节：110***，10*** 三字节：1110***，10***，10*** 四字节：11110 ，10***，10***，10*** 五字节：111110 ，10***，10***，10***，10*** 六...

汉字编码占用的字节数是多少?答：用16×16点阵来表示一个汉字，则该汉字图形由16行16列共256个点构成，这256个点需用256个二进制的位来描述，而一个字节是8个二进制位，所以需要32个字节来存储用于存放图形信息。因此，一个汉字要占用32字节的存储空间。UTF-8包含全世界所有国家需要用到的字符，是国际编码，通用性强。UTF-8编码的...

汉字和英文字符占几个字节?答：最小值-128，最大值127。如一个ASCII码就是一个字节。UTF-8编码：一个英文字符等于一个字节，一个中文（含繁体）等于三个字节。中文标点占三个字节，英文标点占一个字节 Unicode编码：一个英文等于两个字节，一个中文（含繁体）等于两个字节。中文标点占两个字节，英文标点占两个字节 ...

一个汉字在内存中占多少字节?答：一般占用两个字节。1个ASCII码占1个字节，而1个汉字编码占2个字节。这是指汉字编码，就象每个字符都有一个ASCII码一样。如果是在UTF-8编码下，一个汉字占3个字节，UTF-8是一种国际通用的一种变长编码。西方文字（希腊文字）占2个字符，中文占用3个字节数，还有平面符号占4个字节。汉字，又称中文...

一个中文字符用utf-8编码占用几个字节,gbk,gb2312,还有iso8859-1呢?答：常用中文字符用utf-8编码占用3个字节（大约2万多字），但超大字符集中的更大多数汉字要占4个字节（在unicode编码体系中，U+20000开始有5万多汉字）。GBK、GB2312收编的汉字占2个字节，严格地用iso8859-1无法表示汉字，只能转为问号。

大家正在搜

utf8中文占几个字节 utf8字符占几个字节每个字符占几个字节一个汉字符占几个字节一个中文字符占多少字节 utf8英文占几个字节一个ascii字符占几个字节 unicode中文占几个字节 utf8拉丁占几个字节