python123汉字的unicode编码值

如题所述

第1个回答 2022-04-12

python的默认编码是ascii，可以通过sys.setdefaultencoding('utf-8')函数设置python的默认编码。

python中可以通过encode和decode的方式改变数据的编码，比如：

>>> u'汉字'

u'\u6c49\u5b57'

>>> u'汉字'.encode('utf-8')

'\xe6\xb1\x89\xe5\xad\x97'

>>> u'汉字'.encode('utf-8').decode('utf-8')

u'\u6c49\u5b57'

我们可以通过这两个函数设置编码。

那么，python中的str是什么类型？

>>> import binascii

>>> '汉字'

'\xba\xba\xd7\xd6'

>>> type('汉字')

>>> print binascii.b2a_hex('汉字')

babad7d6

>>> print binascii.b2a_hex(u'汉字')

Traceback (most recent call last):

File "", line 1, in

UnicodeEncodeError: 'ascii' codec can't encode characters in

position 0-1: ordinal not in range(128)

>>> print binascii.b2a_hex(u'汉字'.encode('utf-8'))

e6b189e5ad97

>>> print binascii.b2a_hex(u'汉字'.encode('gbk'))

babad7d6

binascii是将数据的二进制转换成ascii，上面的解释是：‘汉字'的类型是str，二进制是babad7d6，u‘汉字'是无法转换成ascii，这样就报出了开头的第一个错误。解决办法就是把它.encode(‘utf-8')成str类型。因为我命令行是windows默认的GBK编码，所有u'汉字'.encode(‘gbk')的时候，输出结果和‘汉字'结果一样。

相似回答

...输出你的中文姓名和姓名中每个字的unicode编码。(要求答：```python name = "张三" # 中文姓名 print("中文姓名：", name)输出每个汉字的Unicode编码 for i in range(len(name)):print(name[i], "的Unicode编码：", hex(ord(name[i])))```输出结果为：```中文姓名：张三张的Unicode编码： 0x5f20 三的Unicode编码： 0x4e09 ```其中，...

Python求运算结果?1.”4”+”5” 2.”7”的Unicode编码是多少答：我的 Python求运算结果?1.”4”+”5” 2.”7”的Unicode编码是多少 1.”4”+”5”2.”7”的Unicode编码是多少3."中华人民共和国"[5]4.“123”.isnumeric()... 1.”4”+”5”2.”7”的Unicode编码是多少3."中华人民共和国"[5]4.“123”.isnumeric() 展开  我来答 1个回答 #热议# ...

python3.3中文乱码与默认编码格式设定。答：python 3和2很大区别就是python本身改为默认用unicode编码。字符串不再区分"abc"和u"abc", 字符串"abc"默认就是unicode，不再代表本地编码、由于有这种内部编码，像c#和java类似，再没有必要在语言环境内做类似设置编码，比如“sys.setdefaultencoding”;也因此也python 3的代码和包管理上打破了和2.x...

中国的汉字编码到底是多少?答：Unicode编码是 19968到40869 我们知道中文的正则范围为:[\u4e00-\u9fa5]，即从“\u4e00”到“\u9fa5”\u表示以Unicode的编码格式，使用在线Unicode转中文字符可以知道 \U4E00对应的汉字为“一”，而\u9fa5对应的汉字为“龥”再通过JavaScript的charCodeAt(0)方法转一下“一”和“龥”的对应ASCII值 ...

Python字符编码使用什么码?答：str1 = 'hello' # 默认使用 ASCII 编码 str2 = u'你好' # 使用 Unicode 编码 Python 3.x 字符编码在 Python 3.x 中，str 类型默认使用 Unicode 编码，即 Python 2.x 中的 Unicode 类型。Unicode 编码是一种支持全球范围内的字符集，能够表示几乎所有语言的字符，包括汉字、日文、希腊字母...

python3字符串都是什么编码答：汉字已经超出了ASCII编码的范围，用Unicode编码是十进制的20013，二进制的01001110 00101101。如果把ASCII编码的A用Unicode编码，只需要在前面补0就可以，因此，A的Unicode编码是00000000 01000001。新的问题又出现了：如果统一成Unicode编码，乱码问题从此消失了。但是，如果你写的文本基本上全部是英文的话，用...

大家正在搜

python2编码unicode python中unicode编码 python求unicode编码 python解码unicode python unicode转码汉字unicode编码范围 python unicode python转换unicode python中unicode函数