python2 中 unicode encode decode 发表于 2018-08-29 | python2 中 unicode encode decode utf8unicode unicode 相当于 code point(0-0x10ffff的整数). unicode编码的缺点:浪费空间(每个字符对应32-bit) utf8编码的优点: 能处理所有unicode code point 节省空间,去掉了0字节 ASCII字符串也是有效的UTF8字符串 如果字节丢失,容易找到下一个code point 1234567# pythona = "我们" # utf8 编码的字符串a_unicode = a.decode("utf8") # decode 为 unicodeassert a_unicode == u"我们"b = a_unicode.encode("utf8") # encode utf8 还原assert a==b