Python编码格式各种问题的解决方案

其实Python3的字符串默认是unicode格式了,但utf-8并不能解决所有问题。首先,我们得在所有的文件前加上这样一句:

# -_- coding:utf-8 -_-
或者




# coding: utf-8

其次,就是注意一般的常见的编码格式,爬去某些奇葩的网页时可能会遇到的,这时候只需要使用对应的转换进行了,如果不知道网页的格式就只能一个一个猜了,常见的有

ASCII
GB18030
GB2312
GBK
UTF-8