其实Python3的字符串默认是unicode格式了,但utf-8并不能解决所有问题。首先,我们得在所有的文件前加上这样一句:
# -_- coding:utf-8 -_-
或者
# coding: utf-8
其次,就是注意一般的常见的编码格式,爬去某些奇葩的网页时可能会遇到的,这时候只需要使用对应的转换进行了,如果不知道网页的格式就只能一个一个猜了,常见的有
ASCII
GB18030
GB2312
GBK
UTF-8 其实Python3的字符串默认是unicode格式了,但utf-8并不能解决所有问题。首先,我们得在所有的文件前加上这样一句:
# -_- coding:utf-8 -_-
或者
# coding: utf-8
其次,就是注意一般的常见的编码格式,爬去某些奇葩的网页时可能会遇到的,这时候只需要使用对应的转换进行了,如果不知道网页的格式就只能一个一个猜了,常见的有
ASCII
GB18030
GB2312
GBK
UTF-8
评论 · Comments
评论由 Giscus 提供,需用 GitHub 账号登录;留言会同步到这个仓库的 Discussions 里。