Home / Blog / 后端
Tech · 后端 · Python

Python编码格式各种问题的解决方案

H by Haofly
· 2015-04-07 · 18 views

其实Python3的字符串默认是unicode格式了,但utf-8并不能解决所有问题。首先,我们得在所有的文件前加上这样一句:

# -_- coding:utf-8 -_-
或者

# coding: utf-8

其次,就是注意一般的常见的编码格式,爬去某些奇葩的网页时可能会遇到的,这时候只需要使用对应的转换进行了,如果不知道网页的格式就只能一个一个猜了,常见的有

ASCII
GB18030
GB2312
GBK
UTF-8
Haofly · 豪翔天下 · 2015-04-07

评论 · Comments

评论由 Giscus 提供,需用 GitHub 账号登录;留言会同步到这个仓库的 Discussions 里。