网页数据抓取用到的组件（[CPyUG] 抓取网页数据时遇到的中文编码问题）

时间2025-09-19 13:24:53分类IT科技浏览5658

导读：from __future__ import unicode_literals python2在windows环境中，由于系统内码是gbk，所以当有...

from __future__ import unicode_literals

python2在windows环境中，由于系统内码是gbk ，所以当有

# coding:utf-8

的时候，你要输出文字必须：

print u要输出的文字

否则就是乱码。这是因为默认字符串实际上是字节串，并非宽字符集。

from __future__ import unicode_literals

这句话的作用就是让默认字符串变成宽字符集，这样你可能会少进行一次转换，

有利于跨平台和实现py2与py3兼容。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

展开全文READ MORE