网页数据抓取用到的组件([CPyUG] 抓取网页数据时遇到的中文编码问题)
导读:from __future__ import unicode_literals python2在windows环境中,由于系统内码是gbk,所以当有...
from __future__ import unicode_literals
python2在windows环境中 ,由于系统内码是gbk ,所以当有
# coding:utf-8
的时候 ,你要输出文字必须:
print u要输出的文字
否则就是乱码 。这是因为默认字符串实际上是字节串 ,并非宽字符集 。
from __future__ import unicode_literals
这句话的作用就是让默认字符串变成宽字符集 ,这样你可能会少进行一次转换 ,
有利于跨平台和实现py2与py3兼容 。
声明:本站所有文章 ,如无特殊说明或标注 ,均为本站原创发布 。任何个人或组织 ,在未征得本站同意时 ,禁止复制 、盗用 、采集 、发布本站内容到任何网站 、书籍等各类媒体平台 。如若本站内容侵犯了原著者的合法权益 ,可联系我们进行处理 。
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!