首页IT科技python通过链接下载文件(Python通过HTTP协议定期抓取文件)

python通过链接下载文件(Python通过HTTP协议定期抓取文件)

时间2025-05-04 13:58:39分类IT科技浏览4964
导读:分类: Python 2007-07-26 18:56 698人阅读 评论(1 收藏 举报 可以扩充成为简单的抓取工具 ...

分类:

Python

2007-07-26 18:56 698人阅读 评论(1) 收藏 举报
可以扩充成为简单的抓取工具             ,定时抓取
#!usr/bin/pythonimport

urllib2,time;

class

ErrorHandler(urllib2.HTTPDefaultErrorHandler):

def

http_error_default(self,req,fp,code,msg,headers):

result
=

urllib2.HTTPError(req.get_full_url(),code,msg,headers,fp)

result.status
=

code

return

result

URL
=http://www.ibm.com/developerworks/js/ajax1.jsreq=

urllib2.Request(URL)

mgr
=

urllib2.build_opener(ErrorHandler())

while

True:

ns
=

mgr.open(req)

if(ns.headers.has_key(last-modified

)):

modified
=ns.headers.get(last-modified

)

if(ns.code==304

):

print

==============================

NOTMODIFIED

==============================

elif(ns.code==200

):

print

ns.read()

else

:

printthereisanerror

;

if(notlocals().has_key(modified

)):

modified
=

time.time();

req.add_header(
If-Modified-Since

,modified)

time.sleep(
10)
声明:本站所有文章                  ,如无特殊说明或标注      ,均为本站原创发布            。任何个人或组织          ,在未征得本站同意时                  ,禁止复制             、盗用                  、采集      、发布本站内容到任何网站          、书籍等各类媒体平台                   。如若本站内容侵犯了原著者的合法权益         ,可联系我们进行处理      。

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
eslint报错怎么解决(vue项目中ESLint配置)