首页IT科技python通过链接下载文件(Python通过HTTP协议定期抓取文件)

python通过链接下载文件(Python通过HTTP协议定期抓取文件)

时间2025-06-16 14:16:09分类IT科技浏览5664
导读:分类: Python 2007-07-26 18:56 698人阅读 评论(1 收藏 举报 可以扩充成为简单的抓取工具 ...

分类:

Python

2007-07-26 18:56 698人阅读 评论(1) 收藏 举报
可以扩充成为简单的抓取工具             ,定时抓取
#!usr/bin/pythonimport

urllib2,time;

class

ErrorHandler(urllib2.HTTPDefaultErrorHandler):

def

http_error_default(self,req,fp,code,msg,headers):

result
=

urllib2.HTTPError(req.get_full_url(),code,msg,headers,fp)

result.status
=

code

return

result

URL
=http://www.ibm.com/developerworks/js/ajax1.jsreq=

urllib2.Request(URL)

mgr
=

urllib2.build_opener(ErrorHandler())

while

True:

ns
=

mgr.open(req)

if(ns.headers.has_key(last-modified

)):

modified
=ns.headers.get(last-modified

)

if(ns.code==304

):

print

==============================

NOTMODIFIED

==============================

elif(ns.code==200

):

print

ns.read()

else

:

printthereisanerror

;

if(notlocals().has_key(modified

)):

modified
=

time.time();

req.add_header(
If-Modified-Since

,modified)

time.sleep(
10)
声明:本站所有文章                     ,如无特殊说明或标注        ,均为本站原创发布               。任何个人或组织          ,在未征得本站同意时                    ,禁止复制             、盗用                     、采集        、发布本站内容到任何网站          、书籍等各类媒体平台                     。如若本站内容侵犯了原著者的合法权益            ,可联系我们进行处理      。

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
win11资源管理器不停的崩溃(Win11文件资源管理器总是崩溃怎么办? Win11资源管理器崩溃的原因) 网上快速挣钱的方法(如何网上快速赚钱-拯救一切不挣钱!如何网络创业快速赚钱???)