哈喽兄弟们 ,今天咱们来了解一下 fileinput 。
说到fileinput ,可能90%的码农表示没用过,甚至没有听说过 。
这不奇怪 ,因为在python界 ,既然open可以走天下 ,何必要fileinput呢?
但是 ,今天我还是要介绍fileinput这个方法 ,因为太奈斯了。
接下来 ,就跟着我 ,一起fileinput ,对 ,就是这个feel 。
正文
1 、方法介绍
fileinput.filename():返回当前被读取的文件名 。
—>在第一行被读取之前,返回 None 。
fileinput.fileno():返回以整数表示的当前文件“文件描述符
” 。
—>当未打开文件时(处在第一行和文件之间) ,返回 -1 。
fileinput.lineno():返回已被读取的累计行号 。
—>在第一行被读取之前 ,返回 0 。在最后一个文件的最后一行被读取之后,返回该行的行号 。
fileinput.filelineno():返回当前文件中的行号。
—>在第一行被读取之前 ,返回 0 。
—>在最后一个文件的最后一行被读取之后 ,返回此文件中该行的行号 。
fileinput.isfirstline():如果刚读取的行是其所在文件的第一行则返回 True,否则返回 False。
fileinput.isstdin():如果最后读取的行来自 sys.stdin 则返回 True ,否则返回 False 。
fileinput.nextfile():关闭当前文件以使下次迭代将从下一个文件(如果存在)读取第一行;不是从该文件读取的行将不会被计入累计行数 。直到下一个文件的第一行被读取之后文件名才会改变。
—>在第一行被读取之前 ,此函数将不会生效;它不能被用来跳过第一个文件 。
—>在最后一个文件的最后一行被读取之后 ,此函数将不再生效 。
fileinput.close():关闭序列 。
2 、 默认读取
import fileinput
当 Python 脚本没有传入任何参数时 ,fileinput 默认会以 stdin 作为输入源
for line in fileinput.input():
print(f{line})
你输入的内容 ,程序都会读取并再输出 。
俗称:复读机
3 、处理一个文件
import fileinput
files 输入打开文件的名称即可
with fileinput.input(files=(output.txt,)) as file:
for line in file:
print(f{fileinput.filename()} 第{fileinput.lineno()}行:{line},end=)
fileinput 有且仅有这两种读取模式:‘r’ ,‘rb’;
fileinput.input() 默认使用 mode=‘r’ 的模式读取文件 ,如果你的文件是二进制的 ,可以使用mode=‘rb’ 模式 。
4 、处理批量文件
fileinput.lineno()方法
import fileinput
files 输入打开文件的名称即可
with fileinput.input(files=(output.txt,input.txt)) as file:
for line in file:
#fileinput.lineno() 把两个文件的整合陈一个文件对象file ,需要排序输出
print(f{fileinput.filename()} 第{fileinput.lineno()}行: {line}, end=)
# fileinput.filelineno()两个文件单独读取,需要单独排序
print(f{fileinput.filename()} 第{fileinput.filelineno()}行: {line}, end=)
fileinput.filelineno()方法
import fileinput
files 输入打开文件的名称即可
with fileinput.input(files=(test1.txt,test2.txt)) as file:
for line in file:
# fileinput.filelineno()两个文件单独读取 ,需要单独排序
print(f{fileinput.filename()} 第{fileinput.filelineno()}行: {line}, end=)
在颜值的时代 ,上面的输出样式,已经无法满足我们的需要了 ,于是乎 ,我们就想到了glob 。
import fileinput
import glob
#glob 匹配te开头的txt文件
for line in fileinput.input(glob.glob("te*.txt")):
if fileinput.isfirstline():
#输出读取文件
print(=*10,f读取文件{fileinput.filename()},=*10)
#fileinput.filelineno()方法读取
print(str(fileinput.filelineno())+ :+line.upper(),end=)
5 、读取与备份
fileinput.input 的backup 参数 ,可以指定备份的后缀名 ,比如 .bak
import fileinput
#触发backup的动作 ,源文件内容被修改 ,对源文件进行backup
with fileinput.input(files=("test1.txt",), backup=".bak",inplace=1) as file:
for line in file:
print(line.rstrip().replace(111111, 222222))
print(f{fileinput.filename()} 第{fileinput.lineno()}行: {line}, end=)
上面的例子 , 用到了 inplace参数 ,表示是否将标准输出的结果写回文件 ,默认不取代 。
import fileinput
#触发backup的动作 ,源文件内容被修改 ,对源文件进行backup
with fileinput.input(files=("test2.txt",), inplace=True) as file:
print("[INFO] task is started...")
for line in file:
print(f{fileinput.filename()} 第{fileinput.lineno()}行: {line}, end=)
print("[INFO] task is closed...")
在 for 循环体内的 print 内容会写回到原文件中了 。
而在 for 循环体外的 print 则没有变化。
7 、进阶
在 fileinput.input() 中有一个 openhook 的参数 ,它支持用户传入自定义的对象读取方法;
如果没有传入任何勾子 ,fileinput 默认使用的是 open 函数;
1 、fileinput.hook_compressed(filename, mode)
使用 gzip 和 bz2 模块透明地打开 gzip 和 bzip2
压缩的文件(通过扩展名 ‘.gz’ 和 ‘.bz2’ 来识别);
如果文件扩展名不是 ‘.gz’ 或 ‘.bz2’,文件会以正常方式打开(即使用 open() 并且不带任何解压操作);
使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_compressed)
2 、fileinput.hook_encoded(encoding, errors=None)
返回一个通过 open() 打开每个文件的钩子 ,使用给定的 encoding 和 errors 来读取文件 。
使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_encoded(“utf-8 ”, “surrogateescape”))
假如我想要使用 fileinput 来读取网络上的文件 ,思路:
先使用 requests 下载文件到本地
再使用 open 去读取它;
def online_open(url, mode):
import requests
r = requests.get(url)
filename = url.split("/")[-1]
with open(filename,w) as f1:
f1.write(r.content.decode("utf-8"))
f2 = open(filename,r)
return f2
import fileinput
file_url = https://www.csdn.net/robots.txt
with fileinput.input(files=(file_url,), openhook=online_open) as file:
for line in file:
print(line, end="")
def online_open(url, mode):
import requests
r = requests.get(url)
filename = url.split("/")[-1]
with open(filename,w) as f1:
f1.write(r.content.decode("utf-8"))
f2 = open(filename,r)
return f2
import fileinput
file_url = https://www.csdn.net/robots.txt
with fileinput.input(files=(file_url,), openhook=online_open) as file:
for line in file:
print(line, end="")
# Python学习交流群 279199867
总结
fileinput本身是对 open 函数的再次封装 ,所以在读取的cc部分 ,就比open显得更专业 ,更优雅 ,这也是仅限于读取的方面。
在写的方面 ,相对于open ,就不是那么的强悍 。
归根结底 ,fileinput还是一个不错的方法 。值得你拥有。
最后 ,再给大家推荐一套Python爬虫教程:代码总是学完就忘记?100个爬虫实战项目!让你沉迷学习丨学以致用丨下一个Python大神就是你!
声明:本站所有文章 ,如无特殊说明或标注,均为本站原创发布 。任何个人或组织 ,在未征得本站同意时 ,禁止复制、盗用 、采集 、发布本站内容到任何网站、书籍等各类媒体平台 。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理 。