您当前的位置: 首页 >  Python

搬砖python中~

暂无认证

  • 0浏览

    0关注

    95博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Python爬虫基础讲解:数据持久化——文件操作 及 Excel

搬砖python中~ 发布时间:2022-03-07 19:45:19 ,浏览量:0

计算机的文件,就是存储在某种长期储存设备上的一段数据长期存储设备包括:硬盘、U盘、移动硬盘、光盘…

文本文件和二进制文件

文本文件:

可以使用文本编辑软件查看o本质上还是二进制文件

例如: python的源程序

二进制文件:

保存的内容不是给人直接阅读的,而是提供给其他软件使用的。

例如:图片文件、音频文件、视频文件等等

二进制文件不能使用文本编辑软件查看

1. 文件的基本操作

操作文件的函数/方法

在Python中要操作文件需要记住1个函数和3个方法 在这里插入图片描述

  1. open函数负责打开文件,并且返回文件对象
  2. read / write/ close三个方法都需要通过文件对象来调用
1. 1读取文件
open

函数的第一个参数是要打开的文件名(文件名区分大小写)

  • 如果文件存在,返回文件操作对象
  • 如果文件不存在,会抛出异常
  • read方法可以一次性读入并返回文件的所有内容
  • close方法负责关闭文件 如果忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问

注意:read方法执行后,会把文件指针移动到文件的末尾

# 1.打开-文件名需要注意大小写
file = open("README")
 
#2.读取
text = file.read()
print(text)
 
#3.关闭
file.close()
1.2 打开文件的方式

open函数默认以只读方式打开文件,并且返回文件对象 语法如下:

f = open("文件名","访问方式")

在这里插入图片描述

提示

频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以只读、只写的方式来操作文件

写入文件示例

#打开文件
f = open ("README","w")
 
f.write( "he17o python! \n")
f.write("今天天气真好")
 
#关闭文件
f.close()
1.3按行读取文件内容

read()方法 默认会把文件的所有内容一次性读取到内存。如果文件太大,对内存的占用会非常严重。 readline方法 readline方法可以一次读取一行内容。方法执行后,会把文件指针移动到下一行,准备再次读取。这是读取大文件的正确姿势。

2. 目录操作

在终端/文件浏览器、中可以执行常规的文件/目录管理操作,例如:

创建、重命名、删除、改变路径、查看目录内容、…….

在Python中,如果希望通过程序实现上述功能,需要导入os模块

2.1 文件操作

在这里插入图片描述

2.2 目录操作

在这里插入图片描述 提示 : 文件或者目录操作都支持相对路径和绝对路径

Excel

openpyxl是一个Python库,用于读取/写入Excel 2010 xlsx / xlsm / xltx / xltm文件。

它的诞生是因为缺少可从Python本地读取/写入Office Open XML格式的库。

官方文档:

https://openpyxl.readthedocs.io/en/stable/

Excel文件三个对象
workbook:工作簿,一个exce1文件包含多个sheet。
sheet:工作表,一个workbook有多个,表名识别,如“sheet1","sheet2”等。
cel7:单元格,存储数据对象

1、openpyxl 读写单元格时,单元格的坐标位置起始值是(1,1),即下标最小值为1,否则报错!

2、openpyxl支持直接横纵坐标访问,如A1,B2…

#模块安装
pip insta1l openpyx7
1. 创建工作簿

只需导入workbook 对象就可以创建工作簿

#-*- coding: utf-8 -*-
from openpyx1 import workbook
# 创建工作簿
wb = workbook()

如果想写入数据就需要获取一张表

表明创建时会自动命名。它们按顺序编号(Sheet,Sheet1,Sheet2等)。可以随时通过worksheet.title属性更改此名称:

#创建一张表
sheet = wb.activesheet.title ='表1'
 
#创建新表
sheet2 = wb.create_sheet('表2 ')
 
#通过表名获取表
sheet1 = wb['表1']  
2. 写入操作

现在我们知道了如何获取工作表,可以开始修改单元格内容了。单元格可以直接作为工作表的键进行访问:

这将使单元格返回A4,如果尚未存在,则创建一个单元格。可以直接分配值:

#写入值
sheet[ 'A1']= 42

还有worksheet.ce11()方法可以更方便操作。

sheet.ce17 (row=2,column=5).value = 99
sheet.ce17 (row=3,column=5,value=100)

逐行写

#行内容可以直接被列表覆盖# ws.append(iterable)
#添加一行到当前sheet的最底部(即逐行追加从第一行开始)
# iterab1e必须是1ist,tuple,dict , range,generator类型的。
# 1,如果是1ist,将1ist从头到尾顺序添加。
# 2,如果是dict,按照相应的键添加相应的键值。
ws.append(['This is A1','This is B1', 'This is c1'])
ws.append(i 'A': 'This is A1','c': 'This is c1'})
ws.append({1: 'This is A1',3: 'This is c1'})

同时可以遍历单元格

3. 案例

将九九乘法表写入excel表

#写入九九乘法表
ws9 = wb.create_sheet('九九乘法表')
i = 1
while i             
关注
打赏
1662460581
查看更多评论
0.0412s