DataFrame
1. 获取行数 2. 获取列数 3. 获取列名列表 4. 循环打印输出值 5. 读取Excel表
示例数据import pandas as pd
inp = [{'a': 10, 'b': 100}, {'a': 20, 'b': 200}, {'a': 30, 'b': 300}]
df = pd.DataFrame(inp)
print(df)
a b
0 10 100
1 20 200
2 30 300
1、获取行数
print(df.shape[0])
print(len(df))
print(df.iloc[:,0].size)
2、获取列数
print(df.shape[1])
print(df.columns.size)
3、 获取列名列表
print(df.columns.values.tolist())
['a', 'b']
4、循环获取每一个值
for i in range(0, len(df)): # df.shape[0]表示行数也可以
for j in range(0, df.shape[1]):
print(df.iloc[i][j])
100
20
200
30
300
for i in range(0, len(df)): # df.shape[0]表示行数也可以
print(df.loc[i]['a'],df.loc[i]['b'])
print("*************************")
10 100
*************************
20 200
*************************
30 300
*************************
- iloc与loc的差别
- iloc,即index locate 用index索引进行定位,所以参数是整型,如:df.iloc[0, 1]
- loc,可以使用column名和index名进行定位,如: df.loc[‘image1, ‘age’]
xlsx_file = "data.xlsx"
df = pd.read_excel(xlsx_file,usecols=[0,1 ]) # 读取Excel表文件内容 选取第1,2列
得到的结果是DataFrame 数据,不需要再转化成DataFrame
Countries Total No. of cases
0 Laos 48
1 Tajikistan 13308
2 Kyrgyzstan 86818
3 New Zealand 2444
4 China 90087
5 Afghanistan 56103
6 Australia 29191
官方文档参考 [https://pandas.pydata.org/pandas-docs/stable/reference/frame.html]