文章目录
一、了解nump
- 一、了解nump
- 二、numpy的基本属性
- 三、numpy中数组的多种创建方法
- 1.array()
- 2.arang(),等差数列
- 3.linspace(),等差数列
- 4.logspace(),等比数列
- 5.zeros()和ones(),占位数组
- 6.empty()
- 7.eye(),单位矩阵
- 8.diag(),对角矩阵
- 四、常见的4个numpy的随机生成数组方法
- 五、数组的变换
- 1.shape和reshape()
- 2.展平数组:ravel()和flatten()
- 3.ravel 和 flatten 区别(面试题)
- 4.组合数组:hstack和vstack
- 5.组合函数:concatenate()函数和轴
- 六、数组的访问---通过索引
- 1.访问一维数组
- 2.访问二维数组
- 3.遮罩mask
- 七、numpy中的数据类型和自定义数据类型
1.特点
- numpy的主要对象是同种元素的多维数组
- numpy底层是用C实现
- python执行效率低,编程效率高
2.面试题:数组和列表的区别
数组和列表结构相似,用法有些区别,比如数组存储的是相同类型的数据,执行速度较快。但是列表可以存储其他类型的数据,甚至可以嵌套字典列表等,因此处理的时候较慢,再加上python语言本身执行效率比编译型语言运行慢,所以列表比字典执行效率低。
二、numpy的基本属性 属性作用arr1.shape数组的维度arr1.ndim数组的秩,也是求出的维度的长度arr1.size数组元素的总个数arr1.dtype数组的类型(int32,int64,float32等)arr3.itemsize每个元素的字节大小(字节byte--------位bit(8byte=1bit))arr1.data缓冲区data举例:
import numpy as np
# ------------------------------------一维数组
a1 = np.array([1, 2, 3, 4, 5])
print('a1的维度:', a1.shape) # a1的维度: (5,)
print('a1的秩求法1:', a1.ndim) # a1的秩求法1: 1
print('a1的秩求法2:', len(a1.shape)) # a1的秩求法2: 1
print('a1的数组元素个数:', a1.size) # a1的数组元素个数: 5
print('a1的缓存区:', a1.data) # a1的缓存区:
print('a1的元素类型:', a1.dtype) # a1的元素类型: int32
print('a1的字节大小:', a1.itemsize) # a1的字节大小: 4
# ------------------------------------多维数组
a2 = np.array([(1, 2, 3), (4, 5, 6), (7, 8, 9)])
print('a2的维度:', a2.shape) # a2的维度: (3, 3)
print('a2的秩求法1:', a2.ndim) # a2的秩求法1: 2
print('a2的秩求法2:', len(a2.shape)) # a2的秩求法2: 2
print('a2的数组元素个数:', a2.size) # a2的数组元素个数: 9
print('a2的缓存区:', a2.data) # a2的缓存区:
print('a2的元素类型:', a2.dtype) # a2的元素类型: int32
print('a2的字节大小:', a2.itemsize) # a2的字节大小: 4
注意:numpy中的一维数组的shape理解
- 上述一维数组维度(5,),意思是一维数组,数组中有五个元素
- 上述二维数组维度(3,3),意思是二维数组,每个维度中三个元素
注意:
- ①在创建多维数组的时候,[ ]和( )均可以
- ②切记数组中的类型是相同的
# 不指定数组类型
print(np.array([1, 2, 3]))
print(np.array([[1, 2, 3], [4, 5, 6]]))
print(np.array([(1, 2, 3), (4, 5, 6)]))
'''
结果:
[1 2 3]
[[1 2 3]
[4 5 6]]
[[1 2 3]
[4 5 6]]
'''
#指定数据类型
print(np.array([1,2,3],dtype=np.float64)) # [ 1. 2. 3.]
2.arang(),等差数列
通过指定开始值、终值和步长创建表示等差数列的一维数组,注意得到的结果数组不包含终值。
# 创建一个start开始,stop结尾,步长为step的数组
arange(start=None, stop=None, step=None, dtype=None)
参数说明:
- start 起始数字,stop 终止数字。
- 左闭右开。
- step 步长,dtype类型
import numpy as np
print(np.arange(3, 9)) # 默认步长为1 [3 4 5 6 7 8]
print(np.arange(1.1, 1.9, 0.1)) # [ 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8]
3.linspace(),等差数列
通过指定开始值、终值和元素个数创建表示等差数列的一维数组,可以通过endpoint参数指定是否包含终值,默认值为True,即包含终值。
linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
参数介绍:
- start 起始数字,stop 终止数字。
- num 在范围内生成的数组的个数
- 左闭右闭。
import numpy as np
print(np.linspace(1, 10, 10))
# [ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
#默认是小数
4.logspace(),等比数列
返回在对数刻度上均匀间隔的数字;即可以通过np.logspace方法创建等比数列数组。
logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)
参数介绍:
- start 起始数字,stop 终止数字,num数量
- 左闭右闭
arr6 = np.logspace(1, 3, 3) # 从1次开始到3次结束,数量3个,以十开始的等比数列
print(arr6) # [ 10. 100. 1000.]
arr7 = np.logspace(1, 3, 3, base=2)
print(arr7) # [ 2. 4. 8.]
5.zeros()和ones(),占位数组
zeros(shape, dtype=None, order='C')
ones(shape, dtype=None, order='C')
参数介绍:
- 几位几列,通常传入一个数组,例如两行三列(2,3)
# zeros()使用0进行占位的数组,ones用法相同
np.zeros((2, 3))
'''
[[ 0. 0. 0.]
[ 0. 0. 0.]]
'''
np.zeros(5)
'''
[ 0. 0. 0. 0. 0.]
'''
6.empty()
创建一个内容随机且依赖于内存状态的数组,根据给定的维度和数值类型返回一个新的数组,其元素不进行初始化。
empty(shape, dtype=None, order='C')
参数介绍:
- 几位几列,通常传入一个数组,例如两行三列(2,3)
np.empty((2, 3))
'''
结果:
[[ 2.47032823e-322 0.00000000e+000 0.00000000e+000]
[ 0.00000000e+000 0.00000000e+000 0.00000000e+000]]
'''
7.eye(),单位矩阵
np.eye(3) # 生成3阶单位矩阵
'''
[[ 1. 0. 0.]
[ 0. 1. 0.]
[ 0. 0. 1.]]
'''
8.diag(),对角矩阵
np.diag([1,2,3,4])
'''
结果:
[[1 0 0 0]
[0 2 0 0]
[0 0 3 0]
[0 0 0 4]]
'''
四、常见的4个numpy的随机生成数组方法
随机生成数组的函数作用np.random.random(n)生成0,1范围的数组,n为元素个数,左闭右开np.random.rand(m,n)生成0,1范围的数组,形状为m*n,左闭右开np.random.randn(n)生成正太形式的随机数组,n为元素个数np.random.randint(m,n,size)生成m,n范围的数组,形状为size(传入元组形式的shape)
1.random.random(n)#[0,1),n为元素个数
import numpy as np
arr1 = np.random.random(3)
print(arr1)
arr2 = np.random.random(15).reshape((3, 5)) # 三行五列
print(arr2)
2.random.rand(m,n)-------生成m*n的数组,前闭后开[0,1)
print(np.random.rand(2,3))
3.random.randn(n)-------生成正太的随机数,n为数量
arr4 = np.random.randn(20000)
# 画图模块查看正太分布
import matplotlib.pyplot as plt
plt.hist(arr4)
plt.show()
4.random.randint()#左闭右闭
print(np.random.randint(2, 33, size=(2, 5)))# 从2,33,随机生成一个两行五列
- shape属性可以求出几维数组,返回的是一个元组(行,列),也可以单独设置shape,这样会将shape的值重新规划
- reshape可以重新规划数组
a1 = np.array([1, 2, 3, 4, 5, 6])
print(a1.shape)
a1.shape = (2, 3)
print(a1)
a2 = np.array([1, 2, 3, 4, 5, 6]).reshape((2, 3))
print(a2)
①ravel()
arr1 = np.arange(10000)
arr2 = arr1.reshape((100, 100))
arr3 = arr2.ravel()
print(arr1)
print(arr2)
print(arr3)
# 当numpy数据太大的时候,中间会用...省略,但是我们非要看中间的,需要设置
np.set_printoptions(threshold=np.NAN)
print(arr1)
②flatten()
arr1 = np.arange(10).reshape((2, 5))
arr2 = arr1.flatten()
arr3 = arr1.ravel()
print(arr1)
print(arr2)
print(arr3)
- 共同点: 都可将多维数组降为一维数组
- 区别: ①拷贝copy:强调的是数据–使用flatten返回的是一份拷贝,类似深拷贝 ②视图view:侧重的是数据的展现,而不是数据的本身–使用ravel返回的是一份视图,类似浅拷贝
a1 = np.array([[1, 2], [3, 4]])
f_a = a1.flatten() #
r_a = a1.ravel()
print(a1)
print(f_a) # [1 2 3 4]
print(r_a) # [1 2 3 4]
a1[1][1] = 1111
print('--------------------类似深拷贝,自己或者原数组改变,不会影响对方----------')
f_a[2] = 100
print(f_a) # [ 1 2 100 4]
print(a1) # 不变
print('---------------------类似浅拷贝,自己或者原数组改变,会互相改变--------')
r_a[2] = 100
print(r_a) # [ 1 2 100 1111]
print(a1) # 变化
一维数组: hstack和vstack
arr1 = np.arange(1, 6, 2) # [1 3 5]
arr2 = np.arange(7, 12, 2) # [ 7 9 11]
arr3 = np.hstack((arr1, arr2)) # 横行拼接
arr4 = np.vstack((arr1, arr2)) # 纵向拼接
print(arr3)
print(arr4)
二维数组: hstack和vstack
# 二维数组
arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
arr3 = np.hstack((arr1, arr2)) # 横行拼接
arr4 = np.vstack((arr1, arr2)) # 纵向拼接
print(arr3)
print(arr4)
注意:
- 长度不相同的两个数组,无法纵向拼接会报错
- 在stack中,参数为列表或者数组
arr1 = np.array([[1, 1], [2, 2]])
arr2 = np.array([[3, 3], [4, 4]])
print(np.concatenate((arr1, arr2), axis=0)) # 和vstack效果相同
print(np.concatenate((arr1, arr2), axis=1)) # 和hstack效果相同
arr1 = np.arange(10)
print(arr1[3]) # 3
print(arr1[2:6]) # [2 3 4 5]
print(arr1[:2]) # [0 1]
print(arr1[::-1]) # [9 8 7 6 5 4 3 2 1 0]
arr1[2:4] = 111, 111
print(arr1)#[ 0 1 111 111 4 5 6 7 8 9]
2.访问二维数组
arr2 = np.array([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]])
print(arr2)
# 拿出第一行的第三个和第四个数据
print(arr2[0][2:])
print(arr2[0, 2:])
arr3 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 取出1,3行的所有数据
print(arr3[(0, 2), :])
# 对于自定义类型的多维数组,可以采取键名拿数据
df = np.dtype([('name', np.str_, 40), ('numitems', np.int64), ('price', np.float64)])
print('df数据结构为:', df) # [('name', '
关注
打赏
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?