python数据分析Numpy库的常用操作
numpy库的引入:
import numpy as np
1、numpy对象基础属性的查询
lst = [[1, 2, 3], [4, 5, 6]] def numpy_type(): print(type(lst)) data = np.array(lst, dtype=np.float64) # array将数组转为numpy的数组 # bool,int,int8,int16,int32,int64,int128,uint8,uint32, # uint64,uint128,float16/32/64,complex64/128 print(type(data)) # 数据类型 print(data.shape) # 几行几列 print(data.ndim) # 空间维数 print(data.dtype) # 元素类型 print(data.itemsize) # 元素所占字节 print(data.size) # 元素总数
2、numpy的数组的常用操作
def numpy_array(): # 输出2行4列的全0的numpy的array数组 print(np.zeros([2, 4])) # 一般用于数据初始化 # 输出3行5列的全1的numpy的array数组 print(np.ones([3, 5])) # 随机数 print(np.random.rand(2, 4)) # 生成2行4列的随机数矩阵,此时默认元素大小在0到1 print(np.random.rand()) # 打印一个随机数,此时默认元素大小在0到1 print(np.random.rand(1, 10, 3)) # 三个参数分别对应x、y、z轴,表示三维矩阵 # 与rand不同randint的三个参数表示范围[1,10)内的3个元素的一维数组 print(np.random.randint(1, 10, 3)) print(np.random.randint(1, 10)) # randint必须传入参数范围,这表示返回一个范围内的随机数 print(np.random.randn()) # 返回一个标准正态分布的随机数 print(np.random.randn(2, 4)) # 返回2行4列符合标准正态发布的随机数 print(np.random.choice([10, 2, 3, 1, 5, 6])) # 从可迭代数组中随机返回一个 print(np.random.beta(1, 10, 100)) # 随机生成[1,10]里符合beta发布的100元素的一维数组 lst1 = np.array([10, 20, 30, 40]) lst2 = np.array([4, 3, 2, 1]) # 直接操作 print(lst2 + lst1) print(lst2 - lst1) print(lst2 / lst1) print(lst2 * lst1) print(lst2 ** lst1) # 平方 # 点乘 print(np.dot(lst1.reshape([2, 2]), lst2.reshape([2, 2]))) # 追加 print(np.concatenate((lst2, lst1), axis=0)) # 0水平追加,1竖向追加 print(np.vstack((lst2, lst1))) # 竖向追加 print(np.hstack((lst2, lst1))) # 水平追加 # 分裂 print(np.split(lst2, 2)) # 分成2份 # 拷贝 print(np.copy(lst2))
3、numpy常用数据操作方法
def numpy_handle(): print(np.arange(1, 11)) # 生成[1,11)里的整数的一维数组,默认按1递增 print(np.arange(1, 11).reshape([2, 5])) # reshape方法可以将矩阵重构为x行y列的矩阵 print(np.arange(1, 11).reshape([2, -1])) # 也可以使用缺失值-1实现相同的效果 data = np.arange(1, 11).reshape([2, -1]) print(np.exp(data)) # 自然指数e的指数操作 print(np.exp2(data)) # 自然指数e的平方操作 print(np.sqrt(data)) # 开方操作 print(np.sin(data)) # 三角函数 print(np.log(data)) # 对数操作 print(data.max()) # 最大值 print(data.min()) # 最小值
4、numpy里axis的理解
def numpy_axis(): data = np.array([ [[1, 2, 3, 4], [5, 6, 7, 8]], [[9, 10, 11, 12], [13, 14, 15, 16]], [[17, 18, 19, 20], [20, 21, 22, 23]] ]) # axis从外而内的渗入,值越大渗透入层数越多,最大为n-1 # axis=0,表示从外而内n+1层,即1进行解析 print(data.sum(axis=2)) # 求和 #这里渗入了3层 print(data.max(axis=1)) # 获取最大值 print(data.min(axis=0)) # 获取最小值
5、numpy里常用的线性代数计算
这里记得引入依赖:
from numpy.linalg import * # 引入线性方程组的依赖
def numpy_line(): from numpy.linalg import * # 引入线性方程组的依赖 print(np.eye(3)) # 阶级为3的单位矩阵 lst3 = np.array([[1, 2], [3, 4]]) print(inv(lst3)) # 逆矩阵 print(lst3.transpose()) # 转置矩阵 print(det(lst3)) # 行列式 print(eig(lst3)) # 体征值和体征向量,第一个表示体征值,第二个表示体征向量 y = np.array([[5.], [7.]]) print(solve(lst3, y)) # 求解线性矩阵方程
了解更多参考官方手册:NumPy 参考手册 | NumPy 中文
到此这篇关于python数据分析Numpy库的常用操作的文章就介绍到这了,更多相关python数据分析 Numpy库内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
赞 (0)