python数学建模(SciPy+ Numpy+Pandas)

目录
  • 前言
  • SciPy 学习
    • SciPy基本操作
      • 1-求解非线性方程(组)
      • 2-积分
      • 3-最小二乘解
      • 4-最大模特征值及对应的特征向量
  • Numpy学习(续)
    • 1 Numpy 数学函数
      • 1-1三角函数
    • 2-舍入函数
      • 2-1 numpy.around()
      • 2-2 numpy.floor()
      • 2-3 numpy.ceil()
    • 3 Numpy算术函数
  • Pandas学习(续)
  • Pandas 数据排序
  • DataFrame的排序
  • Pandas字符串处理

前言

SciPy 是一个开源的 Python 算法库和数学工具包, Scipy 是基于 Numpy 的科学计算库,用于数学、科学、工程学等领域。
SciPy库依赖于NumPy,它提供了便捷且快速的N维数组操作。
SciPy库的构建与NumPy数组一起工作,并提供了许多用户友好和高效的数字实践,
并在天文学、生物学、气象学和气候科学,以及材料科学等多个学科得到了广泛应用。
NumPy和SciPy易于使用,强大到足以依靠世界上一些顶尖的科学家和工程师。

SciPy 学习

'''
SciPy 包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、
信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
'''
# 安装scipy库:
# SciPy终端安装命令:pip install SciPy
# https://www.runoob.com/w3cnote/python-pip-install-usage.html  Python pip 安装与使用
# 查看scipy版本:
import scipy
print(scipy.__version__)
# SciPy模块功能表
'''
模块              功能
scipy.cluster   聚类分析等
scipy.constants 物理和数学函数
scipy.fftpack   傅里叶变换
scipy.integrate 积分
scipy.interpolate   插值
scipy.io        数据输入和输出
scipy.linalg    线性代数
scipy.ndimage   n维图像
scipy.odr       正交距离回归
scipy.optimize  优化
scipy.signal    信号处理
scipy.sparse    稀疏矩阵
scipy.spatial   空间数据结构和算法
scipy.special   特殊函数
scipy.stats     统计
'''
# 使用 dir() 函数来查看 constants 模块包含的常量:
from scipy import constants
print(dir(constants))
'''
单位类型
常量模块包含以下几种单位:
公制单位
二进制,以字节为单位
质量单位
角度换算
时间单位
长度单位
压强单位
体积单位
速度单位
温度单位
能量单位
功率单位
力学单位
'''
print()
# SciPy 常量模块:
# constants 是 scipy 的常量模块
from scipy import constants
# 查看一英亩等于多少平方米:
print(constants.acre)   # 输出 4046.8564223999992
# SciPy 常量模块 constants 提供了许多内置的数学常数
# 圆周率:  pi
# 黄金比例: golden
from scipy import constants
print(constants.pi)         # 输出 3.141592653589793 【圆周率】
print(constants.golden)     # 输出 1.618033988749895 【黄金比例】

SciPy基本操作

1-求解非线性方程(组)

1-1

解题代码如下:

# scipy.optimize模块的fsolve和root可求非线性方程(组)的解
# 格式:
from scipy.optimize import fsolve
from scipy.optimize import root
# fsolve或root求解非线性方程组时,先把非线性方程组写成 F(x)=0 这样的形式【x:向量;F(x):向量函数】
fx = lambda x: x**980-5.01*x**979-3.388*x**977\
    +7.398*x**978-x**3+5.01*x**2-7.398*x+3.388
x1 = fsolve(fx, 1.5, maxfev=420)     # 函数调用420次【调用小了,会报警告】
x2 = root(fx, 1.5)
print(x1)   # 相当于答案
print()
print(x2)   # 相当于解题过程

运行x1、x2结果如下:

1-2

解题代码如下:

from scipy.optimize import fsolve, root
fs2 = lambda s: [s[0]**2+s[1]**2-1, s[0]-s[1]]
s1 = fsolve(fs2, [1, 1])
print()
s2 = root(fs2, [1, 1])
print(s1)	# 输出 [0.70710678 0.70710678]
print()
print(s2)

运行s2效果如下:

2-积分

scipy.integrate模块提供了多种积分模式。

积分主要分为以下两类:

  • 对给定函数的数值积分
  • 对给定离散点的数值积分,函数有trapz

题目:

'''
函数                                              说明
quad(func, a, b, args)                      计算一重数值积分
dblquad(func, a, b, gfun, hfun, args)       计算二重数值积分
tplquad(func, a, b, gfun, hfun, qfun, rfun) 计算三重数值积分
nquad(func, ranges, args)                   计算多变量积分
'''
from scipy.integrate import quad

def func(x, a, b):
    return a*x**2+b*x
z1 = quad(func, 0, 1, args=(2, 1))
z2 = quad(func, 0, 1, args=(2, 10))
print(z1)   # 输出 (1.1666666666666665, 1.2952601953960159e-14)
print(z2)   # 输出 (5.666666666666667, 6.291263806209221e-14)
# 注:输出的后一个值为积分值的绝对误差

3-最小二乘解

# 最小二乘解
# scipy.optimize 模块求非线性方程组最小二乘解格式:
'''
from scipy.optimize import least_squares
least_squares(fun, x0)
注:用到loadtxt需自行准备好文件【准备文件】
'''
from scipy.optimize import least_squares
import numpy as np
s = np.loadtxt('data.txt')
x0 = s[0]
y0 = s[1]
d = s[2]
fs = lambda x: np.sqrt((x0-s[0])**2+(y0-s[1])**2-d)
xc = least_squares(fs, np.random.rand(2))
print(xc)
print()
print(xc.s)

4-最大模特征值及对应的特征向量

题目:

# 4-最大模特征值及对应的特征向量
# 题目描述:求下列矩阵的最大模特征值及对应的特征向量:
from scipy.sparse.linalg import eigs
import numpy as np
m = np.array([
    [1, 2, 3],
    [2, 1, 3],
    [3, 3, 6]
], dtype=float)
a, b = np.linalg.eig(m)
c, d = eigs(m, 1)
print('最大模特征值为:', c)    # 输出 最大模特征值为: [9.+0.j]
print('对应的特征向量:\n', d)

运行结果如下:

Numpy学习(续)

# NumPy 广播(Broadcast)
# 广播是 numpy 对不同形状的数组进行数值计算的方式, 对数组的算术运算通常在相应的元素上进行。

# 如果两个数组 a 和 b 形状相同,即满足 a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘。
# 这要求维数相同,且各维度的长度相同。
'''
对两个数组,分别比较他们的每一个维度(若其中一个数组没有当前维度则忽略),满足:
数组拥有相同形状。
当前维度的值相等。
当前维度的值有一个是 1。
若条件不满足,抛出 "ValueError: frames are not aligned" 异常

'''
import numpy as np
a = np.array([3, 6, 9])
b = np.array([2, 4, 6])
c = a * b
print(c)    # 输出 [ 6 24 54]
# 若形状不同时,numpy 将自动触发广播机制
import numpy as np
x = np.array([
    [4, 2, 5],
    [5, 2, 0],
    [2, 6, 1],
    [1, 4, 5]
])
y = np.array([3, 1, 2])
print(x+y)
yy = np.tile(y, (4, 1))     # 重复b的各个维度
print(x+yy)

1 Numpy 数学函数

1-1三角函数

# NumPy 数学函数
# NumPy 包含大量的各种数学运算的函数,包括三角函数,算术运算的函数,复数处理函数等。

# 1-三角函数
# NumPy 提供了标准的三角函数:sin()、cos()、tan()。
import numpy as np

lxw = np.array([0, 30, 45, 60, 90])

# sin()
zx = np.sin(lxw*np.pi/180)
print(zx)
# 计算角度的反正弦【单位:弧度】
fzx = np.arcsin(zx)
print(fzx)
# 检查结果【通过转化为角度制】
jg = np.degrees(fzx)
print(jg)   # 输出 [ 0. 30. 45. 60. 90.]
# cos()
yx = np.cos(lxw*np.pi/180)
print(yx)
# 反余弦
fyx = np.arccos(yx)
print(fyx)
# 检查结果:
jg2 = np.degrees(fyx)
print(jg2)  # 输出 [ 0. 30. 45. 60. 90.]
# tan()
zq = np.tan(lxw*np.pi/180)
print(zq)

# 反正切
fzq = np.arctan(zq)
print(fzq)
# 检查结果:
jg3 = np.degrees(fzq)
print(jg3)  # 输出 [ 0. 30. 45. 60. 90.]

2-舍入函数

2-1 numpy.around()

# 2-舍入函数
# 2-1 numpy.around()
'''
numpy.around() 函数返回指定数字的四舍五入值。
格式:
numpy.around(a,decimals)
参数说明:
a: 数组
decimals: 舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置

'''
import numpy as np
bl = np.array([15.222, 22.6555, 13.71111])
print(np.around(bl))        # 输出 [15. 23. 14.]
print(np.around(bl, 2))     # 输出 [15.22 22.66 13.71]
print(np.around(bl, -1))    # 输出 [20. 20. 10.]

2-2 numpy.floor()

# 2-2 numpy.floor()
# numpy.floor() 返回小于或者等于指定表达式的最大整数,即向下取整
import numpy as np
xx = np.array([23.3, 13.43, 2.9])
print(np.floor(xx))     # 输出 [23. 13.  2.]

2-3 numpy.ceil()

# 2-3 numpy.ceil()
# numpy.ceil() 返回大于或者等于指定表达式的最小整数,即向上取整
import numpy as np
xs = np.array([23.1, 23.5, 54.9])
print(np.ceil(xs))      # 输出 [24. 24. 55.]

3 Numpy算术函数

NumPy 算术函数包含简单的加减乘除: add(),subtract(),multiply() 和 divide()

  • 倒数:reciprocal()
  • 幂:power()
  • 余数:mod() | remainder()

:数组必须具有相同的形状符合数组广播规则

相关代码如下:

import numpy as np
sz = np.arange(9, dtype=np.float_).reshape(3, 3)
sz2 = np.array([5, 2, 1])   # 注:如果相除,这里是被除数的话,里面不能有0
# 数组相加
xj = np.add(sz, sz2)
print(xj)
# 数组相减
xj2 = np.subtract(sz, sz2)
print(xj2)
# 数组相乘
xc = np.multiply(sz, sz2)
print(xc)
# 数组相除
xc2 = np.divide(sz, sz2)
print(xc2)
print()
# numpy.power()
# numpy.power() 函数将第一个输入数组中的元素作为底数,计算它与第二个输入数组中相应元素的幂
import numpy as np
m = np.array([1, 4, 8])     # 数组1
mc = np.power(m, 3)         # 数组1所有元素对应的3次方
print(mc)   # 输出 [  1  64 512]
m2 = np.array([1, 2, 3])    # 数组2
mc2 = np.power(m, m2)       # 数组1作为底数,数组2作为幂
print(mc2)  # 输出 [  1  16 512]
print()
# numpy.mod()
# numpy.mod() 计算输入数组中相应元素的相除后的余数
# 函数 numpy.remainder() 也产生相同的结果
import numpy as np
sz1 = np.array([23, 45, 67])
sz2 = np.array([2, 3, 5])
print(np.mod(sz1, sz2))         # 输出 [1 0 2]
print(np.remainder(sz1, sz2))   # 输出 [1 0 2]

Pandas学习(续)

# pandas的SettingWithCopyWarning

# pandas的SettingWithCopyWarning报警复现、原因、解决方案
# 读取数据
import pandas as pd
df = pd.read_csv('nba.csv')
print(df.head())
# 核心解决问题:pandas的dataframe的修改写操作,只允许在源dataframe上进行,一步到位
# 解决方法(两种):
'''
1-将get+set的两步操作,改成set的一步操作
2-若须处理筛选数据做后续的处理分析,使用copy复制dataframe

'''
# pandas不允许先筛选子dataframe,在进行修改写入

注意先准备好csv文件

Pandas 数据排序

Series的排序:

# Pandas 数据排序
'''
Series的排序:
Series.sort_values(ascending=True, inplace=False)
参数说明:
    · ascending: 默认为True升序排序,False为False
    · inplace:   是否修改原始Series

DataFrame的排序:
DataFrame.sort_values(by, ascending=True, inplace=False)
参数说明:
    · by:字符串或者List<字符串>,单列排序或者多列排序
    · ascending: bool或者List,升序还是降序
    · inplace:   是否修改原始DataFrame

'''
# Series的排序:
import pandas as pd
df = pd.read_csv('nba.csv')
print(df.head())		# 输出前五行
print(df['Weight'].sort_values())                      # 升序排序
print(df['Weight'].sort_values(ascending=False))       # 降序排序

运行结果分别如下:

DataFrame的排序

# DataFrame的排序
# 单列排序:
print(df.sort_values(by='Weight'))

运行部分结果如下:

print(df.sort_values(by="Weight", ascending=False))     # 降序排序

# 多列排序:
print(df.sort_values(by=['Age', 'Weight']))

# 两个字段都是降序排序
print(df.sort_values(by=['Age', 'Weight'], ascending=False))

# 分别指定升序还是降序
print(df.sort_values(by=['Age', 'Weight'], ascending=[False, True]))

Pandas字符串处理

之前我就在这个字符串处理的题上出了一些问题(不过当天就解决啦)【今天在来看看】,也就是

df['lrl'].str.replace("%", "").astype("int32")
# Pandas字符串处理:
'''
1-使用方法:先获取Series的属性,然后再属性上调用函数
2-只能在字符串列上使用,不能再数字列上使用
3-DataFrame没有str属性和使用
4-Series.str并不是原生Python字符串,它是封装的一套方法
'''
# 获取Series的属性
# print(df['Salary'].str)   # 报错【示范】

# AttributeError: Can only use .str accessor with string values!
# AttributeError:只能使用。带字符串值的str访问器!

# 一定得是字符串列
print(df['College'].str)
# 运行结果为: <pandas.core.strings.accessor.StringMethods object at 0x00000204444EBC48>
# 判断是不是数字列
print(df['College'].str.isnumeric())
# print(df['College'].len)      # 报错【示范】

# AttributeError: 'Series' object has no attribute 'len'
# AttributeError:“Series”对象没有属性“len”

# 使用str的startswith、contains等得到bool的Series可以做条件查询
tj = df['Height'].str.startswith("6-2")
print(tj)

# 去掉Height中间的“-”
print(df['Height'].str.replace("-", ""))

# 取第一位数
print(df['Height'].str.replace("-", "").str.slice(0, 1))

# 同上
print(df['Height'].str.replace("-", "").str[0:1])

到此这篇关于python数学建模(SciPy+ Numpy+Pandas)的文章就介绍到这了,更多相关pyth Pandas内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python学习教程之Numpy和Pandas的使用

    前言 本文主要给大家介绍了关于python中Numpy和Pandas使用的相关资料,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 它们是什么? NumPy是Python语言的一个扩充程序库.支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库. Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速便捷地处理数据

  • python统计函数库scipy.stats的用法解析

    背景 总结统计工作中几个常用用法在python统计函数库scipy.stats的使用范例. 正态分布 以正态分布的常见需求为例了解scipy.stats的基本使用方法. 1.生成服从指定分布的随机数 norm.rvs通过loc和scale参数可以指定随机变量的偏移和缩放参数,这里对应的是正态分布的期望和标准差.size得到随机数数组的形状参数.(也可以使用np.random.normal(loc=0.0, scale=1.0, size=None)) In [4]: import numpy a

  • python scipy 稀疏矩阵的使用说明

    稀疏矩阵格式 coo_matrix coo_matrix 是最简单的稀疏矩阵存储方式,采用三元组(row, col, data)(或称为ijv format)的形式来存储矩阵中非零元素的信息. 在实际使用中,一般coo_matrix用来创建矩阵,因为coo_matrix无法对矩阵的元素进行增删改操作:创建成功之后可以转化成其他格式的稀疏矩阵(如csr_matrix.csc_matrix)进行转置.矩阵乘法等操作. coo_matrix可以通过四种方式实例化,除了可以通过coo_matrix(D)

  • python安装numpy和pandas的方法步骤

    最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须是2.7以上. linux首先安装依赖包 yum -y install blas blas-devel lapack-devel lapack yum -y install seaborn scipy yum -y install freetype freetype-devel libpng lib

  • python scipy.spatial.distance 距离计算函数  

    目录 1scipy.spatial 2scipy.spatial.distance.cdist 2.1语法 2.2metric的取值 2.3常用欧氏距离计算 1 scipy.spatial from scipy import spatial 在scipy.spatial中最重要的模块应该就是距离计算模块distance了. 2 scipy.spatial.distance.cdist 2.1 语法 scipy.spatial.distance.cdist(XA, XB, metric='eucl

  • 浅谈python已知元素,获取元素索引(numpy,pandas)

    目前搜索到的方法有: np.where('元素') 还有就是pandas的方法: df.index('元素') 但是第二个方法的问题就是会报错,嗯,这就比较尴尬了,查询了网上的解决方案,有这样的: 此外使用 df[df['列名'].isin([相应的值])] 这个命令会输出等于该值的行. 此外如果想快速找到dataframe最后几行的话,可以使用的方法是tail,可以获取若干行的值 以上这篇浅谈python已知元素,获取元素索引(numpy,pandas)就是小编分享给大家的全部内容了,希望能给

  • python数学建模是加深Numpy和Pandas学习

    目录 前言 Numpy 学习 1-numpy.array 2-numpy.empty 3-numpy.zeros 4-numpy.ones NumPy 从已有的数组创建数组 1-numpy.asarray 2-numpy.frombuffer 3-numpy.fromiter NumPy 从数值范围创建数组 1-numpy.arange 2-numpy.linspace 3-numpy.logspace 综合运用[array.arange.linspace.lonspace]: 综合运用[one

  • Python使用scipy.fft进行大学经典的傅立叶变换

    傅里叶变换是在高数是一个很重要的知识点,今天将结合Python代码实现傅立叶变换. 傅立叶变换 我们平时是如何去分解一个复杂的问题呢?一个经典的方法就是把这个复杂的问题分解成为多个简单的可操作的子问题, 傅立叶变换也是基于这个思想. 傅里叶分析是研究如何将数学函数分解为一系列更简单的三角函数的领域.傅里叶变换是该领域的一种工具,用于将函数分解为其分量频率. 在本教程中,傅立叶变换是一种工具,可以获取信号并查看其中每个频率的功率.看一看该傅立叶变换中的重要术语: 信号:信号是随时间变化的信息.例如

  • 详解Python如何利用Pandas与NumPy进行数据清洗

    目录 准备工作 DataFrame 列的删除 DataFrame 索引更改 DataFrame 数据字段整理 str 方法与 NumPy 结合清理列 apply 函数清理整个数据集 DataFrame 跳过行 DataFrame 重命名列 许多数据科学家认为获取和清理数据的初始步骤占工作的 80%,花费大量时间来清理数据集并将它们归结为可以使用的形式. 因此如果你是刚刚踏入这个领域或计划踏入这个领域,重要的是能够处理杂乱的数据,无论数据是否包含缺失值.不一致的格式.格式错误的记录还是无意义的异常

  • python数学建模之Numpy 应用介绍与Pandas学习

    目录 Numpy学习 1 Numpy 介绍与应用 1-1Numpy是什么 2 NumPy Ndarray 对象 3 Numpy 数据类型 4 Numpy 数组属性 Pandas学习 1 pandas新增数据列 2 Pandas数据统计函数 3 Pandas对缺失值的处理 总结 Numpy学习 1 Numpy 介绍与应用 1-1Numpy是什么 NumPy 是一个运行速度非常快的数学库,一个开源的的python科学计算库,主要用于数组.矩阵计算,包含: 一个强大的N维数组对象 ndarray广播功

随机推荐