Python的Pandas时序数据详解

2025-01-30 11:24:52

Pandas时序数据

前言在数据分析中，时序数据是一类非常重要的数据。事物的发展总是伴随着时间的推移，数据也会在各个时间点上产生。

一、python中的时间表示-`datetime`模块

Python的标准库datetime支持创建和处理时间，Pandas的时间时序模块是在datetime的基础上建立的。

1.换取当前时间

import datetime

now = datetime.datetime.now()  # 2022-03-06 18:43:49.506048

其中now的全貌如下，是一个datetime对象：

now: datetime.datetime(2022, 3, 6, 18, 37, 10, 132078)

datetime.datetime对象常用的方法：

(1) strftime(): 对datetime对象的格式进行转换。使用含%的占位符书写目标格式，如：

newForm = now.strftime("%Y-%m-%d (%H:%M:%S)")
# 2022-03-06 (18:52:31)  为字符串类型

 各占位符的含义如下

% y 两位数的年份表示（00 - 99）
% Y 四位数的年份表示（000 - 9999）
% m 月份（01 - 12）
% d 月内中的一天（0 - 31）
% H 24小时制小时数（0 - 23）
% I 12小时制小时数（01 - 12）
% M 分钟数（00 = 59）
% S 秒（00 - 59）
% a 本地简化星期名称
% A 本地完整星期名称
% b 本地简化的月份名称
% B 本地完整的月份名称
% c 本地相应的日期表示和时间表示
% j 年内的一天（001 - 366）
% p 本地A.M.或P.M.的等价符
% U 一年中的星期数（00 - 53）星期天为星期的开始
% w 星期（0 - 6），星期天为星期的开始
% W 一年中的星期数（00 - 53）星期一为星期的开始
% x 本地相应的日期表示
% X 本地相应的时间表示
% Z 当前时区的名称
% %  % 号本身

2.指定时间

向datetime.datetime()中传入对应的参数，默认按照单位从大到小指定

birthday = datetime.datetime(2001, 1, 11)  # 默认指定
print(birthday)

也可以通过参数指定，其中year、monnth、day三个参数必须指定

yesterday = pd.Timestamp(2022, 3, 5)  # 2022-03-05 00:00:00
now = pd.Timestamp("now")  # 2022-03-06 19:13:56.507604

3.运算

(1) datetime.datetime对象之间支持减法运算，得到的是一个datetime.timedelta对象

delta = yeaterday - birthday  # 7723 days, 0:00:00

二、 Pandas处理时序序列

1.pd.Timestamp()

pd.Timestamp()是Pandas定义事时间的主要函数, 支持更丰富的定义时间的构造方法

（1）根据datetime.datetime对象

now = pd.Timestamp(datetime.datetime.now())
print(now)  # 2022-03-06 19:07:07.253402

(2) 根据字符串

today = pd.Timestamp("2022-03-06")
print(today)  # 2022-03-06 00:00:00

(3) 更具指定的参数

yesterday = pd.Timestamp(2022, 3, 5)  # 2022-03-05 00:00:00
now = pd.Timestamp("now")  # 2022-03-06 19:13:56.507604

(4) 根据时间戳

pd.Timestamp(1646565103.114923, unit="s")  # unit指定单位为秒

2.pd.Timedelta()

pd.Timedelta()用于创建时间差对象，也具有与pd.Timestamp()类似的构造方法。

(1) 根据字符串创建

oneDay = pd.Timedelta("1 days")  # 1 days 00:00:00
duration = pd.Timedelta("2 days 2 hours")  # 1 days 02:00:00

(2) 指定参数创建

oneDay = pd.Timedelta(days=1)  # 1 days 00:00:00

3.运算

与`datetime`模块运算类似，`pandas`的`Timestamp`对象之间相减可以得到`Timedelta`对象。

4.时间索引

数据表中长常使用时间作为索引，pandas支持创建长时间序列

(1) pd.to_datetime()

pd.to_datetime()支持将时间对象和类时间字符串转化为DatetimeIndex对象。

index = pd.to_datetime(["03/06/2022", datetime.datetime.now()])
print(index)
# DatetimeIndex(['2022-03-06 00:00:00', '2022-03-06 19:29:44.855267'], dtype='datetime64[ns]', freq=None)

(2) pd.date_range()

pd.date_range()可以给定开始时间或者结束时间，并且指定周期数据，周期频率，会自动生成在此范围的时间索引数据：

index = pd.date_range(start="2022-01-01", periods=10)
print(index)
# DatetimeIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04',
               '2022-01-05', '2022-01-06', '2022-01-07', '2022-01-08',
               '2022-01-09', '2022-01-10'],
              dtype='datetime64[ns]', freq='D')

如果要跳过休息日可以使用pd.bdate_range()函数

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注我们的更多内容!

python pandas时序处理相关功能详解

创建时间序列函数pd.date_range() 根据指定的范围,生成时间序列DatetimeIndex,每隔元素的类型为Timestamp.该函数应用较多. ts = pd.date_range('2017-09-01', periods=10, freq='d', normalize=False) ts 输出为: DatetimeIndex(['2017-09-01', '2017-09-02', '2017-09-03', '2017-09-04', '2017-09-05', '2017
Python Pandas学习之Pandas数据结构详解

目录 1Pandas介绍 2Pandas数据结构 2.1Series 2.2DataFrame 1 Pandas介绍 2008年WesMcKinney开发出的库专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构 Numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas学习的目的在什么地方呢? 增强图表可读性便捷的数据处理能力读取文件方便
Pandas DataFrame数据修改值的方法

dfmi.iloc[:,1] pandas要修改值先需要了解DataFrame的一些知识此处参照的是pandas的官方文档 When setting values in a pandas object, care must be taken to avoid what is calledchained indexing. Here is an example. 要修改pandas--DataFrame中的值要注意避免在链式索引上得到的DataFrame的值这里创建了一个DataFrame d
Python Pandas读取Excel日期数据的异常处理方法

目录异常描述出现原因解决方案:修改自定义格式 pandas直接解析Excel数值为日期总结异常描述有时我们的Excel有一个调整过自定义格式的日期字段: 当我们用pandas读取时却是这样的效果: 不管如何指定参数都无效. 出现原因没有使用系统内置的日期单元格格式,自定义格式没有对负数格式进行定义,pandas读取时无法识别出是日期格式,而是读取出单元格实际存储的数值. 解决方案:修改自定义格式可以修改为系统内置的自定义格式: 或者在自定义格式上补充负数的定义: 增加;@即可 p
python pandas库读取excel/csv中指定行或列数据

目录引言 1.根据index查询 2.已知数据在第几行找到想要的数据 3.根据条件查询找到指定行数据 4.找出指定列 5.找出指定的行和指定的列 6.在规定范围内找出符合条件的数据总结引言关键!!!!使用loc函数来查找. 话不多说,直接演示: 有以下名为try.xlsx表: 1.根据index查询条件:首先导入的数据必须的有index 或者自己添加吧,方法简单,读取excel文件时直接加index_col 代码示例: import pandas as pd #导入pandas库 ex
Python Pandas学习之基本数据操作详解

目录 1索引操作 1.1直接使用行列索引(先列后行) 1.2结合loc或者iloc使用索引 1.3使用ix组合索引 2赋值操作 3排序 3.1DataFrame排序 3.2Series排序为了更好的理解这些基本操作,下面会通过读取一个股票数据,来进行Pandas基本数据操作的语法介绍. # 读取文件(读取保存文件后面会专门进行讲解,这里先直接调用下api) data = pd.read_csv("./data/stock_day.csv") # 读取当前目录下一个csv文件 # 删
Python的Pandas时序数据详解

目录 Pandas时序数据一.python中的时间表示-datetime模块 1.换取当前时间 2.指定时间 3.运算二. Pandas处理时序序列 1.pd.Timestamp() 2.pd.Timedelta() 3.运算 4.时间索引总结 Pandas时序数据前言在数据分析中,时序数据是一类非常重要的数据.事物的发展总是伴随着时间的推移,数据也会在各个时间点上产生. 一.python中的时间表示-datetime模块 Python的标准库datetime支持创建和处理时间,P
python中pandas常用命令详解

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.pandas提供了大量能使我们快速便捷地处理数据的函数和方法.你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一. 1.pandas pandas 是一个多功能且功能强大的数据科学库. 2.读取数据 pd.read_csv("data.csv") 3.读取指定列 pd.read_csv(&quo
Python pandas常用函数详解

本文研究的主要是pandas常用函数,具体介绍如下. 1 import语句 import pandas as pd import numpy as np import matplotlib.pyplot as plt import datetime import re 2 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3... names=['A', 'B', 'C'...] 自定义列名 index_col='
python绘图pyecharts+pandas的使用详解

pyecharts介绍 pyecharts 是一个用于生成 Echarts 图表的类库.Echarts 是百度开源的一个数据可视化 JS 库.用 Echarts 生成的图可视化效果非常棒为避免绘制缺漏,建议全部安装为了避免下载缓慢,作者全部使用镜像源下载过了 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ echarts-countries-pypkg pip install -i https://pypi.tuna.tsin
Python获取网页数据详解流程

Requests 库是 Python 中发起 HTTP 请求的库,使用非常方便简单. 发送 GET 请求当我们用浏览器打开东旭蓝天股票首页时,发送的最原始的请求就是 GET 请求,并传入url参数. import requests url='http://push2his.eastmoney.com/api/qt/stock/fflow/daykline/get' 用Python requests库的get函数得到数据并设置requests的请求头. header={ 'User-Agent'
Python解析多帧dicom数据详解

概述 pydicom是一个常用python DICOM parser.但是,没有提供解析多帧图的示例.本文结合相关函数和DICOM知识做一个简单说明. DICOM多帧数据存储 DICOM标准中关于多帧数据存储的最重要一部分说明是PS3.5 Annex A.4 A.4 Transfer Syntaxes For Encapsulation of Encoded Pixel Data. 无论何时,Pixel Data都存放在Pixel Data (7FE0,0010)中.有可能是直接存放的(nati
Python爬虫实战案例之爬取喜马拉雅音频数据详解

前言喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一起期待吧!! 这个案例的视频地址在这里 https://v.douyu.com/show/a2JEMJj3e3mMNxml 项目目标爬取喜马拉雅音频数据受害者地址 https://www.ximalaya.com/ 本文知识点: 1.系统分析网页性质 2.多层数据解析 3.海量音频数据保存环境
利用Python多处理库处理3D数据详解

今天我们将介绍处理大量数据时非常方便的工具.我不会只告诉您可能在手册中找到的一般信息,而是分享一些我发现的小技巧,例如tqdm与 multiprocessingimap一起使用.并行处理档案.绘制和处理 3D 数据以及如何搜索如果您有点云,则用于对象网格中的类似对象. 那么我们为什么要求助于并行计算呢?如今,如果您处理任何类型的数据,您可能会面临与"大数据"相关的问题.每次我们有不适合 RAM 的数据时,我们都需要一块一块地处理它.幸运的是,现代编程语言允许我们生成在多核处理器
玩数据必备Python库之numpy使用详解

目录前言 1. ndarray介绍 2. ndarray的基本操作生成数组数组索引.切片修改数组形状修改数组类型数组去重删除元素 3. ndarray运算逻辑运算统计运算数组运算 4. matrix 矩阵介绍 5. Python中矩阵运算扩展:正态分布简介正态分布图方差总结前言 numpy 库是一个科学计算库, 使用方法:import numpy as np 用于快速处理任意维度的数组,存储的对象是ndarray 用于矩阵运算,存储的对象是matrix 1. nd
python 线性回归分析模型检验标准--拟合优度详解

建立完回归模型后,还需要验证咱们建立的模型是否合适,换句话说,就是咱们建立的模型是否真的能代表现有的因变量与自变量关系,这个验证标准一般就选用拟合优度. 拟合优度是指回归方程对观测值的拟合程度.度量拟合优度的统计量是判定系数R^2.R^2的取值范围是[0,1].R^2的值越接近1,说明回归方程对观测值的拟合程度越好:反之,R^2的值越接近0,说明回归方程对观测值的拟合程度越差. 拟合优度问题目前还没有找到统一的标准说大于多少就代表模型准确,一般默认大于0.8即可拟合优度的公式:R^2 = 1