Pandas数据结构之Series的使用

2025-02-18 05:14:38

一. Series 简介

Series是一种类似于一维数组的对象，是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象

Series 总的来说就是带标签的一维数组，可存储整数、浮点数、字符串、Python对象等类型的数据。标签轴通常叫做索引。

二. 实例化 Series

2.1 使用一维数组实例化

用一维数组实例化Series时，索引长度必须与数组长度一致。没有指定索引时，Pandas会帮我们创建默认的数值型索引。

In [1]: s1 = pd.Series([1, 2, 3, 4])
Out[1]:
0	1
1	2
2	3
3	4
dtype: int64

In [2]: s2 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
Out[2]:
a	1
b	2
c	3
d	4
dtype: int64

注意: Pandas 是支持重复索引的。但我们也可以重置索引，具体操作方法在后续章节中会给出。

2.2 使用字典实例化

使用字典实例化Series时, 如果未传入索引，则索引的值为字典的key：

In [1]: pd.Series({'i': 0, 'j': 1, 'k': 2})
Out[1]:
i    0
j    1
k    2
dtype: int64

2.3 使用标量例化

使用标量值实例化时，必须提供索引。Series 按索引长度重复该标量值。

In [1]: pd.Series(6, index=[0, 1, 2])
Out[1]:
0    6
1    6
2    6
dtype: int64

三.Series 简单使用

3.1 为Series添加Name属性

在实例化Series时，可以传入name参数为Series添加name属性。同时，Seires也支持重命名:

In [1]: s = pd.Series(6, index=[0, 1, 2], name='six')
Out[1]:
0    6
1    6
2    6
Name: six, dtype: int64

In [2]: s.name
Out[2]: 'six'

In [3]: s = s.rename('sixsixsix')
In [4]: s.name
Out[4]: 'sixsixsix'

3.2 基于位置的切片

Series提供了类似于Python列表的切片方式：

In[0]: s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
In[1]: s[0:2] 	#取下标为0和1的两个数据（不包括2，也就是从第一个开始取，取两个数据）
Out[1]：
a    1
b    2
dtype: int64

In[2]: s[:3] 	#取前三个数据
Out[2]：
a    1
b    2
c    3
dtype: int64

In[3]: s[-2:] 	#取最后两个数据（也可以理解为从倒查第二个数据一直取到末尾）
Out[3]：
c    3
d    4
dtype: int64

In[4]: s[[0,2,3]] 	#取第1、3、4这个三个数据（注意下标是从0开始的，转换为位置时需+1）
Out[4]：
a    1
c    3
d    4
dtype: int64		#注意：如果输入的位置大于列表的长度则会报出“indexers are out-of-bounds”异常

3.3 基于索引的切片

Series可使用索引标签的值来提取值：

In [0]：s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
In [1]: s['a'] 	#提取s中，标签为a的值
Out[1]：
a    1
dtype: int64

In [1]: s[['a', 'b', 'c']] 	#提取s中，标签为a, b, c的值
Out[1]：
a    1
b    2
c    3
dtype: int64

如果传入的索引标签的值不在Seires的轴索引中，那将会报 KeyError 异常，这里建议大家使用Series的 get 方法获取值,如果不存在，则会返回None，同时也可设置default参数，用于不存在时的默认返回值。

In [0]: s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
In [1]: s['f'] 	#提取s中，标签为f的值, f不存在，将会报出异常
Out[1]：KeyError

In [2]：s.get('f') #提取s中，标签为f的值, 若f不存在，默认返回None
Out[2]：None

In [3]：s.get('f'. default=-1) #提取s中，标签为f的值, 若f不存在，返回-1
Out[3]：-1

3.4 基于条件的切片

In[0]: s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
In[1]: s[s < 2] 	#提取s中，小于2的值
Out[1]：
a    1
b    2
dtype: int64

In[1]: s[s> s.mean()] 	#提取s中，大于平均数的值
Out[1]：
c    3
d    4
dtype: int64

In[1]: s[s.between(1, 3, inclusive=False)] 	#提取s中，值介于1，3之间的数据(不包含1，3)
Out[1]：
b    2
dtype: int64

在提取区间数据时，如果想让两端的值包含其中（满足两端的值也被提取出来），只需要把 inclusive 参数的值赋为True

3.5 其他操作

Series 不用循环也可以像操作单个数值一样快速进行数学运算：

In[0]: s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
In[1]: s + s
Out[1]：
a    2
b    4
c    6
d    8
dtype: int64

In[2]: s - 1
Out[2]：
a    0
b    1
c    2
d    3
dtype: int64

Series 之间的操作会自动 基于标签 对齐数据. 如果一个Series中的标签在另一个Series中不存在，那么计算得到的结果将是NaN,即缺失值，有缺失值NaN的处理在后续章节也会讲到。因此，我们不用顾及执行操作的Series是否有相同的标签。 Pandas数据结构集成的数据对齐的功能，是Pandas区别于大多数标签型数据处理工具的重要特性。

In[0]: s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
In[0]: s2 = pd.Series([3, 6, 11], index=['a', 'b', 'f'])
In[1]: s1 + s2
Out[1]:
a   4.0
b   8.0
c   NaN
d   NaN
f   NaN
dtype: float64

到此这篇关于Pandas数据结构之Series的使用的文章就介绍到这了,更多相关Pandas Series使用内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

pandas中的series数据类型详解

本文介绍了pandas中的series数据类型详解,分享给大家,具体如下: import pandas as pd import numpy as np import names ''' 写在前面的话: 1.series与array类型的不同之处为series有索引,而另一个没有;series中的数据必须是一维的,而array类型不一定 2.可以把series看成一个定长的有序字典,可以通过shape,index,values等得到series的属性 ''' # 1.series的创建 '''
在python中pandas的series合并方法

如下所示: In [3]: import pandas as pd In [4]: a = pd.Series([1,2,3]) In [5]: b = pd.Series([2,3,4]) In [6]: c = pd.DataFrame([a,b]) In [7]: c Out[7]: 0 1 2 0 1 2 3 1 2 3 4 不过pandas直接用列表生成dataframe只能按行生成,如果是字典可以按列生成,比如: In [8]: c = pd.DataFrame({'a':a,'b'
pandas 数据结构之Series的使用方法

1. Series Series 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index). 1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会使用默认索引(从0到N-1). # 引入Series和DataFrame In [16]: from pandas import Series,DataFrame In [17]: import pandas as pd In [18]: ser1 = Series([1,2,3,4]) In [1
pandas的Series类型与基本操作详解

1 Series 线性的数据结构, series是一个一维数组 Pandas 会默然用0到n-1来作为series的index, 但也可以自己指定index( 可以把index理解为dict里面的key ) 1.1创造一个serise数据 import pandas as pd import numpy as np s = pd.Series([9, 'zheng', 'beijing', 128]) print(s) 打印 0 9 1 zheng 2 beijing 3 128 dtype
Python3.5 Pandas模块之Series用法实例分析

本文实例讲述了Python3.5 Pandas模块之Series用法.分享给大家供大家参考,具体如下: 1.Pandas模块引入与基本数据结构 2.Series的创建 #!/usr/bin/env python # -*- coding:utf-8 -*- # Author:ZhengzhengLiu #模块引入 import numpy as np import pandas as pd from pandas import Series,DataFrame #1.Series通过numpy一
对pandas中Series的map函数详解

Series的map方法可以接受一个函数或含有映射关系的字典型对象. 使用map是一种实现元素级转换以及其他数据清理工作的便捷方式. (DataFrame中对应的是applymap()函数,当然DataFrame还有apply()函数) 1.字典映射 import pandas as pd from pandas import Series, DataFrame data = DataFrame({'food':['bacon','pulled pork','bacon','Pastrami',
Pandas数据结构之Series的使用

目录一. Series 简介二. 实例化 Series 2.1 使用一维数组实例化 2.2 使用字典实例化 2.3 使用标量例化三.Series 简单使用 3.1 为Series添加Name属性 3.2 基于位置的切片 3.3 基于索引的切片 3.4 基于条件的切片 3.5 其他操作一. Series 简介 Series是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成.仅由一组数据也可产生简单的Series对象 Series 总的
Pandas数据结构详细说明及如何创建Series，DataFrame对象方法

目录 1. Pandas的两种数据类型 2. Series类型通过numpy array 通过Python字典通过标量值(Scalar) name属性 3. DataFrame类型通过包含列表的Python List 通过包含Python 字典的Python List 通过Series 在网络上的Pandas教程中,很多都提到了如何使用Pandas将已有的数据(如csv,如hdfs等)直接加载成Pandas数据对象,然后在其基础上进行数据分析操作,但是,很多时候,我们需要自己创建Panda
Python Pandas学习之Pandas数据结构详解

目录 1Pandas介绍 2Pandas数据结构 2.1Series 2.2DataFrame 1 Pandas介绍 2008年WesMcKinney开发出的库专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构 Numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas学习的目的在什么地方呢? 增强图表可读性便捷的数据处理能力读取文件方便
pandas数据类型之Series的具体使用

目录 Series类型 Series的三种创建方式通过数组创建Series 创建指定索引列的Series 使用字典创建标量创建Series对象 Series的常见操作 Series的值访问访问整个series 获取索引列设置名称 Series数据编辑 Series数据删除 drop方法 pop方法 del方法 Series数据添加 append方法 pandas中包含了DataFrame和Series数据类型,分别表示二维数据结构和一维数据结构.简单的可以理解为Series为excel表
python pandas中对Series数据进行轴向连接的实例

有时候我们想要的数据合并结果是数据的轴向连接,在pandas中这可以通过concat来实现.操作的对象通常是Series. Ipython中的交互代码如下: In [17]: from pandas import Series,DataFrame In [18]: series1 = Series(range(2),index = ['a','b']) In [19]: series2 = Series(range(3),index = ['c','d','e']) In [20]: serie
教你漂亮打印Pandas DataFrames和Series

一.前言当我们必须处理可能有多个列和行的大型DataFrames时,能够以可读格式显示数据是很重要的.这在调试代码时非常有用. 默认情况下,当打印出DataFrame且具有相当多的列时,仅列的子集显示到标准输出. 显示的列甚至可以多行打印出来. 二.问题假设我们有以下DataFrame: import pandas as pd import numpy as np df = pd.DataFrame( np.random.randint(0, 100, size=(100, 25)), co
pandas实现按照Series分组示例

目录 1 按照一个Series进行分组 2 按照多个Series进行分组 3 分组和聚合采用不同的列或Series进行本文用到的表格内容如下: 先来看一下数据情形 import pandas as pd life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx') print(life_df) result: 分类编号名称 0 水果 0 苹果 1 水果 1 橙子 2 生