Pandas之DataFrame对象的列和索引之间的转化
约定:
import pandas as pd
DataFrame对象的列和索引之间的转化
我们常常需要将DataFrame对象中的某列或某几列作为索引,或者将索引转化为对象的列。pandas提供了set_index()/reset_index() 来供我们使用。
一、列转化为索引
df1=pd.DataFrame({'X':range(5),'Y':range(5),'S':list("aaabb"),'Z':[1,1,2,2,2]}) df1
代码结果:
S | X | Y | Z | |
---|---|---|---|---|
0 | a | 0 | 0 | 1 |
1 | a | 1 | 1 | 1 |
2 | a | 2 | 2 | 2 |
3 | b | 3 | 3 | 2 |
4 | b | 4 | 4 | 2 |
指定列为索引
df1.set_index('S')
代码结果:
X | Y | Z | |
---|---|---|---|
S | |||
a | 0 | 0 | 1 |
a | 1 | 1 | 1 |
a | 2 | 2 | 2 |
b | 3 | 3 | 2 |
b | 4 | 4 | 2 |
指定多个列作为多级索引
df1.set_index(['S','Z'])
代码结果:
X | Y | ||
---|---|---|---|
S | Z | ||
a | 1 | 0 | 0 |
1 | 1 | 1 | |
2 | 2 | 2 | |
b | 2 | 3 | 3 |
2 | 4 | 4 |
同时保留作为索引的列
df1.set_index(['S','Z'],drop=False)
代码结果:
S | X | Y | Z | ||
---|---|---|---|---|---|
S | Z | ||||
a | 1 | a | 0 | 0 | 1 |
1 | a | 1 | 1 | 1 | |
2 | a | 2 | 2 | 2 | |
b | 2 | b | 3 | 3 | 2 |
2 | b | 4 | 4 | 2 |
二、索引转化为列
df2=df1.set_index(['S','Z']) df2
代码结果:
X | Y | ||
---|---|---|---|
S | Z | ||
a | 1 | 0 | 0 |
1 | 1 | 1 | |
2 | 2 | 2 | |
b | 2 | 3 | 3 |
2 | 4 | 4 |
将单个索引作为DataFrame对象的列
df2.reset_index('Z')
代码结果:
Z | X | Y | |
---|---|---|---|
S | |||
a | 1 | 0 | 0 |
a | 1 | 1 | 1 |
a | 2 | 2 | 2 |
b | 2 | 3 | 3 |
b | 2 | 4 | 4 |
将多级索引作为列
df2.reset_index()
代码结果:
S | Z | X | Y | |
---|---|---|---|---|
0 | a | 1 | 0 | 0 |
1 | a | 1 | 1 | 1 |
2 | a | 2 | 2 | 2 |
3 | b | 2 | 3 | 3 |
4 | b | 2 | 4 | 4 |
直接删除对指定索引
df2.reset_index('Z',drop=True)
代码结果:
X | Y | |
---|---|---|
S | ||
a | 0 | 0 |
a | 1 | 1 |
a | 2 | 2 |
b | 3 | 3 |
b | 4 | 4 |
直接对原DataFrame对象修改
df2.reset_index(inplace=True) df2
代码结果:
S | Z | X | Y | |
---|---|---|---|---|
0 | a | 1 | 0 | 0 |
1 | a | 1 | 1 | 1 |
2 | a | 2 | 2 | 2 |
3 | b | 2 | 3 | 3 |
4 | b | 2 | 4 | 4 |
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。
相关推荐
-
pandas将DataFrame的列变成行索引的方法
pandas提供了set_index方法可以将DataFrame的列(多列)变成行索引,通过reset_index方法可以将层次化索引的级别会被转移到列里面. 1.DataFrame的set_index方法 data = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
-
pandas.dataframe按行索引表达式选取方法
需要把一个从csv文件里读取来的数据集等距抽样分割,这里用到了列表表达式和dataframe.iloc 先生成索引列表: index_list = ['%d' %i for i in range(df.shape[0]) if i % 3 == 0] 在dataframe中选取 sample_df = df.iloc[index_list] 合起来 sample_df = df.iloc[['%d' %i for i in range(df.shape[0]) if i % 3 == 0]] 各
-
pandas.dataframe中根据条件获取元素所在的位置方法(索引)
在dataframe中根据一定的条件,得到符合要求的某行元素所在的位置. 代码如下所示: df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50]) print(df) a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist() print(a) df如下所示,以上通过选取"BoolCol"取
-
pandas DataFrame索引行列的实现
python版本: 3.6 pandas版本: 0.23.4 行索引 索引行有三种方法,分别是 loc iloc ix import pandas as pd import numpy as np index = ["a", "b", "c", "d"] data = np.random.randint(10, size=(4, 3)) df = pd.DataFrame(data, index=index) "&q
-
python中pandas.DataFrame的简单操作方法(创建、索引、增添与删除)
前言 最近在网上搜了许多关于pandas.DataFrame的操作说明,都是一些基础的操作,但是这些操作组合起来还是比较费时间去正确操作DataFrame,花了我挺长时间去调整BUG的.我在这里做一些总结,方便你我他.感兴趣的朋友们一起来看看吧. 一.创建DataFrame的简单操作: 1.根据字典创造: In [1]: import pandas as pd In [3]: aa={'one':[1,2,3],'two':[2,3,4],'three':[3,4,5]} In [4]: bb=
-
Pandas之DataFrame对象的列和索引之间的转化
约定: import pandas as pd DataFrame对象的列和索引之间的转化 我们常常需要将DataFrame对象中的某列或某几列作为索引,或者将索引转化为对象的列.pandas提供了set_index()/reset_index() 来供我们使用. 一.列转化为索引 df1=pd.DataFrame({'X':range(5),'Y':range(5),'S':list("aaabb"),'Z':[1,1,2,2,2]}) df1 代码结果: S X Y Z 0 a 0
-
Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)
1.单列运算 在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作: df['col2'] = df['col1'].map(lambda x: x**2) 其中lambda函数中的x代表当前元素.可以使用另外的函数来代替lambda函数,例如: define square(x): return (x ** 2) df['col2'] = df['col1'].map(square) 2.多列运算 apply()会将待处理的对象拆分成多个片段,然后对各
-
pandas创建DataFrame对象失败的解决方法
目录 报错代码 报错翻译 报错原因 解决方法 创建DataFrame对象的四种方法 1. list列表构建DataFrame 2. dict字典构建DataFrame 3. ndarray创建DataFrame 4. Series创建DataFrame 报错代码 粉丝群一个小伙伴想pandas创建DataFrame对象,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下: import pan
-
pandas将DataFrame的几列数据合并成为一列
目录 1.1 方法归纳 1.2 .str.cat函数详解 1.2.1 语法格式: 1.2.2 参数说明: 1.2.3 核心功能: 1.2.4 常见范例: 1.1 方法归纳 使用 + 直接将多列合并为一列(合并列较少): 使用pandas.Series.str.cat方法,将多列合并为一列(合并列较多): 范例如下: dataframe["newColumn"] = dataframe["age"].map(str) + dataframe["phone&q
-
对pandas将dataframe中某列按照条件赋值的实例讲解
在数据处理过程中,经常会出现对某列批量做某些操作,比如dataframe df要对列名为"values"做大于等于30设置为1,小于30设置为0操作,可以这样使用dataframe的apply函数来实现, 具体实现代码如下: def fun(x): if x >= 30: return 1 else: return 0 values= feature['values'].apply(lambda x: fun(x)) 具体的逻辑可以修改fun函数来实现,但是按照某些条件选择列不是
-
Pandas 解决dataframe的一列进行向下顺移问题
最近做比赛,有时候需要造出新的特征,而这次遇到的问题是将一列数据往下顺移一位.同时将开头缺失的那一个数据用其他方式填充. df['feature'].shift(1)向下顺移一位,这时第一位会置为nan,需要填充. ----------------------历史分割线----------------- 错误方案: 当时首先想到的是用loc来直接进行替换,也就是 i = len(dt) dt_new = pd.DataFrame() dt_new.loc[0, 'test'] = 0 dt_ne
-
从列表或字典创建Pandas的DataFrame对象的方法
介绍 每当我使用pandas进行分析时,我的第一个目标是使用众多可用选项中的一个将数据导入Pandas的DataFrame . 对于绝大多数情况下,我使用的 read_excel , read_csv 或 read_sql . 但是,有些情况下我只需要几行数据或包含这些数据里的一些计算. 在这些情况下,了解如何从标准python列表或字典创建DataFrames会很有帮助. 基本过程并不困难,但因为有几种不同的选择,所以有助于理解每种方法的工作原理. 我永远记不住我是否应该使用 from_dic
-
Pandas中DataFrame的基本操作之重新索引讲解
目录 Pandas DataFrame之重新索引 1.reindex可以对行和列索引 2.reindex插值处理 Pandas DataFrame重置索引案例 Pandas DataFrame之重新索引 1.reindex可以对行和列索引 默认对行索引,加上关键字columns对列索引. import pandas as pd data=[[1,1,1,1],[2,2,2,2],[3,3,3,3],[4,4,4,4]] df = pd.DataFrame(data,index=['d','b',
-
详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据
pandas的DataFrame对象,本质上是二维矩阵,跟常规二维矩阵的差别在于前者额外指定了每一行和每一列的名称.这样内部数据抽取既可以用"行列名称(对应.loc[]方法)",也可以用"矩阵下标(对应.iloc[]方法)"两种方式进行. 下面具体说明: (以下程序均在Jupyter notebook中进行,部分语句的print()函数省略) 首先生成一个DataFrame对象: import pandas as pd score = [[34,67,87],[68
-
pandas取dataframe特定行列的实现方法
1.按列取.按索引/行取.按特定行列取 import numpy as np from pandas import DataFrame import pandas as pd df=DataFrame(np.arange(12).reshape((3,4)),index=['one','two','thr'],columns=list('abcd')) df['a']#取a列 df[['a','b']]#取a.b列 #ix可以用数字索引,也可以用index和column索引 df.ix[0]#取
随机推荐
- DNS原理及其解析过程剖析(图文)
- Linux du命令查看文件夹大小并按降序排列
- sql获取分组排序后数据的脚本
- arp欺骗的原理介绍与什么是ARP和防范ARP欺骗第1/3页
- Nginx配置PHP的Yii与CakePHP框架的rewrite规则示例
- js的表单操作 简单计算器
- php的一些小问题
- php实现按天数、星期、月份查询的搜索框
- Python中的with语句与上下文管理器学习总结
- Android使用BroadcastReceiver实现手机开机之后显示画面的功能
- JS 模态对话框和非模态对话框操作技巧汇总
- PHP extract 将数组拆分成多个变量的函数
- jQuery学习笔记之 Ajax操作篇(三) - 过程处理
- 利用jQuery操作对象数组的实现代码
- 不唐突的JavaScript的七条准则整理收集第1/2页
- php&java(一)
- 简单学习Android Socket的使用方法
- 基于PHP读取csv文件内容的详解
- python 统计一个列表当中的每一个元素出现了多少次的方法
- ASP.NET MVC使用Ninject的方法教程