基于pandas数据样本行列选取的方法

2025-03-09 04:00:57

注：以下代码是基于python3.5.0编写的

import pandas
food_info = pandas.read_csv("food_info.csv")
# ------------------选取数据样本的第一行--------------------
print(food_info.loc[0])
#------------------选取数据样本的3到6行----------------------
print(food_info.loc[3:6])
#------------------head选取数据样本的前几行------------------
print(food_info.head(2))
# ------------------选取数据样本的2,5,10行,两种方法-----------
# print(food_info.loc[[2,5,10]])     #方法一
two_five_ten = [2,5,10]         #方法二
print(food_info.loc[two_five_ten])
# ------------------选取数据样本的NDB_No列--------------------
# ndb_col = food_info["NDB_No"]     #方法一
col_name = "NDB_No"           #方法二
ndb_col = food_info[col_name]
print(ndb_col)
# ------------------选取数据样本的多列-------------------
# zinc_copper = food_info[["Zinc_(mg)", "Copper_(mg)"]]
columns = ["Zinc_(mg)", "Copper_(mg)"]
zinc_copper = food_info[columns]
print(zinc_copper)
# ---------------------综合小例子----------------------------
col_names = food_info.columns.tolist()   #把所有的行转化成list
print(col_names)
gram_columns = []
for c in col_names:            #遍历col_names，找出所有以(g)结尾的位置
  if c.endswith("(g)"):
    gram_columns.append(c)
print(gram_columns)
gram_df = food_info[gram_columns]     #把所有以(g)结尾的列存放到gram_df
print(gram_df.head(3))

以上这篇基于pandas数据样本行列选取的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

您可能感兴趣的文章:

pandas系列之DataFrame 行列数据筛选实例
pandas数据框,统计某列数据对应的个数方法
pandas全表查询定位某个值所在行列的方法
pandas按若干个列的组合条件筛选数据的方法

pandas按若干个列的组合条件筛选数据的方法

还是用图说话 A文件: 比如,我想筛选出"设计井别"."投产井别"."目前井别"三列数据都为11的数据,结果如下: 当然,这里的筛选条件可以根据用户需要自由调整,代码如下: # -*- coding: utf-8 -*- """ Created on Wed Nov 29 10:46:31 2017 @author: wq """ import pandas as pd #input.c
pandas系列之DataFrame 行列数据筛选实例

一.对DataFrame的认知 DataFrame的本质是行(index)列(column)索引+多列数据. 为了简化理解,我们不妨换个思路- 现实中,为了简化对一件事物的描述,我们会选择几个特征. 例如,从(性别.身高.学历.职业.爱好..)等角度去刻画一个人,这些"角度"即为"特征". 其中,不同的行表示不同的记录:列代表特征,不同记录因各个特征之间的差异而不同. DataFrame默认索引是序号(0,1,2-),可以理解成位置索引.一般我们用id标识不同记录,
pandas数据框,统计某列数据对应的个数方法

现在要解决的问题如下: 我们有一个数据的表第7列有许多数字,并且是用逗号分隔的,数字又有一个对应的关系: 我们要得到第7列对应关系的统计,就是每一行的第7列a有多少个,b有多少个好了,我给的解决方法如下: #!/bin/python #-*-coding:UTF-8-*- import pandas as pd import numpy as np dfidspec = pd.read_table("one.txt")#这个是对应关系的文件 dfmgs = pd.read_tabl
pandas全表查询定位某个值所在行列的方法

如下所示: # create a dataframe with an integer feature and a categorical string feature demo_df = pd.DataFrame({'Integer Feature': [0, 1, 2, 1], 'Categorical Feature': ['socks', 'fox', 'socks', 'box']}) demo_df 接下来用for遍历: for indexs in demo_df.index: for
基于pandas数据样本行列选取的方法

注:以下代码是基于python3.5.0编写的 import pandas food_info = pandas.read_csv("food_info.csv") # ------------------选取数据样本的第一行-------------------- print(food_info.loc[0]) #------------------选取数据样本的3到6行---------------------- print(food_info.loc[3:6]) #-------
pandas 数据实现行间计算的方法

如下所示: ###方法1:用shift函数,不用通过循环 import pandas as pd import numpy as np import matplotlib as plt df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) df['diff'] = df['A'] - df['A'].shift(1) 以上这篇pandas 数据实现行间计算的方法就是小编分享给大家的全部内容了,希望能给大家
sql server通过pivot对数据进行行列转换的方法

脚本: /* 说明:sql server如何通过pivot对数据进行行列转换 */ create table #t ( [员工工号] nvarchar(50), [员工姓名] nvarchar(50), [月份] nvarchar(50), [工资] int ) insert into #t values(N'01', N'张三', N'2020年01月', 2400) ,(N'02', N'李四', N'2020年01月', 3000) ,(N'01', N'张三', N'2020年02月',
pandas 数据索引与选取的实现方法

我们对 DataFrame 进行选择,大抵从这三个层次考虑:行列.区域.单元格. 其对应使用的方法如下: 一. 行,列 --> df[] 二. 区域 --> df.loc[], df.iloc[], df.ix[] 三. 单元格 --> df.at[], df.iat[] 下面开始练习: import numpy as np import pandas as pd df = pd.DataFrame(np.random.randn(6,4), index=list('abcdef')
Python遍历pandas数据方法总结

前言 Pandas是python的一个数据分析包,提供了大量的快速便捷处理数据的函数和方法.其中Pandas定义了Series 和 DataFrame两种数据类型,这使数据操作变得更简单.Series 是一种一维的数据结构,类似于将列表数据值与索引值相结合.DataFrame 是一种二维的数据结构,接近于电子表格或者mysql数据库的形式. 在数据分析中不可避免的涉及到对数据的遍历查询和处理,比如我们需要将dataframe两列数据两两相除,并将结果存储于一个新的列表中.本文通过该例程介绍对pa
Python Pandas多种添加行列数据方法总结

目录前言 1. 增加列数据 2. 增加行数据补充:pandas根据现有列新添加一列总结前言发现自己学习python 的各种库老是容易忘记,所有想利用这个平台,记录和分享一下学习时候的知识点,以后也能及时的复习,最近学习pandas,那我们来看看pandas添加数据的一些方法创建一个dataframe 1. 增加列数据为dataframe增加一列新数据,需要确保增加列的长度与原数据保持一致如果是增加一列相同数据可以直接输入 df['level'] = 1 插入的数据是需要通过源数据
pandas数据选取：df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

1 引言 Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用.本文主要介绍Pandas的几种数据选取的方法. Pandas中,数据主要保存为Dataframe和Series是数据结构,这两种数据结构数据选取的方式基本一致,本文主要以Dataframe为例进行介绍. 在Dataframe中选取数据大抵包括3中情况: 1)行(列)选取(单维度选取):df[].这种情况一次只能选取行或者列,即一次选取中,只能为行或者列设置筛选条件(只能为一个维度设置筛选条件). 2
Python基于scrapy采集数据时使用代理服务器的方法

本文实例讲述了Python基于scrapy采集数据时使用代理服务器的方法.分享给大家供大家参考.具体如下: # To authenticate the proxy, #you must set the Proxy-Authorization header. #You *cannot* use the form http://user:pass@proxy:port #in request.meta['proxy'] import base64 proxy_ip_port = "123.456.7
Java基于字符流形式读写数据的两种实现方法示例

本文实例讲述了Java基于字符流形式读写数据的两种实现方法.分享给大家供大家参考,具体如下: 第一种方式:逐个字符进行读写操作(代码注释以及详细内容空闲补充) package IODemo; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; public class CopyFileDemo { /** * @param args * @throws IOException */ p

基于pandas数据样本行列选取的方法

您可能感兴趣的文章:

相关推荐

随机推荐