Series和DataFrame使用简单入门

(1)、导入库

from pandas import Series,DataFrame
import pandas
import numpy

(2)、Series简单创建与使用

#Serires
obj = Series([4,7,-5,3]) #简单创建Serires
print(obj) #简单输出
print(obj.values) #输出值
print(obj.index)  #输出索引

obj2 = Series([4,7,-5,3], index=['d','b','a','c'])  #指定索引
print(obj2)   #简单输出
print(obj2.index)  #输出索引
print(obj2['a'])  #根据索引输出单个值
obj2['d']=6   #根据索引修改值
print(obj2['d'])  #输出
print(obj2[['d','a','c']]) #输出多个值
print(obj2[obj2 > 0])  #按条件输出
print('b' in obj2) #根据索引看数组里面是否有,返回True
print('e' in obj2) #返回False

(3)、根据字典创建Series

#根据字典创建Series
sdata = {'Oer':56,'asdgr':32,'rgg':89,'greg':44}
obj3 = Series(sdata)
print(obj3)

(4)、列表与字典进行匹配

#列表与字典进行匹配
sdata = {'Oer':56,'asdgr':32,'rgg':89,'greg':44}
states = ['Casfef','Oer','rgg','greg']
obj4 = Series(sdata, index = states)  #列表与字典进行匹配
print(obj4)
print(pd.isnull(obj4)) #查看数据是否为空
print(pd.notnull(obj4)) #查看数据是否非空

(5)、两个Serires相加

#两个Serires相加
obj1 = Series([3,7,-4,3], index=['q','b','a','c'])
obj2 = Series([4,7,-5,3], index=['d','b','a','g'])
print(obj1 + obj2) #两个Serires相加,具有共同索引的则相加,如果不是共同索引就置为NaN

(6)、修改索引的名字

#修改索引的名字
#obj = Series([4,7,-5,3], index=['d','b','a','g'])
#obj.index = ['Bob','Steve','Jeff','Ryan']
#print(obj.index)

(7)、dataframe的简单应用

#dataframe的简单应用
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data)   #根据字典创建DataFrame
frame2 = DataFrame(data, columns= ['state', 'pop', 'year'])   #指定列的排列顺序
frame3 = DataFrame(data, index= ['a','b','c','d'])   #指定行索引

(8)、获取DataFrame其中的一列(相当于Series)

#获取DataFrame其中的一列(相当于Series)
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根据字典创建DataFrame
print(frame['year'])  #获取其中的一列
print(frame.loc['q2'])  #获取其中的一行

(9)、修改DataFrame中的值

#修改DataFrame中的值
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根据字典创建DataFrame
frame['grg'] = numpy.arange(4) #修改某一列的值
val = Series([8.2,8.5,8.7], index=['q1','q3','q4'])   #修改指定列的值
frame['pop'] = val
print(frame)

(10)、输出DataFrame整体值

#输出DataFrame整体值
data = {'state': ['fergre', 'gerg', 'bhtr', 'hbtr'],
    'year': [2000, 2005, 2006, 2007],
    'pop' : [1.5,2.4,3.6,5.5]}
frame = DataFrame(data,index= ['q1','q2','q3','q4'])   #根据字典创建DataFrame
print(frame.values)

(11)、DataFrame的构造函数

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • 浅谈Series和DataFrame中的sort_index方法

    Series 的 sort_index(ascending=True) 方法可以对 index 进行排序操作,ascending 参数用于控制升序或降序,默认为升序. 若要按值对 Series 进行排序,当使用 .order(na_last=True, ascending=True, kind='mergesort') 方法,任何缺失值默认都会被放到 Series 的末尾. 在 DataFrame 上,.sort_index(axis=0, by=None, ascending=True) 方法

  • 浅谈Pandas:Series和DataFrame间的算术元素

    如下所示: import numpy as np import pandas as pd from pandas import Series,DataFrame 一.Series与Series s1 = Series([1,3,5,7],index=['a','b','c','d']) s2 = Series([2,4,6,8],index=['a','b','c','e']) 索引对齐项相加,不对齐项的值取NaN s1+s2 1 a 3.0 b 7.0 c 11.0 d NaN e NaN d

  • Pandas:Series和DataFrame删除指定轴上数据的方法

    如下所示: import numpy as np import pandas as pd from pandas import Series,DataFrame 一.drop方法:产生新对象 1.Series o = Series([1,3,4,7],index=['d','c','b','a']) print(o.drop(['d','b'])) c 3 a 7 dtype: int64 2.DataFrame data = {'水果':['苹果','梨','草莓'], '数量':[3,2,5

  • pandas把dataframe转成Series,改变列中值的类型方法

    使用 pd.Series把dataframe转成Series ts = pd.Series(df['Value'].values, index=df['Date']) 使用astype改变列中的值的类型,注意前面要有np df['列名'] = df['列名'].astype(np.int64) 以上这篇pandas把dataframe转成Series,改变列中值的类型方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们. 您可能感兴趣的文章: python panda

  • 浅谈python的dataframe与series的创建方法

    如下所示: # -*- coding: utf-8 -*- import numpy as np import pandas as pd def main(): s = pd.Series([i*2 for i in range(1,11)]) print type(s) print (s) dates = pd.date_range("20170301",periods=8) df = pd.DataFrame(np.random.randn(8,5),index=dates,col

  • Pandas DataFrame 取一行数据会得到Series的方法

    Pandas DataFrame 取一行数据会得到Series的方法 如题,想要取如下dataframe的一行数据,以为得到的还是dataframe lista = [1, 3, 7,4,0] listb = [3, 3, 4,4,5] listc = [3, 3, 4,4,6] df1 = pd.DataFrame({'col1':lista,'col2':listb,'colb':listc}) print(df1) print(df1.loc[0,:]) print(type(df1.lo

  • 对pandas中两种数据类型Series和DataFrame的区别详解

    1. Series相当于数组numpy.array类似 s1=pd.Series([1,2,4,6,7,2]) s2=pd.Series([4,3,1,57,8],index=['a','b','c','d','e']) print s2 obj1=s2.values # print obj1 obj2=s2.index # print obj2 # print s2[s2>4] # print s2['b'] 1.Series 它是有索引,如果我们未指定索引,则是以数字自动生成. 下面是一些例

  • pandas 对series和dataframe进行排序的实例

    本问主要写根据索引或者值对series和dataframe进行排序的实例讲解 代码: #coding=utf-8 import pandas as pd import numpy as np #以下实现排序功能. series=pd.Series([3,4,1,6],index=['b','a','d','c']) frame=pd.DataFrame([[2,4,1,5],[3,1,4,5],[5,1,4,2]],columns=['b','a','d','c'],index=['one','

  • python pandas 对series和dataframe的重置索引reindex方法

    reindex更多的不是修改pandas对象的索引,而只是修改索引的顺序,如果修改的索引不存在就会使用默认的None代替此行.且不会修改原数组,要修改需要使用赋值语句. series.reindex() import pandas as pd import numpy as np obj = pd.Series(range(4), index=['d', 'b', 'a', 'c']) print obj d 0 b 1 a 2 c 3 dtype: int64 print obj.reinde

  • 从DataFrame中提取出Series或DataFrame对象的方法

    如下所示: df = pd.DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'b'],                    'data1': range(6)}) type(df['data1']) pandas.core.series.Series type(df[['data1']]) pandas.core.frame.DataFrame 以上这篇从DataFrame中提取出Series或DataFrame对象的方法就是小编分享给大家的全部内容了,

  • Pandas中Series和DataFrame的索引实现

    正文 在对Series对象和DataFrame对象进行索引的时候要明确这么一个概念:是使用下标进行索引,还是使用关键字进行索引.比如list进行索引的时候使用的是下标,而dict索引的时候使用的是关键字. 使用下标索引的时候下标总是从0开始的,而且索引值总是数字.而使用关键字进行索引,关键字是key里面的值,既可以是数字,也可以是字符串等. Series对象介绍: Series对象是由索引index和值values组成的,一个index对应一个value.其中index是pandas中的Inde

随机推荐