Pandas数据类型转换df.astype()及数据类型查看df.dtypes的使用

目录
  • 1.数据框字段类型查看:df.dtypes
  • 2.维度查看df.shape:
  • 3.数据框的策略基本信息df.info():
  • 4.某一列格式df['列名'].dtype:
  • 5.数据类型转换.astype:

Pandas所支持的数据类型:

Python,numpy都有自己的一套数据格式,它们之间的对应关系可参考如下表格:

pandas默认的数据类型是int64,float64。

1.数据框字段类型查看:df.dtypes

数据框td_link_data如下

print(td_link_data)

链路ID  管理域   日期   时间  上行速率Mbps  上行对比速率Mbps  下行速率Mbps  下行对比速率Mbps  上行丢弃速率Mbps  
0     500  10001  20210609  10     0.000         0.011              0.000          0.001             0.0        
1     500  10001  20210609  11     0.000         0.007              0.000          0.000             0.0        
2     500  10001  20210609  12     0.000         0.028              0.000          0.002             0.0        
3     500  10001  20210609  13     0.000         0.056              0.000          0.003             0.0        
4     500  10001  20210609  14     0.000         0.062              0.000          0.003             0.0        
5     500  10001  20210609  15     0.000         0.074              0.000          0.005             0.0        
6     500  10001  20210609  16     0.000         0.061              0.000          0.004             0.0        
7     500  10001  20210609  17     0.000         0.069              0.000          0.004             0.0        
8     500  10001  20210609  18     0.000         0.054              0.000          0.002             0.0        
9     500  10001  20210609  19     0.000         0.054              0.000          0.002             0.0        
10    500  10001  20210609  20     0.000         0.040              0.000          0.004             0.0  
...   ...   ...     ...     ...     ...           ...                ...            ...              ...
...   ...   ...     ...     ...     ...           ...                ...            ...              ...
...   ...   ...     ...     ...     ...           ...                ...            ...              ...
239   500  10001  20210609  23     0.000         0.040              0.000          0.004             0.0

查看数据框td_link_data中数据类型df.dtypes:

print(td_link_data.dtypes)

结果:

链路ID            int64
管理域             int64
日期             object
时间             object
上行速率Mbps      float64
上行对比速率Mbps    float64
下行速率Mbps      float64
下行对比速率Mbps    float64
上行丢弃速率Mbps    float64
dtype: object

2.维度查看df.shape:

print(td_link_data.shape)

结果: 说明此数据框一共有240行,9列:

(240, 9)

3.数据框的策略基本信息df.info():

维度、列名称、数据格式、所占空间等

print(td_link_data.info())

结果:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 240 entries, 0 to 239
Data columns (total 9 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   链路ID        240 non-null    int64  
 1   管理域         240 non-null    int64  
 2   日期          240 non-null    object 
 3   时间          240 non-null    object 
 4   上行速率Mbps    240 non-null    float64
 5   上行对比速率Mbps  240 non-null    float64
 6   下行速率Mbps    240 non-null    float64
 7   下行对比速率Mbps  240 non-null    float64
 8   上行丢弃速率Mbps  240 non-null    float64
dtypes: float64(5), int64(2), object(2)
memory usage: 17.0+ KB

解释:

1.数据类型:数据框 <class 'pandas.core.frame.DataFrame'>
2.表格的维度:240行x9列,RangeIndex:0-239
3.表格的列名,是否为空值和列字段类型dtype
4.数据框包含的字段类型及数量: float64(5), int64(2), object(2)
5.表格所占空间:17.0+ KB

4.某一列格式df['列名'].dtype:

print(td_link_data['管理域'].dtype)

结果:

int64

需要强调的是object类型实际上可以包括多种不同的类型,比如一列数据里,既有整型、浮点型,也有字符串类型,这些在pandas中都会被标识为‘object’,所以在处理数据时,可能需要额外的一些方法提前将这些字段做清洗,str.replace(),float(),int(),astype(),apply()等等。

5.数据类型转换.astype:

df.index.astype('int64') # 索引类型转换
df.astype('int64') # 所有数据转换为 int64
df.astype('int64', copy=False) # 不与原数据关联
td_link_data.astype({'管理域': 'int32'}) # 指定字段转指定类型
td_link_data['管理域'].astype('float')   #某一列转换
td_link_data['链路ID'].astype('object') #某一列转换

参考链接:https://www.jianshu.com/p/8a5f0710cad3

到此这篇关于Pandas数据类型转换df.astype()及数据类型查看df.dtypes的使用的文章就介绍到这了,更多相关Pandas df.astype()及df.dtypes内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • pandas 强制类型转换 df.astype实例

    废话不多说,大家还是直接看代码吧! import pandas as pd from matplotlib import pyplot as plt from datetime import datetime filename='sitka_weather_2014.csv' df=pd.read_csv(filename) print(df.dtypes) df[' Min Humidity']=df[' Min Humidity'].astype('float64') df=df.astyp

  • Pandas数据类型转换df.astype()及数据类型查看df.dtypes的使用

    目录 1.数据框字段类型查看:df.dtypes 2.维度查看df.shape: 3.数据框的策略基本信息df.info(): 4.某一列格式df['列名'].dtype: 5.数据类型转换.astype: Pandas所支持的数据类型: Python,numpy都有自己的一套数据格式,它们之间的对应关系可参考如下表格: pandas默认的数据类型是int64,float64. 1.数据框字段类型查看:df.dtypes 数据框td_link_data如下 print(td_link_data)

  • pandas 数据类型转换的实现

    数据处理过程的数据类型 当利用pandas进行数据处理的时候,经常会遇到数据类型的问题,当拿到数据的时候,首先需要确定拿到的是正确类型的数据,一般通过数据类型的转化,这篇文章就介绍pandas里面的数据类型(data types也就是常用的dtyps),以及pandas与numpy之间的数据对应关系. 主要介绍object,int64,float64,datetime64,bool等几种类型,category与timedelta两种类型会单独的在其他文章中进行介绍.当然本文中也会涉及简单的介绍.

  • Python数据类型转换详解

    目录 1. Python的数据类型 2. Python数据类型转换 2.1 自动类型转换 2.2 强制类型转换 2.2.1 其他转字符串 2.2.2 其他转数字类型 2.2.3 其他转列表类型 2.2.4 其他转元组类型 2.2.5 其他转集合类型 2.2.6 其他转字典类型 总结 1. Python的数据类型 上一遍博文已经详细地介绍了Python的数据类型,详见链接Python的变量命名及数据类型. 在这里总结一下Python的数据类型: 字符串类型 String 数字类型 Number:

  • Pandas实现数据类型转换的一些小技巧汇总

    前言 Pandas是Python当中重要的数据分析工具,利用Pandas进行数据分析时,确保使用正确的数据类型是非常重要的,否则可能会导致一些不可预知的错误发生. Pandas 的数据类型:数据类型本质上是编程语言用来理解如何存储和操作数据的内部结构.例如,一个程序需要理解你可以将两个数字加起来,比如 5 + 10 得到 15.或者,如果是两个字符串,比如「cat」和「hat」,你可以将它们连接(加)起来得到「cathat」.尚学堂•百战程序员陈老师指出有关 Pandas 数据类型的一个可能令人

  • Numpy数据类型转换astype,dtype的方法

    1.查看数据类型 In [11]: arr = np.array([1,2,3,4,5]) In [12]: arr Out[12]: array([1, 2, 3, 4, 5]) // 该命令查看数据类型 In [13]: arr.dtype Out[13]: dtype('int64') In [14]: float_arr = arr.astype(np.float64) // 该命令查看数据类型 In [15]: float_arr.dtype Out[15]: dtype('float

  • Pandas中Series的创建及数据类型转换

    目录 一.实战场景 二.主要知识点 三.菜鸟实战 1.创建 python 文件,用Numpy创建Series 2.转换Series的数据类型 四.补充 1.创建 python 文件,数据list,变成Pandas的Series对象 2.数据dict变成Pandas的Series对象 3.把Pandas的Series对象变成数据list 一.实战场景 实战场景:Pandas中Series的创建和数据类型转换,Series的创建和数据类型转换,Series 类似于一维数组与字典(map)数据结构的结

  • Python变量、数据类型、数据类型转换相关函数用法实例详解

    本文实例讲述了Python变量.数据类型.数据类型转换相关函数用法.分享给大家供大家参考,具体如下: python变量的使用不需要进行类型声明(类型名 变量名),给一个变量名赋什么值就是什么类型. 变量的赋值使用 = 说明:虽然python声明变量时没有一个类型来圈注,但它并不是弱类型语言,相反,它是一门强类型语言. 弱类型的语言的东西没有明显的类型,它能随着环境的不同自动变换类型: 而强类型则没这样的规定,不同类型间的操作有严格定义,只有相同类型的变量才能操作 为什么说 Python 是强类型

  • pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

    1 引言 Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用.本文主要介绍Pandas的几种数据选取的方法. Pandas中,数据主要保存为Dataframe和Series是数据结构,这两种数据结构数据选取的方式基本一致,本文主要以Dataframe为例进行介绍. 在Dataframe中选取数据大抵包括3中情况: 1)行(列)选取(单维度选取):df[].这种情况一次只能选取行或者列,即一次选取中,只能为行或者列设置筛选条件(只能为一个维度设置筛选条件). 2

  • python3的数据类型及数据类型转换实例详解

    之前介绍过python开发工具Jupyter的使用,今天继续讲解python的数据类型,python中有整型.浮点型.字符串.布尔类型,我们重点介绍布尔类型的运算,以及不同数据类型之间的转换.使用Jupyter运行的时候有两个快捷键,Shift + Enter执行本单元,并且光标会移动到下一个单元:Ctrl + Enter是执行本单元,并且光标留在本单元. 在python的数据类型中,我们定义变量a = 1, 那么a是一个整型:定义变量b = 1.2,那么b就是一个浮点型,浮点型还有一种科学记数

随机推荐