Python 查看数据类型与格式

目录
  • Python查看数据类型与格式
    • 先随机创一点数据用来测试
    • 查看现有的数据是数据框类型还是数组矩阵类型
    • 查看数据格式是字符串还是数字格式
  • Python数据类型bytes
    • 1 bytes类型的特性
    • 2 bytes类型创建与转化
    • 3 bytes类型切片迭代

Python查看数据类型与格式

一般我们拿到一个数据,会先看一下这个数据有多少行多少列,各个字段是什么,数据格式类型是什么。在开始讲数据格式前,需要先梳理一下各个数据类型。

我们常使用的库一般是numpy和pandas,Numpy下的核心是数组(array,ndarray),Pandas下的核心是数据框(Series,DataFrame)

先随机创一点数据用来测试

import pandas as pd
import numpy as np
df=pd.DataFrame(np.random.randint(5,10,size=(10,2)),columns=['a','b'])
Array=np.random.randint(5,10,size=(10,2))
#假设我们不知道df和Array是什么数据类型

查看现有的数据是数据框类型还是数组矩阵类型

语法:type(XXX),适用于tuple/list/array/ndarray/Series/Dataframe

print(type(df))
#输出 class 'pandas.core.frame.DataFrame'这是DataFrame类型的数据
print(type(Array))
#输出class 'numpy.ndarray'这是多维数组
print(type(tuple(Array)))
#输出'tuple'这是元组
print(type(list(df['a'])))
#输出'class list'这是一个list类型

查看数据格式是字符串还是数字格式

这里需要区分一下Numpy和Pandas的查看方式略有不同,一个是dtype,一个是dtypes

print(Array.dtype)
#输出int64
print(df.dtypes)
#输出Df下所有列的数据格式 a:int64,b:int64

Python数据类型bytes

1 bytes类型的特性

Python 3.x之后,Python自带字符默认使用utf-8格式编码和显示

  • Python默认字符串string数据类型是utf-8显示形式的序列
  • bytes数据类型是utf-8格式的二进制形式的不可变序列
  • bytearray数据类型是utf-8格式的二进制形式的可变序列

1.1 ASCII表

2 bytes类型创建与转化

2.1 bytes类型与数字

数字类型并不是字符串,无法直接生成对应的bytes类

Python对数字类型定义了特殊意义

① 当入参为数字时,表示创建nul(\x00)的向量

byte_str = bytes(10)
print(byte_str)
>>> b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'

② 当入参为数字的序列时,直接转为bytes的序列,且对应值相同,将数字序列直接写入底层应该使用这种方法

byte_str = bytes([1, 10, 0xF])
print(byte_str)
>>> b'\x00\x10\x0f'

③ 当二进制数据在[33, 126]区间时,属于ASCII表上可显示字符范围,会直接显示对应的字符

数字直接使用bytes创建

byte_str = bytes([33, 48, 126])
print(byte_str)
>>> b'!0~'

2.2 bytes类型与ASCII字符

2.2.1 创建bytes数据

① 使用b''创建

byte_str = b'Python'
print(byte_str)
>>> b'Python'

② 使用bytes()创建不可变序列

byte_str = bytes('Python', encoding='utf-8')
print(byte_str)
>>> b'Python'

③ 使用bytearray()创建可变序列

byte_str = bytearray('Python', encoding='utf-8')
print(byte_str)
>>> bytearray(b'Python')

2.2.2 还原bytes数据

① 使用bytes.decode()还原不可变序列

byte_str = bytes('Python', encoding='utf-8')
utf_str = bytes.decode(byte_str)
print(utf_str)
>>> 'Python'

② 使用bytearray.decode()还原可变序列

byte_str = bytearray('Python', encoding='utf-8')
utf_str = bytearray.decode(byte_str)
print(utf_str)
>>> 'Python'

2.3 bytes类型与汉字

在UTF-8中,每个汉字用3个Byte表示

byte_str = bytes('我是', encoding='utf-8')
print(byte_str)
>>> b'\xe6\x88\x91\xe6\x98\xaf'

还原:

byte_str = b'\xe6\x88\x91\xe6\x98\xaf'
utf_str = bytes.decode(byte_str)
print(utf_str)
>>> '我是'

3 bytes类型切片迭代

① 通过bytes[index]方式返回的是底层int类型

byte_str = b'a'
print(type(byte_str[0]))
print(byte_str[0])
>>> <class 'int'>
>>> 97
byte_str = b'abc'
print(type(byte_str[2]))
print(byte_str[2])
>>> <class 'int'>
>>> 99

② 通过for ... in bytes方式返回的是底层int类型

byte_str = b'abc'
for byte in byte_str:
    print(type(byte))
    print(byte)
    
>>> <class 'int'>
>>> 97
>>> <class 'int'>
>>> 98
>>> <class 'int'>
>>> 99

③ 通过bytes[start:end]方式返回的是底层bytes类型

byte_str = b'a'
print(type(byte_str[:]))
print(byte_str[:])
>>> <class 'bytes'>
>>> b'a'

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Python查看Tensor尺寸及查看数据类型的实现

    目录 查看Tensor尺寸及查看数据类型 Tensor尺寸查看 数据类型查看 Pytorch基本数据类型tensor Python和Pytorch数据类型对应 创建tensor的方法 一些常用的生成tensor方法 tensor的切片与索引 tensor的维度变换(重点) tensor的叠加和分割 tensor的数学运算 tensor的统计相关操作 查看Tensor尺寸及查看数据类型 Tensor尺寸查看 命令: x.shape 例子: input = torch.randn(20,16,50,

  • Python组合数据类型详解

    目录 集合 元组 创建方式 列表 操作函数 操作方法 列表的引用 字典 查找 修改和添加 字典的操作函数 字典的操作方法 集合 创建集合有两种方式: 第一种: T = {11,111,"11"} print(T) # {'11', 111, 11} 第二种: T = set("Hello Would") print(T) {'H', 'e', 'o', ' ', 'l', 'd', 'u', 'W'}  注意: 1.如果创建空集合必须使用第二种方法. 2.集合中元素

  • Python Pandas 修改表格数据类型 DataFrame 列的顺序案例

    目录 一.修改表格数据类型 DataFrame 列的顺序 1.1主要知识点 1.2创建 python 文件 1.3运行结果 二.Pandas 如何统计某个数据列的空值个数 2.1主要知识点 2.2创建 python 文件 2.3运行结果 三.Pandas如何移除包含空值的行 3.1主要知识点 3.2创建 python 文件 3.3运行结果 四.Pandas如何精确设置表格数据的单元格的值 4.1主要知识点 4.2创建 python 文件 4.3运行结果 一.修改表格数据类型 DataFrame

  • Python NumPy教程之数据类型对象详解

    每个 ndarray 都有一个关联的数据类型 (dtype) 对象.这个数据类型对象(dtype)告诉我们数组的布局.这意味着它为我们提供了以下信息: 数据类型(整数.浮点数.Python 对象等) 数据大小(字节数) 数据的字节顺序(小端或大端) 如果数据类型是子数组,它的形状和数据类型是什么. ndarray 的值存储在缓冲区中,可以将其视为连续的内存字节块.所以这些字节将如何被解释由dtype对象给出. 构造数据类型(dtype)对象 数据类型对象是 numpy.dtype 类的一个实例,

  • python如何获取tensor()数据类型中的值

    目录 获取tensor()数据类型的值 一.问题 二.解决方法 tensorflow笔记:tensor数据类型 常见的数据类型载体 Tensor是什么 Tensor支持的类型 Tensor Property 获取tensor()数据类型的值 一.问题 只想要216.8973那个数. 二.解决方法 1.单个tensor tensor.item() 就可以得到216.8973. 2.多个tensor tensor.tolist() 完美解决~ tensorflow笔记:tensor数据类型 常见的数

  • python输入、数据类型转换及运算符方式

    目录 一.输入 二.常用转换数据类型的函数 三.运算符 1.算术运算符 2.赋值运算符 3.复合赋值运算符 4.比较运算符 5.逻辑运算符 一.输入 input("提示内容") (1)当程序执行到input,等待用户输入,输入完成后才继续往下执行 (2)input接收用户输入后,一般存储到变量,方便使用 (3)input会把接收到的任意用户输入的数据都当作字符串处理 对input()的应用 代码: 输出结果: 二.常用转换数据类型的函数 函数 说明 int(x) 将x转化为一个整数 f

  • Python 查看数据类型与格式

    目录 Python查看数据类型与格式 先随机创一点数据用来测试 查看现有的数据是数据框类型还是数组矩阵类型 查看数据格式是字符串还是数字格式 Python数据类型bytes 1 bytes类型的特性 2 bytes类型创建与转化 3 bytes类型切片迭代 Python查看数据类型与格式 一般我们拿到一个数据,会先看一下这个数据有多少行多少列,各个字段是什么,数据格式类型是什么.在开始讲数据格式前,需要先梳理一下各个数据类型. 我们常使用的库一般是numpy和pandas,Numpy下的核心是数

  • python查看数据类型的方法

    python怎么查看数据类型? 第一步我们首先需要知道在python中查看变量数据类型是使用type()函数,type函数的用法如下图所示: 第二步我们打开py文件,输入 import numpy as npa1=123list=[1,2,3,4,5,6]array=np.array(list)print(type(a1)) 打印出a1变量的数据类型,如下图所示: 第三步运行py文件之后,可以看到a1变量是int类型,如下图所示: 第四步输入 print(type(list))print(typ

  • Python基本数据类型及内置方法

    目录 一 引子 二 数字类型int与float 2.1 定义 2.2 类型转换 2.3 使用 三 字符串 3.1 定义 3.2 类型转换 3.3 使用 3.3.1 优先掌握的操作 3.3.2 需要掌握的操作 3.3.3 了解操作 四 列表 4.1 定义 4.2 类型转换 4.3 使用 4.3.1 优先掌握的操作 4.3.2 了解操作 五 元组 5.1 作用 5.2 定义方式 5.3 类型转换 5.4 使用 六 字典 6.1 定义方式 6.2 类型转换 6.3 使用 6.3.1 优先掌握的操作 6

  • python解析基于xml格式的日志文件

    大家中午好,由于过年一直还没回到状态,好久没分享一波小知识了,今天,继续给大家分享一波Python解析日志的小脚本. 首先,同样的先看看日志是个啥样. 都是xml格式的,是不是看着就头晕了??没事,我们先来分析一波. 1.每一段开头都是catalina-exec,那么我们就按catalina-exec来分,分了之后,他们就都是一段一段的了. 2.然后,我们再在已经分好的一段段里面分,找出你要分割的关键字,因为是xml的,所以,接下来的工作就简单了,都是一个头一个尾的. 3.但是还有一个问题,有可

  • python 把数据 json格式输出的实例代码

    有个要求需要在python的标准输出时候显示json格式数据,如果缩进显示查看数据效果会很好,这里使用json的包会有很多操作 import json date = {u'versions': [{u'status': u'CURRENT', u'id': u'v2.3', u'links': [{u'href': u'http://controller:9292/v2/', u'rel': u'self'}]}, {u'status': u'SUPPORTED', u'id': u'v2.2'

  • Python实现按特定格式对文件进行读写的方法示例

    本文实例讲述了Python实现按特定格式对文件进行读写的方法.分享给大家供大家参考,具体如下: #! /usr/bin/env python #coding=utf-8 class ResultFile(object): def __init__(self, res): self.res = res def WriteFile(self): fp = open('pre_result.txt', 'w') print 'write start!' try: for item in self.re

  • 简单谈谈python基本数据类型

    int(整型) 在32位机器上,整数的位数为32位,取值范围为-2**31-2**31-1,即-2147483648-2147483647 在64位系统上,整数的位数为64位,取值范围为-2**63-2**63-1,即-9223372036854775808-9223372036854775807 long(长整型) 跟C语言不同,Python的长整数没有指定位宽,即:Python没有限制长整数数值的大小,但实际上由于机器内存有限,我们使用的长整数数值不可能无限大. 注意,自从Python2.2

  • Python简单读写Xls格式文档的方法示例

    本文实例讲述了Python简单读写Xls格式文档的方法.分享给大家供大家参考,具体如下: 1. 模块安装 使用pip install命令安装, 即: pip install xlrd pip install xlwt 如下图: 2. python 代码 import xlrd import xlwt import datetime def set_style(name,height,format,bold=False): style = xlwt.XFStyle() if format.stri

  • Python基本数据类型之字符串str

    字符串的表示方式 单引号 ' ' 双引号 " " 多引号 """ """"  . ''' ''' print("hello world") print('hello world') print("""hello world""") # 输出结果 hello world hello world hello world 为什么需要单引号,又需

随机推荐