python语言中pandas字符串分割str.split()函数

目录
  • 前言
  • 1、常规赛数据格式
  • 2、计算詹姆斯常规赛命中率
  • 总结

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

True:返回DataFrame / MultiIndex;

False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python pandas分割DataFrame中的字符串及元组的方法实现

    目录 1.使用str.split()方法 2.使用join()与split()方法结合 3.使用apply方法分割元组 1.使用str.split()方法 可以使用pandas 内置的 str.split() 方法实现分割字符串类型的数据,并将分割结果写入DataFrame中,以表格形式呈现. 语法: Series.str.split(pat=None, n=-1, expand=False) 其中,pat是字符串或正则表达式,n是一个整数数字,默认为-1.为0或-1时即为最大次数的分割.其他数

  • python语言中pandas字符串分割str.split()函数

    目录 前言 1.常规赛数据格式 2.计算詹姆斯常规赛命中率 总结 前言 为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明.利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载. 这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法. DataFrame.str.split(pa,n,expand)pa

  • python字符串切割:str.split()与re.split()的对比分析

    1.str.split不支持正则及多个切割符号,不感知空格的数量,比如用空格切割,会出现下面情况. >>> s1="aa bb cc" >>> s1.split(' ') ['aa', 'bb', '', 'cc'] 因此split只适合简单的字符分割 2.re.split,支持正则及多个字符切割 >>> print line abc aa;bb,cc | dd(xx).xxx 12.12' xxxx 按空格切 >>&

  • Python语言中Tuple的由来分析

    目录 Tuple概述 Tuple与英语 Tuple与数学 Tuple与编程 Tuple概述 在Python中使用元组(Tuple)存储一组信息,其特征如下: 1.使用()定义元组2.元组中使用逗号 , 分割各元素:各元素类型可不一致.3.元组的索引(下标)从0开始4.可使用len(元组)求元组的元素个数5.元组元素个数 = 元组索引最大值 + 16.通过元组[索引]的方式获取元组中的元素 简单来说:Tuple在Python中表示一种“大小固定的有序序列” Tuple与英语 之前,有位可爱的小伙伴

  • Python语言中的if语句详情

    目录 1.简单介绍 2.if-else语句 3.用if语句来处理列表 1.简单介绍 每条if语句的核心都是一个值为True或False的表达式,这种表达式被称为条件测试.Python 根据条件测试的值为True还是False来决定是否执行if语句中的代码.如果条件测试的值为True,Python就执行紧跟在if语句后面的代码:如果为False,Python就忽略这些代码. 要判断是否相等,我们可以使用==来进行判断: car = 'Audi' car.lower() == 'audi' 输出的结

  • Python语言中的Selenium环境搭建

    目录 1.selenium 介绍 1.1 selenium历史 1.Selenium 1.0 2.Selenium 2.0 3.Selenium 3.0 2. selenium的环境配置步骤 2.1 安装/卸载 selenium 2.2 安装 drive 3.selenium-webdriver元素定位参考 4. 实例 1.selenium 介绍 Selenium是一个用于Web应 用程序测试的工具.Selenium测试直接运行在浏览器中,就像真正的用户在操作一样.支持的浏览器包括IE (7,

  • R语言中cbind、rbind和merge函数的使用与区别

    cbind: 根据列进行合并,即叠加所有列,m列的矩阵与n列的矩阵cbind()最后变成m+n列,合并前提:cbind(a, c)中矩阵a.c的行数必需相符 rbind: 根据行进行合并,就是行的叠加,m行的矩阵与n行的矩阵rbind()最后变成m+n行,合并前提:rbind(a, c)中矩阵a.c的列数必需相符 > a <- matrix(1:12, 3, 4) > print(a) [,1] [,2] [,3] [,4] [1,] 1 4 7 10 [2,] 2 5 8 11 [3,

  • python语言中with as的用法使用详解

    With语句是什么? 有一些任务,可能事先需要设置,事后做清理工作.对于这种场景,Python的with语句提供了一种非常方便的处理方式.一个很好的例子是文件处理,你需要获取一个文件句柄,从文件中读取数据,然后关闭文件句柄. 如果不用with语句,代码如下: file = open("/tmp/foo.txt") data = file.read() file.close() 这里有两个问题.一是可能忘记关闭文件句柄:二是文件读取数据发生异常,没有进行任何处理.下面是处理异常的加强版本

  • R语言中if(){}else{}语句和ifelse()函数的区别详解

    首先看看定义: # if statement if(cond) expr if(cond) cons.expr else alt.expr # ifelse function ifelse(test, yes, no) 这两个函数(R语言中都是函数)相同的地方都是根据条件返回对应的值. 区别在于: if语句的条件是个TRUE/FALSE值,如果是个长度>1的逻辑向量,只判断第一个TRUE/FALSE值:而ifelse是长度任意的逻辑向量,返回根据逻辑向量对应对的yes/no值组合的新向量 ife

  • Python内置的字符串处理函数整理

    str='python String function' 生成字符串变量str='python String function' 字符串长度获取:len(str)例:print '%s length=%d' % (str,len(str)) 字母处理全部大写:str.upper()全部小写:str.lower()大小写互换:str.swapcase()首字母大写,其余小写:str.capitalize()首字母大写:str.title()print '%s lower=%s' % (str,st

  • Python内置的字符串处理函数详细整理(覆盖日常所用)

    str='python String function' 生成字符串变量str='python String function' 字符串长度获取:len(str) 例:print '%s length=%d' % (str,len(str)) 字母处理 全部大写:str.upper() 全部小写:str.lower() 大小写互换:str.swapcase() 首字母大写,其余小写:str.capitalize() 首字母大写:str.title() print '%s lower=%s' %

随机推荐