Python使用指定字符长度切分数据示例

处理思路

笔者在学习时被要求在Python中使用指定字符长度切分数据。

如,string类型的字符串film_type = ‘都市浪漫爱情喜剧',已知电影类型都是两个中文字符组成,要求切分出字符串中的电影类型。

这种情况下,我们可以使用xrange()函数,通过步长来切分。

涉及知识

xrange() 函数用法与 range 完全相同,所不同的是生成的不是一个数组,而是一个生成器。

xrange 语法:

xrange(stop)
xrange(start, stop[, step])

参数说明:

start: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0, 5);
stop: 计数到 stop 结束,但不包括 stop。例如:range(0, 5) 是[0, 1, 2, 3, 4]没有5
step:步长,默认为1。例如:range(0, 5) 等价于 range(0, 5, 1)

文件&代码

# encoding: utf-8
import pandas as pd

film_type = '都市浪漫爱情喜剧'
film_type_new = []
for i in xrange(0, len(film_type), 6):
  film_type_new.append(film_type[i:i+6])
for i in film_type_new:
  print i

以上这篇Python使用指定字符长度切分数据示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Python补齐字符串长度的实例

    如下所示: ljust(len,str)字符向左对齐,用str补齐长度 rjust(len,str)字符向右对齐,用str补齐长度 rjust(len,str)字符中间对齐,用str补齐长度 print 'bbb'.ljust(10,'a') 输出:bbbaaaaaaa print 'bbb'.rjust(10,'a') 输出:aaaaaaabbb print 'bbb'.center(10,'a') 输出:aaabbbaaaa zfill(width)指定字符串长度,右对齐,前面补充0 pri

  • python实现对指定字符串补足固定长度倍数截断输出的方法

    简单的小练习,注意考虑全可能就行,下面是实现: #!usr/bin/env python #encoding:utf-8 ''' __Author__:沂水寒城 功能:•连续输入字符串,请按长度为8拆分每个字符串后输出到新的字符串数组: •长度不是8整数倍的字符串请在后面补数字0,空字符串不处理. ''' def func_test(): ''' 补足固定长度倍数输出 ''' a=raw_input() b=raw_input() len_a=len(a) len_b=len(b) a_list

  • python字符串分割及字符串的一些常规方法

    字符串分割,将一个字符串分裂成多个字符串组成的列表,可以理解为字符串转列表,经常会用到 语法:str.split(sep, [,max]),sep可以指定切割的符号,max可以指定切割的次数(次数不常用) 不带参数时以空格进行分割 带参数时,以该参数进行分割 未查询到分隔符时,列表只包含原始字符串 source ="1,2,3,4,5,,6" print source.split(',') #按照索引取值[] source ="1,2,3,4,5,,6" print

  • python 按照固定长度分割字符串的方法小结

    有如下的一堆mac地址,需要更改成一定格式,如mac='902B345FB021'改为mac='90-2B-34-5F-B0-21'. 借助python脚本,可以轻松实现,原理就是:字符串的按照固定长度拆分. 1,文件mac.txt,保存了如下的mac地址: 50E549E32ECB 902B3413EFA6 50E549ECBA1C 902B3457B16F 1C6F65296DF9 902B34131A14 50E549E3E2F8 50E5493A2696 902B345FB021 902

  • Python使用指定字符长度切分数据示例

    处理思路 笔者在学习时被要求在Python中使用指定字符长度切分数据. 如,string类型的字符串film_type = '都市浪漫爱情喜剧',已知电影类型都是两个中文字符组成,要求切分出字符串中的电影类型. 这种情况下,我们可以使用xrange()函数,通过步长来切分. 涉及知识 xrange() 函数用法与 range 完全相同,所不同的是生成的不是一个数组,而是一个生成器. xrange 语法: xrange(stop) xrange(start, stop[, step]) 参数说明:

  • Python获取指定字符前面的所有字符方法

    在用C和python编程时遇到的一个问题是: 用网口发送过来1k数据,数据格式是json,但是发送时不知道需要的大小,因为不同任务大小不一样,所以统一发送1024字节,统一接收1024了,之后入库,导致浪费很大空间 因此想要截取字符串: 方案有两个: 1.使用rfind函数 url = "http://www.6mm.cc/uploads/allimg/1306/2-13060F12S3.jpg" print url[0:url.rfind('/', 1) + 1] 获取到的结果:ht

  • Python opencv应用实现图片切分操作示例

    目录 说明 操作说明 代码 切换效果 说明 之前下载来zip包的漫画,里面的图片都是两张一起的: 但是某些漫画查看软件不支持自动分屏,看起来会比较不舒服,所以只能自己动手来切分. 操作说明 Python有不少的库支持图片操作,其中比较著名的一个是OpenCV. OpenCV是一个跨平台的计算机视觉库,Python下有它的接口实现. Python默认不带OpenCV,所以需要先用pip下载: OpenCV功能强大,这里用来做图片的切分其实是牛刀小试. 关于OpenCV的功能,这里不多介绍,有兴趣的

  • python读取指定字节长度的文本方法

    软件版本 Python 2.7.13; Win 10 场景描述 1.使用python读取指定长度的文本: 2.使用python读取某一范围内的文本. Python代码 test.txt文本内包含的字符串为"AAAAAAAABBBBBBBBCCCCCCCCDDDDDDDD",A,B,C,D均为8个 # -*- coding:utf-8 -*- text_file = r"test.txt" # open() f = open(text_file, "r&qu

  • AndroidStudio代码达到指定字符长度时自动换行实例

    1.设置每行最大字符个数,超过这个数字 将会自动换行 2. Line breaks 选中表示隐藏性保持断行 Ensure right margin is not exceeded 选中表示代码超过标准线 就自动换行 补充知识:Android Studio Error-Gradle: 错误:编码 GBK 的不可映射字符的 产生原因分析:项目太旧导致的 解决方案:对应项目级别build.gradle最下方添加 tasks.withType(JavaCompile) { options.encodin

  • JavaScript中英文字符长度统计方法示例【按照中文占2个字符】

    本文实例讲述了JavaScript中英文字符长度统计方法.分享给大家供大家参考,具体如下: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>JS中英文字符串长度计算</title> </head> <body> <script> var oriText = "

  • Python实现bilibili时间长度查询的示例代码

    说明:最近在B站看一些材料力学视频时候,感觉有一些分集狂魔的分集真的很恐怖,有的甚至上百集,因此决定写个小脚本每次分析下到底这个系列视频到底有多长. 好了,下面是分析过程: 第一步当然是打开一个视频 接着第二部右键查看源代码 既然我们是要查找时间,然后我就搜索time相关的,哟!,还真有,其中有个timelength,英语有点基础的应该也能读出,这不就是时长的意思.哈哈哈,这也太简单了,但是又发现高兴太早了,这个经过不论是除60还是除3600都无法得到需要的结果,就在这时,突然一个乘法口诀蹦了出

  • Python实现的根据文件名查找数据文件功能示例

    本文实例讲述了Python实现的根据文件名查找数据文件功能.分享给大家供大家参考,具体如下: #-*- coding: UTF-8 -*- import os import shutil AllFiles=[] NameFiles=[] def findFie(filePath): pathDir = os.listdir(filePath) for allDir in pathDir: # print(allDir) AllFiles.append(allDir) #pass #filepat

  • Python 删除连续出现的指定字符的实例

    源起 我本想删写一小段代码用于删除一串字符串中的连续重复的指定字符,可能也是长时间不写代码,而且有的时候写代码只途快,很多基础知识都忘光了.我用Python写时一切都没有问题,就差一点,就是我随时删除这字符串所以每一次循环的字符串的长度都不一样,所以我想没删除一次字符,能够从inde=0开始重新循环字符串,于是在循环的最后强行设置index=0,无奈不行.扣嗤两个小时后我终于决定换个方法.. 我在各博客中看到一句话,"这是一个堆栈就能搞定的问题",想想,是啊.我从网上又看到Python

  • Python 批量读取文件中指定字符的实现

    1.背景 从指定的NLP生成的文件中读取指定的字符. 2.待读取文件 是以":"作为分隔符的数据,每一行以回车结束.此文件为XXX.train 3.读取每一句中的汉字 ... file_train = os.path.join(rootDir,"data/train/rg_train_"+modle_date+"_"+aiscene+".train") with open(file_train, 'r')as fp: text

随机推荐