python训练数据时打乱训练数据与标签的两种方法小结

2025-04-02 01:03:52

如下所示：

<code class="language-python">import numpy as np 

data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])
y = np.array([1,2,3,4,5])

print '-------第1种方法：通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------'
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])
data_num, _= data.shape #得到样本数
index = np.arange(data_num) # 生成下标
np.random.shuffle(index)
print '-------原数据：----------'
print '数据：',data
print '标签：', y
print '-------打乱数据：----------'
print '数据：',data[index]
print '标签：',y[index]

print '-------第2种方法：直接的打乱数据,利用随机数种子，好处：每次打乱的顺序是固定的----------'
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]])
y = np.array([1,2,3,4,5])

print '-------原数据：----------'
print '数据：',data
print '标签：', y
print '-------打乱数据：----------'
np.random.seed(116)
np.random.shuffle(data)
np.random.seed(116)
np.random.shuffle(y)
print '数据：',data
print '标签：', y</code>

以上这篇python训练数据时打乱训练数据与标签的两种方法小结就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

Tensorflow 训练自己的数据集将数据直接导入到内存

制作自己的训练集下图是我们数据的存放格式,在data目录下有验证集与测试集分别对应iris_test, iris_train 为了向伟大的MNIST致敬,我们采用的数据名称格式和MNIST类似 classification_index.jpg 图像的index都是5的整数倍是因为我们选择测试集的原则是每5个样本,选择一个样本作为测试集,其余的作为训练集和验证集生成这样数据的过程相对简单,如果有需要python代码的,可以给我发邮件,或者在我的github下载至此,我们的训练集,测试集,验证
Python中对数组集进行按行打乱shuffle的方法

如下所示: import numpy as np y1=np.random.randint(2,10,(5,3)) print ("排序列表:", y1) np.random.shuffle(y1) print ("随机排序列表:", y1) 以上这篇Python中对数组集进行按行打乱shuffle的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
对Python random模块打乱数组顺序的实例讲解

在我们使用一些数据的过程中,我们想要打乱数组内数据的顺序但不改变数据本身,可以通过改变索引值来实现,也就是将索引值重新随机排列,然后生成新的数组.功能主要由python中random模块的sample()函数实现. sample(population, k) method of random.Random instance Chooses k unique random elements from a population sequence or set. 下面的代码实现的是打乱iris数据,i
python训练数据时打乱训练数据与标签的两种方法小结

如下所示: <code class="language-python">import numpy as np data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) y = np.array([1,2,3,4,5]) print '-------第1种方法:通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------' data = np.array([[1,1],[2,2],[3,3],[4,4
JavaScript检查数据中是否存在相同的元素（两种方法）

这里是两个用于数组中查找重复元素的demo,可以看看啦 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> </head> <body> <input type="text" id="Values" style=
python 读取文件并把矩阵转成numpy的两种方法

在当前目录下: 方法1: file = open('filename') a =file.read() b =a.split('\n')#使用换行 len(b) #统计有多少行 for i in range(len(b)): b[i] = b[i].split()#使用空格分开 len(b[0])#可以查看第一行有多少列. B[0][311]#可以查看具体某行某列的数 import numpy as np b = np.array(b)#转成numpy形的 type(b) # 输出<输出clas
Python实现平行坐标图的两种方法小结

平行坐标图,一种数据可视化的方式.以多个垂直平行的坐标轴表示多个维度,以维度上的刻度表示在该属性上对应值,相连而得的一个折线表示一个样本,以不同颜色区分类别. 但是很可惜,才疏学浅,没办法在Python里实现不同颜色来区分不同的类别.如果对此比较在意的大神可以不要往下看了......... 上图是一个基于iris数据集所画的一个平行坐标图. 隔开隔开.......................................隔开隔开不多扯了,下面正式上代码方法一.基于pyecharts第三
python 字典中取值的两种方法小结

如下所示: a={'name':'tony','sex':'male'} 获得name的值的方式有两种 print a['name'],type(a['name']) print a.get('name'),type(a.get('name')) 发现这两个结果完全一致,并没有任何的差异. 怎么选择这两个不同的字典取值方式呢? 如果字典已知,我们可以任选一个,而当我们不确定字典中是否存在某个键时,我之前的做法如下 if 'age' in a.keys(): print a['age'] 因为不先
Python多线程编程（二）：启动线程的两种方法

在Python中我们主要是通过thread和threading这两个模块来实现的,其中Python的threading模块是对thread做了一些包装的,可以更加方便的被使用,所以我们使用threading模块实现多线程编程.一般来说,使用线程有两种模式,一种是创建线程要执行的函数,把这个函数传递进Thread对象里,让它来执行:另一种是直接从Thread继承,创建一个新的class,把线程执行的代码放到这个新的 class里. 将函数传递进Thread对象复制代码代码如下: ''' Cr
分割python多空格字符串的两种方法小结

目录分割python多空格字符串做法第一种做法第二种做法如何分割字符串 1.按空格分割 2.分割+最大分割 3.用#分割分割python多空格字符串这篇文章需要处理的问题就是: 一个字符串被多个不同长度的空白分割,我需要把空格去掉,留下有用的信息形成一个列表如:"aa bbbbb ccc d" ---->['aa', 'bbbbb', 'ccc', 'd'] 做法 1.str.split() 2.filter(None,str.split(" "
Select2在使用ajax获取远程数据时显示默认数据的方法

假设我需要在我的select2中默认添加一个之前从服务器上获取过的数据,通过以下方法实现.实测可行~ var value = 1 var text = '默认文本' $('.selecter').html('<option value="' + value + '">' + text + '</option>').trigger("change") 以上代码其实就是将class="selecter"的select内容进行重
python向json中追加数据的两种方法总结

目录前言 1. list dump (不推荐) 2. json update (推荐使用) 总结前言 json以其轻量级的数据交换格式,且易于阅读和编写而使用率很广泛,而使用json的过程中时而需要增加字段,本人验证两种方式之后将其集成梳理. 具体操作详情如下: 1. list dump (不推荐) 采用list方式,向json中添加字段.此法存在一定的问题,不推荐使用. 方法如下: (1)先创建一个列表: json_content = [] (2)将当前json文件中已有的内容读入列表中:
分享MYSQL插入数据时忽略重复数据的方法

使用下以两种方法时必须把字段设为"主键(PRIMARY KEY"或"唯一约束(UNIQUE)".1:使用REPLACE INTO (此种方法是利用替换的方法,有点似类于先删除再插入) 复制代码代码如下: REPLACE INTO Syntax REPLACE [LOW_PRIORITY | DELAYED] [INTO] tbl_name [(col_name,...)] {VALUES | VALUE} ({expr | DEFAULT}

python训练数据时打乱训练数据与标签的两种方法小结

相关推荐

随机推荐