python库sklearn常用操作

2025-04-04 00:32:15

前言

　sklearn是python的重要机器学习库，其中封装了大量的机器学习算法，如：分类、回归、降维以及聚类；还包含了监督学习、非监督学习、数据变换三大模块。sklearn拥有完善的文档，使得它具有了上手容易的优势；并它内置了大量的数据集，节省了获取和整理数据集的时间。因而，使其成为了广泛应用的重要的机器学习库。

sklearn是一个无论对于机器学习还是深度学习都必不可少的重要的库，里面包含了关于机器学习的几乎所有需要的功能，因为sklearn库的内容是如此之多以至于一开始就从宏观层面展开的话很可能会使初学者感到困惑和恐惧。相反的，本文不会先整体介绍sklearn库，而是先从sklearn库中的一些具体实例入手，在读者学习完一些比较常用的函数并且对他们的功能有了一定了解之后，本文再从宏观展开，全面细致的讲解sklearn库。本博客中的实例几乎都来自我自己学习keras的过程中，建议与我的另外一篇写keras的博客一同食用，理解起来更佳。

一、MinMaxScaler

MinMaxScaler函数主要的用途就在于数据归一化。数据归一化是在我们开始深度学习之前做的数据预处理过程中的重要一环，简单来说就是将我们的测试样本的元素都集中在[0,1]的区间上，数据归一化可以让我们的神经网络模型学习起来更快达到最佳点，如果不进行归一化的话神经网络可能会花费很长时间来收敛（也就是到达最佳点）甚至可能最终也不会收敛。同时，数据归一化也可以大大增加神经网络中可学习参数的精度，从而达到更好的学习效果。下面就是MinMaxScaler函数的实例应用。

from sklearn import preprocessing
import numpy as np

x = np.array([[3., -1., 2., 613.],
              [2., 0., 0., 232],
              [0., 1., -1., 113],
              [1., 2., -3., 489]])

min_max_scaler = preprocessing.MinMaxScaler()
x_minmax = min_max_scaler.fit_transform(x)
print(x_minmax)

运行结果：

[[1. 0. 1. 1. ]

[0.66666667 0.33333333 0.6        0.238     ]
[0.         0.66666667 0.4        0.        ]
[0.33333333 1.         0.         0.752     ]]
总结起来就是两步：1.scaler=preprocessing.MinMaxScaler()
               2.x1=scaler.fit_transform(x)
x1就是归一化之后的结果
注意，想要引入MinMaxScaler可以有两种import的方式，除了上文中的方式还可以这样做：

from sklearn.preprocessing import MinMaxScaler

到此这篇关于python库sklearn常用操作的文章就介绍到这了,更多相关python库sklearn内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Python基于sklearn库的分类算法简单应用示例

本文实例讲述了Python基于sklearn库的分类算法简单应用.分享给大家供大家参考,具体如下: scikit-learn已经包含在Anaconda中.也可以在官方下载源码包进行安装.本文代码里封装了如下机器学习算法,我们修改数据加载函数,即可一键测试: # coding=gbk ''' Created on 2016年6月4日 @author: bryan ''' import time from sklearn import metrics import pickle as pickle
python sklearn库实现简单逻辑回归的实例代码

Sklearn简介 Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression).降维(Dimensionality Reduction).分类(Classfication).聚类(Clustering)等方法.当我们面临机器学习问题时,便可根据下图来选择相应的方法. Sklearn具有以下特点: 简单高效的数据挖掘和数据分析工具让每个人能够在复杂环境中重复使用建立NumPy.Scipy.MatPlotLib之上代
一文搞懂Python Sklearn库使用

目录 1.LabelEncoder 2.OneHotEncoder 3.sklearn.model_selection.train_test_split随机划分训练集和测试集 4.pipeline 5 perdict 直接返回预测值 6 sklearn.metrics中的评估方法 7 GridSearchCV 8 StandardScaler 9 PolynomialFeatures 4.10+款机器学习算法对比 4.1 生成数据 4.2 八款主流机器学习模型 4.3 树模型 - 随机森林 4.
Python sklearn库实现PCA教程(以鸢尾花分类为例)

PCA简介主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理等.矩阵的主成分就是其协方差矩阵对应的特征向量,按照对应的特征值大小进行排序,最大的特征值就是第一主成分,其次是第二主成分,以此类推. 基本步骤: 具体实现我们通过Python的sklearn库来实现鸢尾花数据进行降维,数据本身是4维的降维后变成2维,可以在平面中画出样本点的分布.样本数据结构如下图: 其中样本总数为150
python常用库之NumPy和sklearn入门

Numpy 和 scikit-learn 都是python常用的第三方库.numpy库可以用来存储和处理大型矩阵,并且在一定程度上弥补了python在运算效率上的不足,正是因为numpy的存在使得python成为数值计算领域的一大利器:sklearn是python著名的机器学习库,它其中封装了大量的机器学习算法,内置了大量的公开数据集,并且拥有完善的文档,因此成为目前最受欢迎的机器学习学习与实践的工具. 1. NumPy库首先导入Numpy库 import numpy as np 1.1 nu
Python使用sklearn库实现的各种分类算法简单应用小结

本文实例讲述了Python使用sklearn库实现的各种分类算法简单应用.分享给大家供大家参考,具体如下: KNN from sklearn.neighbors import KNeighborsClassifier import numpy as np def KNN(X,y,XX):#X,y 分别为训练数据集的数据和标签,XX为测试数据 model = KNeighborsClassifier(n_neighbors=10)#默认为5 model.fit(X,y) predicted = m
python库sklearn常用操作

目录前言一.MinMaxScaler 前言 sklearn是python的重要机器学习库,其中封装了大量的机器学习算法,如:分类.回归.降维以及聚类:还包含了监督学习.非监督学习.数据变换三大模块.sklearn拥有完善的文档,使得它具有了上手容易的优势:并它内置了大量的数据集,节省了获取和整理数据集的时间.因而,使其成为了广泛应用的重要的机器学习库. sklearn是一个无论对于机器学习还是深度学习都必不可少的重要的库,里面包含了关于机器学习的几乎所有需要的功能,因为sklearn库的内容
python pymysql库的常用操作

批量插入 import pymysql def insert_to_mysql(to_db_list): mysql_db = pymysql.connect(host="HOST_IP", port=3306, user="username", password="password", database="db", charset="utf8") cursor = mysql_db.cursor() sq
python数据分析Numpy库的常用操作

numpy库的引入: import numpy as np 1.numpy对象基础属性的查询 lst = [[1, 2, 3], [4, 5, 6]] def numpy_type(): print(type(lst)) data = np.array(lst, dtype=np.float64) # array将数组转为numpy的数组 # bool,int,int8,int16,int32,int64,int128,uint8,uint32, # uint64,uint128,float16
Python中字典常用操作的示例详解

目录前言初始化合并字典字典推导式 Collections 标准库字典转 JSON 字典转 Pandas 前言字典是Python必用且常用的数据结构,本文梳理常用的字典操作,看这个就够了,涉及: 初始化合并字典字典推导式 Collections 标准库字典转JSON 字典转Pandas 初始化 # 最常用这种 my_object = { "a": 5, "b": 6 } # 如果你不喜欢写大括号和双引号: my_object = dict(a=5,
python中numpy 常用操作总结

前言: NumPy 是 Python 语言的一个扩充程序库,支持大量高维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库.同时NumPy 是机器学习必不可少的工具之一. 常用操作主要有: 创建数组数组运算数学函数数组切片和索引数组形状操作数组排序数组统计环境 Python 3.6 NumPy: 1.14.2 1.导包 import numpy as np 2.通过列表创建数组 array() np.array([1, 2, 3]) #一维数组 np.array([(1, 2
python中list常用操作实例详解

本文实例讲述了python中list常用操作.分享给大家供大家参考.具体分析如下: 1.定义list >>> li = ["a", "b", "mpilgrim", "z", "example"] >>> li ['a', 'b', 'mpilgrim', 'z', 'example'] >>> li[0] 'a' >>> li[4]
浅谈MySQL在cmd和python下的常用操作

环境配置1:安装mysql,环境变量添加mysql的bin目录环境配置2:python安装MySQL-Python 请根据自身操作系统下载安装,否则会报c ++ compile 9.0,import _mysql等错误 windows10 64位操作系统可到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载安装MySQL-Python包,至于whl和tar.gz在windows和Linux下的安装方法可查看我的上一篇文章一 .cmd命令下的操作: 连
Python列表切片常用操作实例解析

这篇文章主要介绍了Python列表切片常用操作实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下最近在爬一个网站的文档的时候,老师要求把一段文字切割开来,根据中间的文本分成两段故学习了一段时间的切片操作,现把学习成果po上来与大家分享 1.何为切片? 列表的切片就是处理列表中的部分元素,是把整个列表切开的方法. 切片可以说是整个列表中的重点内容,相信你在以后的Python项目中会经常使用到. 它的语法是: 2.简单介绍切片的几个常见操作
Python数据类型和常用操作

目录一.数值二.字符串三.列表四.元组五.字典六.集合一.数值数值数据类型用于存储数值,数据类型不可改变,改变会分配一个新的对象,在Python中,“与或非”布尔操作使用关键词and/or/not. 基本常用操作代码: print(True+False) #输出为1,True默认为1,False为0 print(True or False) #输出True,关键字or执行"或"操作 print(5//2) #输出2,//为取整运算符 print(5%2) #输出1,%为
python中set常用操作汇总

sets 支持 x in set, len(set),和 for x in set.作为一个无序的集合,sets不记录元素位置或者插入点.因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作. 下面我们通过几个例子,来简单说明下常用操作1 In [2]: a = set() In [3]: a Out[3]: set() In [4]: type(a) Out[4]: set In [5]: b = set([1, 3]) In [6]:

python库sklearn常用操作

目录

前言

一、MinMaxScaler

相关推荐

随机推荐