pyhton学习与数据挖掘self原理及应用分析

2025-02-22 15:31:04

一个画外音，我个人是比较反对在编程中，对本来是英文的专有名词进行中文翻译的。正所谓语言塑造了思维，因此一些专有名词一旦翻译过来，无论你翻译的多好，总会有一定程度的语意模糊。比如说“class”，我们在看到这个词的瞬间会联想到“课”，但是翻译过来就是“类”，于是我们会不自觉地，去按照“课”或者“一大类”去理解这个专有名词。这是一种非常严重的潜在的误导，因为class这个专有名词和“课”或者“一大类”关系都不太大。所以还不如不翻译，就当不知道这个词啥意思，在学习的过程中再慢慢理解他代表的意思。

其实因为英文的局限性，很多编程语言里的专属名词也是大佬们一拍脑袋，瞎起的。。比如我吐槽了无数次的matplotlib里面的axes。。。

又说多了。。。回到正题。

1. 什么是class，什么是instance，什么是object？

Class: 可以理解为一个组装工厂。假如我们要生产一个机器人，那我们先要搭个工厂吧。先确定：我们要先安装胳膊，再安装头，我们的小破机器人的流水线就搭好了。这个工厂比较智能，胳膊和头的数量都可以调。

class BuildRobot():
    def __init__(self,armcount,headcount):
        self.armcount = armcount
        self.headcount = headcount

所以这里的class，就是搭了一个工厂叫BuildRobot。'__init__' 就是告诉这个流水线，首先你需要这个机器人有几个胳膊（‘armcount'），有几个脑袋（‘headcount'）。先忽略一下这里的self，以后讲。

这个时候你可以run一下，这样你的class就搭好了。可是这时的工厂，因为你没有开始生产，是没有任何产出的。下面就是instance

instance：可以理解为启动一次工厂生产出的机器人。现在我们用之前搭的工厂生产一个正常一点的机器人，两个胳膊一个脑袋：

normal_robot = BuildRobot(2,1)

查看一下胳膊数对不对？

我们再来一个不太正常的机器人：

weird_robot = BuildRobot(4,1)

normal_robot 和weird_robot 都是instance。他们虽然胳膊数量不一样，但是本质上都是由这个class造出来的，由胳膊和头组成的机器人。

object：这个就比较麻烦了，大部分情况下，object和instance的含义是一样的，都是指这个造出来的robot。这两者的区别，只是在英语语言环境下的区别：

normal_robot is an instance of ‘buildrobot'

normal_robot is a ‘buildrobot' object

上面这两个说法是等价的。

2. 什么是method，什么是function？

两者都由def定义，稍微粗糙一点的理解就是，在class里面的function叫method。所以，method是和class，instance有关的一种function。

举个栗子：

还是上面的工厂，我们现在加装一个车间，负责把胳膊上色：

class BuildRobot():
    def __init__(self,armcount,headcount):
        self.armcount = armcount
        self.headcount = headcount
    def paintarm(self,color):
        print("paint arm:",color)

这个paintarm，就是一个method。还是一样，现在这个class没有生产，因此这个method也没有任何实际的产品出来。我们只能先生产出一个instance来：

colorful_robot = BuildRobot(2,1)

好的我们现在有一个两个胳膊一个头的robot了。这时，我们的robot还是没有上色的，因为我们没有让这个instance进入上色的那个车间。现在我们让这个robot进入车间，涂个红色。

colorful_robot.paintarm('red')

paint arm: red

上面的过程，就是call这个paintarm method。几个点：

如果没有先造一个机器人，这个车间就没有办法给胳膊上色，因此要上色，就必须先造一个机器人出来。所以，method是依赖于instance的。

这个车间只能给这个工厂产出的robot的胳膊上色，你从别的工厂拿一个车过来让他上色，他是不干的。因此，method是依赖于class的。只有这个class创建的instance，才能call这个method。

假如我把上色这个活，外包了。我就在外面另建了个工厂，专门上色，这就是function：

def outsourcing_paint(robot,color):
    print("paint",robot,"arm:",color)

outsourcing_paint(colorful_robot,'red')

paint <__main__.BuildRobot object at 0x116b434a8> arm: red

这个外包的上色工厂，不管你这个东西是从哪个工厂来的，无论你是个机器人还是机器狗，反正我就拿来，给胳膊上色。

看到这里，应该就明白function和method的区别了。

注意method其实有两种，一种是instance method，一种是class method。

instance method就相当于对于机器人这个产品进行各种修改的车间。我给机器人上色，不影响我这个工厂的外形对吧？
class method，是对这个工厂，这个class的属性进行修改的车间，比如我有一个车间负责把工厂涂成红色的。这个行为并不影响我造出来的机器人的大小颜色属性。

本篇的讨论，我们先限定在instance method里。

3. 重点SELF分析

把class， method讲明白以后，终于能讲self了。通过上面的例子，我们注意到

outsourcing_paint(colorful_robot,'red')

在function里面，是没有self的。因为我们告诉了外包工厂，给谁上色。所以在定义外包工厂function时，我们有两个input variables：robot 和 color。

colorful_robot.paintarm('red')

然鹅在使用method的时候，我们只告诉了车间，我要红色。那这个车间怎么知道，给哪个机器人上色啊？是给normal robot还是给colorful robot？因为我们在call这个method的时候，使用了colorful_robot.paintarm()这个格式，于是paintarm这个method就知道，哦，我要给这个colorful_robot上色。
在python里，要想使instance.method()这个格式可以正常工作，在class里面编写method的时候，就必须把变量的第一个位子留出来，用来指代未来call这个method的instance。就相当于我们在搭建给胳膊上色的这个车间的时候，就必须预留一个入口来放入已经生产出来的机器人。
留出来的这个位子，可以叫任何名字。只不过为了代码的优美，大部分人选择使用self，来指代使用这个method的instance他自己。

总结

self是在为class编写instance method的时候，放在变量名第一个位子的占位词。
在具体编写instance method里，可以不使用self这个变量。
如果在method里面要改变instance的属性，可以用self.xxxx来指代这个属性进行修改。

所以self，就是指由这个class造出来的instance嘛。

以上就是pyhton学习与数据挖掘self原理及应用分析的详细内容，更多关于pyhton数据挖掘self分析的资料请关注我们其它相关文章！

pyCaret效率倍增开源低代码的python机器学习工具

目录 PyCaret 时间序列模块加载数据初始化设置统计测试探索性数据分析模型训练和选择保存模型 PyCaret 是一个开源.低代码的 Python 机器学习库,可自动执行机器学习工作流.它是一种端到端的机器学习和模型管理工具,可以以指数方式加快实验周期并提高您的工作效率.欢迎收藏学习,喜欢点赞支持,文末提供技术交流群. 与其他开源机器学习库相比,PyCaret 是一个替代的低代码库,可用于仅用几行代码替换数百行代码. 这使得实验速度和效率呈指数级增长. PyCaret 本质上是围绕
python算法深入理解风控中的KS原理

目录一.业务背景二.直观理解区分度的概念三.KS统计量的定义四.KS计算过程及业务分析 KS常用的计算方法: 上标指标计算逻辑: 五.风控中选择KS的原因例1:模糊性例2:连续性一.业务背景在金融风控领域,常常使用KS指标来衡量评估模型的区分度(discrimination),这也是风控模型最为追求的指标之一.下面将从区分度概念.KS计算方法.业务指导意义.几何解析.数学思想等角度,对KS进行深入剖析. 二.直观理解区分度的概念在数据探索中,若想大致判断自变量x对因变量y有没有
Facebook开源一站式服务python时序利器Kats详解

目录什么是 Kats? 安装 Kats 将数据转换为时间序列预测从使用 Prophet 进行预测开始: 可视化 Holt-Winters 检测变化点机器学习深度学习孤立点检测时间序列特征小结转自微信公众号:机器学习社区,经作者授权转载时间序列分析是数据科学中一个非常重要的领域,它主要包含统计分析.检测变化点.异常检测和预测未来趋势.然而,这些时间序列技术通常由不同的库实现.有没有一种方法可以让你在一个库中获得所有这些技术? 答案是肯定的,本文中我将分享一个非常棒的工具包 Ka
python数据挖掘使用Evidently创建机器学习模型仪表板

目录 1.安装包 2.导入所需的库 3.加载数据集 4.创建模型 5.创建仪表板 6.可用报告类型 1)数据漂移 2)数值目标漂移 3)分类目标漂移 4)回归模型性能 5)分类模型性能 6)概率分类模型性能解释机器学习模型是一个困难的过程,因为通常大多数模型都是一个黑匣子,我们不知道模型内部发生了什么.创建不同类型的可视化有助于理解模型是如何执行的,但是很少有库可以用来解释模型是如何工作的. Evidently 是一个开源 Python 库,用于创建交互式可视化报告.仪表板和 JSON 配置文
提高python代码可读性利器pycodestyle使用详解

目录关于PEP-8 目的安装基本用法高级用法结论编程是数据科学中不可或缺的技能,虽然创建脚本来执行基本功能很容易,但编写大规模可读性良好的代码需要更多的思考. 关于PEP-8 pycodestyle 检查器提供基于 PEP-8 样式约定的代码建议.那么 PEP-8 到底是什么呢? PEP 代表 Python 增强建议,PEP-8 是一个概述编写 Python 代码最佳实践的指南.它的主要目标是通过标准化代码样式来提高代码的整体一致性和可读性. 目的快速浏览一下PEP-8文档,就会发
python机器学习使数据更鲜活的可视化工具Pandas_Alive

目录安装方法使用说明支持示例展示水平条形图垂直条形图比赛条形图饼图多边形地理空间图多个图表总结数据动画可视化制作在日常工作中是非常实用的一项技能.目前支持动画可视化的库主要以Matplotlib-Animation为主,其特点为:配置复杂,保存动图容易报错. 安装方法 pip install pandas_alive # 或者 conda install pandas_alive -c conda-forge 使用说明 pandas_alive 的设计灵感来自 bar_ch
pyhton学习与数据挖掘self原理及应用分析

目录 1. 什么是class,什么是instance,什么是object? 2. 什么是method,什么是function? 3. 重点SELF分析总结对,你没看错,这是我初学 python 时的灵魂发问. 我们总会在class里面看见self,但是感觉他好像也没什么用处,就是放在那里占个位子. 如果你也有同样的疑问,那么恭喜你,你的class没学明白. 所以,在解释self是谁之前,我们先明确几个问题: 什么是class,什么是instance? 什么是object? 什么是method
浅谈pyhton学习中出现的各种问题(新手必看)

目前比较杂乱无章,后续还会有一些添加补充 1.标识符 (1)标识符是区分大小写的. (2)标示符以字母或下划线开头,可包括字母,下划线和数字. (3)以下划线开头的标识符是有特殊意义的. 2.参数前加星号(*)的意义面对实际情况时无法提前得知要传入的参数的个数,因此在参数前加星号从而允许函数接受任意多的参数,情况如下: (1)参数前加一个星号(*),传入的参数存储为元组的形式: (2)参数前加两个星号(*),传入的参数存储为字典的形式,并且调用时采用例如'a=1,b=2,c=3'的形式. 3.
Java基础学习之集合底层原理

一.Collection集合 Collection接口是单列集合类的父接口,这种集合可以将数据一个一个的存放到集合中.它有两个重要的子接口,分别是 java.util.List 和 java.util.Set 二.List接口 1.特点 List是一种有序的集合 List是一种带索引的集合 List是一种可以存放重复数据的集合 2.List接口三个主要实现类 3.[面试题]ArrayList.LinkedList.Vector的区别 ①ArrayList:线程不安全,查询效率高,插入.删除效率低
python学习与数据挖掘应知应会的十大终端命令

目录 1.wget 2.head 3.tail 4.wc 5.grep 6.cat 7.find 8.sort 9.nano 10.Variables IT界的每个人都应该知道终端(Terminal)的基本知识,数据科学家也不例外.有时,终端是你的全部,尤其是在将模型和数据管道部署到远程机器时. 让我们开始吧! 1.wget wget实用程序用于从远程服务器下载文件.你可以用它来下载数据集,只要你知道网址,可以使用wget命令下载它,我以如下url为例: https://raw.githubus
深入学习Android ANR 的原理分析及解决办法

目录一.ANR说明和原因 1.1 简介 1.2 原因 1.3 避免二.ANR分析办法 2.1 ANR重现 2.2 ANR分析办法一:Log 2.3 ANR分析办法二:traces.txt 2.4 ANR分析办法三:Java线程调用分析 2.5 ANR分析办法四:DDMS分析ANR问题三.造成ANR的原因及解决办法四.ANR源码分析 4.1 Service造成的Service Timeout 4.2 BroadcastReceiver造成的BroadcastQueue Timeout 4.
Python深度强化学习之DQN算法原理详解

目录 1 DQN算法简介 2 DQN算法原理 2.1 经验回放 2.2 目标网络 3 DQN算法伪代码 DQN算法是DeepMind团队提出的一种深度强化学习算法,在许多电动游戏中达到人类玩家甚至超越人类玩家的水准,本文就带领大家了解一下这个算法,论文的链接见下方. 论文:Human-level control through deep reinforcement learning | Nature 代码:后续会将代码上传到Github上... 1 DQN算法简介 Q-learning算法采用一
Python学习之直方图均衡化原理详解

目录 1.点算子 2.线性灰度变换 3.直方图均衡化 4.代码实战 1.点算子点算子是两个像素灰度值间的映射关系,属于像素的逐点运算,相邻像素不参与运算.点算子是最简单的图像处理手段,如:亮度调整.对比度调整.颜色变换.直方图均衡化等等. 2.线性灰度变换线性灰度变换表达为: 其中rk.sk分别为输入.输出点像素灰度值. ▲图2.1 线性灰度变换当a>1时,输出图像像素灰度范围扩大,图像对比度增强,当a<1时反之.这是因为人眼不易区分相近的灰度值,因此若图像灰度值范围较小,观感上细节不够
PHP设计模式之适配器模式原理与用法分析

本文实例讲述了PHP设计模式之适配器模式原理与用法.分享给大家供大家参考,具体如下: 一.什么是适配器模式适配器模式有两种:类适配器模式和对象适配器模式.其中类适配器模式使用继承方式,而对象适配器模式使用组合方式.由于类适配器模式包含双重继承,而PHP并不支持双重继承,所以一般都采取结合继承和实现的方式来模拟双重继承,即继承一个类,同时实现一个接口.类适配器模式很简单,但是与对象适配器模式相比,类适配器模式的灵活性稍弱.采用类适配器模式时,适配器继承被适配者并实现一个接口:采用对象适配器模式时
PHP设计模式之原型设计模式原理与用法分析

本文实例讲述了PHP设计模式之原型设计模式原理与用法.分享给大家供大家参考,具体如下: 一.什么是原型设计模式原型设计模式使用一种克隆技术来复制实例化的对象,新对象是通过复制原型实例创建的.原型设计模式的目的是通过使用克隆以减少实例化对象的开销. 在原型设计模式中,Client类是不可缺少的一部分. PHP有一个内置的克隆方法__clone()可以在设计模式中使用,但是不能直接访问,使用clone关键字即可.克隆不会启动构造函数. 二.什么时候使用原型设计模式如果一个项目要求你创建某个原型
python数据挖掘Apriori算法实现关联分析

目录摘要: 关联分析 Apriori原理算法实现挖掘关联规则利用Apriori算法解决实际问题发现毒蘑菇的相似特征总结: 摘要: 主要是讲解一些数据挖掘中频繁模式挖掘的Apriori算法原理应用实践当我们买东西的时候,我们会发现物品展示方式是不同,购物以后优惠券以及用户忠诚度也是不同的,但是这些来源都是大量数据的分析,为了从顾客身上获得尽可能多的利润,所以需要用各种技术来达到目的. 通过查看哪些商品一起购物可以帮助商店了解客户的购买行为.这种从大规模数据集中寻找物品间的隐含关系被称