pandas factorize实现将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

都是字符串特征,无法用于训练,当然可以单独建立map硬编码处理,但是pandas已经封装好了相应的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上这篇pandas factorize实现将字符串特征转化为数字特征就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • 从pandas一个单元格的字符串中提取字符串方式

    以titanic数据集为例. 其中name列是字符串,现在想从其中提取title作为新的一列. 例如: # create new Title column df['Title'] = df['Name'].str.extract('([A-Za-z]+)\.', expand=True) 提取其中的title作为新的一列. 以上就是对从pandas的单元格中提取字符串的认识. 这篇从pandas一个单元格的字符串中提取字符串方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多

  • pandas factorize实现将字符串特征转化为数字特征

    将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法. 原始数据的job特征值如下 都是字符串特征,无法用于训练,当然可以单独建立map硬编码处理,但是pandas已经封装好了相应的方法. data = pd.read_csv("data/test_set.csv") data["job"] = pd.factorize(data["job"])[0].astype(np.uint16) 以上这篇p

  • python中数字列表转化为数字字符串的实例代码

    目录 1. python中数字组成的列表转化为字符串或者一串数字 2.python中把数字组成的列表转化为字符串列表 3.Python中把字符组成的列表转化为数字 4.Python中把一串数字字符转化为单个字符列表或者数字列表 5. Python中把字符串列表转化为数字列表 参考文章: 总结 1. python中数字组成的列表转化为字符串或者一串数字 f=[1,2,3,4] num=len(f) m='' #建立空字符串 for i in range(num): x=str(f[i]) m=m+

  • 将CString字符串输入转化成整数的实现方法

    如下所示: BOOL IsHexFormat(LPCTSTR pStr) { if (pStr[0] == L'0' && ((pStr[1] == L'x') || (pStr[1] == L'X'))){ return TRUE; } return FALSE; } BOOL IsInputValid(LPCTSTR pStr) { int i; BOOL res; BOOL IsHex; i = 0; res = TRUE; IsHex = IsHexFormat(pStr); wh

  • PHP实现UTF8二进制及明文字符串的转化功能示例

    本文实例讲述了PHP实现UTF8二进制及明文字符串的转化功能.分享给大家供大家参考,具体如下: <?php /***********本程序由云客编写.有空的时候承接php软件开发 *满足一下新手们的好奇心,看看UTF-8的二进制是什么样子滴 ****************************/ define("b", "<br>"); $a = "FE"; $a1 = "FF"; $s = 16; $e

  • js 字符串转化成数字的代码

    方法主要有三种 转换函数.强制类型转换.利用js变量弱类型转换. 1. 转换函数: js提供了parseInt()和parseFloat()两个转换函数.前者把值转换成整数,后者把值转换成浮点数.只有对String类型调用这些方法,这两个函数才能正确运行:对其他类型返回的都是NaN(Not a Number). 一些示例如下: parseInt("1234blue"); //returns 1234 parseInt("0xA"); //returns 10 par

  • python将字母转化为数字实例方法

    python如何将字母转化为数字? 将英文字母转成数字: 转换 ord('F') 反转 chr(70) python ord() 函数 是 chr() 函数(对于8位的ASCII字符串)或 unichr() 函数(对于Unicode对象)的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的 ASCII 数值,或者 Unicode 数值,如果所给的 Unicode 字符超出了你的 Python 定义范围,则会引发一个 TypeError 的异常. 以下是 ord() 方法的语法: or

  • Linux下科学计数法(e)转化为数字的方法

    科学计数法使用e标识数值,将科学计算学转化为数字的思路:按e右边的数字移动小数点位数.e右边的数字如果是负数,则向左移动小数点.示例如下: 1.2345678e2 = 123.45678 1.2345678e-2 = 0.012345678 1.7615562e+06 = 1761556.2 1.87982e7 = 18798200 1e3 = 1000 那么在shell中,如何转化科学计数法为数字呢,方法如下:这里以"1.7615562e+06" (或者1.7615562e6)为示例

  • python转化excel数字日期为标准日期操作

    伙伴遇到一个关于excel导入数据到python中,日期变成数字而不是日期格式的问题.第一反应这个数字应该是excel里面的时间戳类似的,所以我就实验增加一天是不是对应的数字就加1.最后证明了我的想法,这样就可以倒推excel里面的数字日期是从那一年开始计数的. 我们先看一下excel本身打开数据的样子: 我们再看看python直接导入后日期的样子: 那我们的目标就是将字段列名的日期数据替换成标准的日期格式,具体的思路是: 1.先用excel实验2018-11-02对应的日期时间戳是43406.

  • Python如何判断字符串是否仅包含数字

      在用Python进行数据处理的时候,经常会遇到DataFrame中的某一列本应该是数值类型,但由于数据不规范导致在字段中夹杂了非数值类型.对于这种类型的数据,再进行处理的时候一般都需要先判断该列中的每一个值是否仅包含数字.常用的判断方法如下: str.isdecimal()函数 作用:如果字符串中的所有字符都是十进制字符且该字符串至少有一个字符,则返回 True , 否则返回 False .十进制字符指那些可以用来组成10进制数字的字符,例如 U+0660 ,即阿拉伯字母数字0 . str.

  • Angularjs 双向绑定时字符串的转换成数字类型的问题

    问题: <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <script src="http://cdn.static.runoob.com/libs/angular.js/1.4.6/angular.min.js"></script> </head> <body> <div ng-app="myAp

随机推荐