Python 马氏距离求取函数详解

2025-02-22 07:02:33

马氏距离区别于欧式距离，如百度知道中所言：

马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的，表示点与一个分布之间的距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是，它考虑到各种特性之间的联系（例如：一条关于身高的信息会带来一条关于体重的信息，因为两者是有关联的），并且是尺度无关的(scale-invariant)，即独立于测量尺度。对于一个均值为μ，协方差矩阵为Σ的多变量向量，其马氏距离为sqrt( (x-μ)'Σ^(-1)(x-μ) )。

因此，对于马氏距离最终的定义式为：

上代码，将马氏距离求取式，封装为Python函数，拷贝即可使用：

from numpy import *
import numpy
def get_mahalanobis(x, i, j):
    xT = x.T  # 求转置
    D = numpy.cov(xT)  # 求协方差矩阵
    invD = numpy.linalg.inv(D)  # 协方差逆矩阵
    assert 0 <= i < x.shape[0], "点 1 索引超出样本范围。"
    assert -1 <= j < x.shape[0], "点 2 索引超出样本范围。"
    x_A = x[i]
    x_B = x.mean(axis=0) if j == -1 else x[j]
    tp = x_A - x_B
    return numpy.sqrt(dot(dot(tp, invD), tp.T))

使用方式如下：

if __name__ == '__main__':
    # 初始化数据点集，或者从其它地方加载
    x = numpy.array([[3, 4], [5, 6], [2, 2], [8, 4]])
    # 求第0个点到均值之间的马氏距离（j为-1时代表均值）
    print(get_mahalanobis(x, 0, -1))
    # 求第0个点到第1个点之间的马氏距离
    print(get_mahalanobis(x, 0, 1))
    # 求第2个点到第3个点之间的马氏距离（索引从0开始算起）
    print(get_mahalanobis(x, 2, 3))

运行结果贴图

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注我们的更多内容!

python数据处理67个pandas函数总结看完就用

目录导⼊数据导出数据查看数据数据选取数据处理数据分组.排序.透视数据合并不管是业务数据分析 ,还是数据建模.数据处理都是及其重要的一个步骤,它对于最终的结果来说,至关重要. 今天,就为大家总结一下 "Pandas数据处理" 几个方面重要的知识,拿来即用,随查随查. 导⼊数据导出数据查看数据数据选取数据处理数据分组和排序数据合并 # 在使用之前,需要导入pandas库 import pandas as pd 导⼊数据这里我为大家总结7个常见用法. pd.Da
python的函数和方法(上)

目录函数什么是函数/方法 2.为什么需要函数 1.载体 2.组织 3.复用 4.封装 5.清晰 6.按需 3.如何声明/调用一个函数 4.函数/方法的参数 1.形式参数参数的名字(类似变量名)- parameter 2.实际参数该参数的具体值(变量的那个值)- argument 3.位置参数按照参数位置取值 - positional 4.关键字参数就是一个标准的变量赋值的过程 5.默认参数为函数预设的参数值 6.参数组可变参数和可变关键字 - 传入结构化数据类型(列表.元组.字典
Python实现的计算马氏距离算法示例

本文实例讲述了Python实现的计算马氏距离算法.分享给大家供大家参考,具体如下: 我给写成函数调用了 python实现马氏距离源代码: # encoding: utf-8 from __future__ import division import sys reload(sys) sys.setdefaultencoding('utf-8') import numpy as np def mashi_distance(x,y): print x print y #马氏距离要求样本数要大于维数,
python的函数和方法(中)

目录匿名函数 1.什么是匿名函数 2.如何声明/调用一个匿名函数(lambda) 3.匿名函数的几种使用方式 4.匿名函数的组合使用总结匿名函数 1.什么是匿名函数 lambda是个匿名函数,也是一个表达式,是函数的最小作战单元匿名函数顾名思义,就是"无名"函数匿名函数适用于简单的业务逻辑一行一个函数通俗的说逻辑不复杂,不需要大规模批量调用的功能可使用匿名函数构建,匿名函数的书写特性决定其简易性 #lambda简约而不简单注意lambda是 python的一个关键字,用
Python 函数那不为人知的一面

通常我们定义一个函数,然后调用该函数时,函数相关的代码才开始执行.可是很多人并不知道,当我们定义函数时,一些代码就开始执行了.今天就来说说函数这个不为人知的一面. 通常我们定义一个函数,然后调用该函数时,函数相关的代码才开始执行.可是很多人并不知道,当我们定义函数时,一些代码就开始执行了.今天就来说说函数这个不为人知的一面. 先看一段代码: def do_something(opt: print('参数 opt'), arg=print('参数 arg')) -> print('函数的返回值')
Python 马氏距离求取函数详解

马氏距离区别于欧式距离,如百度知道中所言: 马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示点与一个分布之间的距离.它是一种有效的计算两个未知样本集的相似度的方法.与欧氏距离不同的是,它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度.对于一个均值为μ, 协方差矩阵为Σ的多变量向量,其马氏距离为s
Python实现屏幕截图的代码及函数详解

废话不多说,先给大家看下python实现屏幕截图的代码,具体代码如下所述: from selenium import webdriver import time def capture(url, save_fn="capture.png"): browser = webdriver.Firefox() # Get local session of firefox browser.set_window_size(1200, 900) browser.get(url) # Load pag
关于Python OS模块常用文件/目录函数详解

模块:包含定义函数和变量的python文件,可以被别的程序引入. os模块是操作系统接口模块,提供了一些方便使用操作系统相关功能函数,这里介绍下os模块中对于文件/目录常用函数和使用方法. 1. 返回当前文件目录:getcwd() 2.改变工作目录:chdir(path) 将当前工作目录更改为path的目录 3. 更改当前进程根目录:chroot(path) 4.列举出目录中的文件名:listdir(path) 返回列表,包含了path所有文件和目录名称,排序无顺序 5.创建目录:mkdir(p
浅谈Python中的zip()与*zip()函数详解

前言 1.实验环境: Python 3.6: 2.示例代码地址:下载示例: 3.本文中元素是指列表.元组.字典等集合类数据类型中的下一级项目(可能是单个元素或嵌套列表). zip(*iterables)函数详解 zip()函数的定义从参数中的多个迭代器取元素组合成一个新的迭代器: 返回: 返回一个zip对象,其内部元素为元组:可以转化为列表或元组: 传入参数:元组.列表.字典等迭代器. zip()函数的用法当zip()函数中只有一个参数时 zip(iterable)从iterable中依次取
Python pandas之多级索引取值详解

目录数据需求需求拆解需求处理方法一方法二总结最近发现周围的很多小伙伴们都不太乐意使用pandas,转而投向其他的数据操作库,身为一个数据工作者,基本上是张口pandas,闭口pandas了,故而写下此系列以让更多的小伙伴们爱上pandas. 平台: windows 10 python 3.8 pandas 1.2.4 数据需求给定一份多级索引数据,查找指定值. 需求拆解数据提取在pandas中,或者说在python中就是索引式提取,在单层索引中采用.loc或.iloc方法已经非
Python pandas常用函数详解

本文研究的主要是pandas常用函数,具体介绍如下. 1 import语句 import pandas as pd import numpy as np import matplotlib.pyplot as plt import datetime import re 2 文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3... names=['A', 'B', 'C'...] 自定义列名 index_col='
Python爬虫包 BeautifulSoup 递归抓取实例详解

Python爬虫包 BeautifulSoup 递归抓取实例详解概要: 爬虫的主要目的就是为了沿着网络抓取需要的内容.它们的本质是一种递归的过程.它们首先需要获得网页的内容,然后分析页面内容并找到另一个URL,然后获得这个URL的页面内容,不断重复这一个过程. 让我们以维基百科为一个例子. 我们想要将维基百科中凯文·贝肯词条里所有指向别的词条的链接提取出来. # -*- coding: utf-8 -*- # @Author: HaonanWu # @Date: 2016-12-25 10:
基于python log取对数详解

log()方法返回x的自然对数,对于x>0. 语法以下是log()方法的语法: import math math.log( x ) 注意:此函数是无法直接访问的,所以我们需要导入math模块,然后需要用math的静态对象来调用这个函数. 参数 x – 这是一个数值表达式. 返回值此方法返回x的自然对数,对于x>0. 另外,可以通过log(x[, base])来设置底数,如 log(x, 10) 表示以10为底的对数. 以上这篇基于python log取对数详解就是小编分享给大家的全部内容了
对python中的高效迭代器函数详解

python中内置的库中有个itertools,可以满足我们在编程中绝大多数需要迭代的场合,当然也可以自己造轮子,但是有现成的好用的轮子不妨也学习一下,看哪个用的顺手~ 首先还是要先import一下: #import itertools from itertools import * #最好使用时用上面那个,不过下面的是为了演示比较常用的,所以就直接全部导入了一.无限迭代器: 由于这些都是无限迭代器,因此使用的时候都要设置终止条件,不然会一直运行下去,也就不是我们想要的结果了. 1.coun

Python 马氏距离求取函数详解

总结

相关推荐

随机推荐