python中similarity函数实例用法

1、similarity函数接收两个列表,并返回由两个列表中相同元素组成的列表。

2、函数使用列表推导,遍历所有a列表中的元素,并使用in关键词来判断这些元素是否存在于b列表中。

实例

def similarity(a, b):
  return [item for item in a if item in b]

# EXAMPLES
similarity([1, 2, 3], [1, 2, 4]) # [1, 2]

知识点扩充:

python 语义similarity_Python:string的语义相似度得分

Python:string的语义相似度得分

有没有用于计算一对句子的语义相似度分数的库?

我知道WordNet的语义数据库,以及如何为2个单词生成分数,但是我正在寻找能够在整个句子和输出中执行所有预处理任务(如端口词干,停用词删除等)的库两个句子如何相关的分数。

我发现了一个使用.NET框架编写的工作 ,它使用一系列预处理步骤来计算分数。 有没有任何项目,在Python中做到这一点?

我不是在寻找能够帮助我find分数的操作顺序(就像这里要求的那样)

我喜欢自己实现每个阶段,或者从不同的库中粘贴函数,以便它可以用于句对,但是我主要需要这个工具来testing数据的推论。

编辑:我正在考虑使用NLTK和计算每两个单词对这两个句子迭代的得分,然后从结果的标准偏差中得出推论,但我不知道这是否是一个合理的相似性估计。 另外,这将花费很长的时间。

再次,我正在寻找已经实现这个智能的项目/库。 东西,让我这样做:

import amazing_semsim_package str1='Birthday party ruined as cake explodes' str2='Grandma mistakenly bakes cake using gunpowder' >>similarity(str1,str2) >>0.889

我见过的最好的包装是在Gensim主页find的Gensim 。 我已经使用过很多次了,总体而言非常满意,它的易用性, 它是用Python编写的,并且有一个简单的跟随教程来开始,它比较了9个string。 它可以通过点安装,所以你不会有很多麻烦得到它安装,我希望。

你使用哪种评分algorithm在很大程度上取决于你的问题的背景,但是如果你想要一些基本的东西的话,我build议开始使用LSI的function。 (这是教程引导你通过。)

如果您阅读gensim教程,它将引导您通过比较两个string,使用Similaritiesfunction。 这样可以让你看到你的叮咬是如何根据它们所包含的文字相互比较的,或者是一些其他的刺痛。

到此这篇关于python中similarity函数实例用法的文章就介绍到这了,更多相关python中similarity函数的使用内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python中similarity函数实例用法

    1.similarity函数接收两个列表,并返回由两个列表中相同元素组成的列表. 2.函数使用列表推导,遍历所有a列表中的元素,并使用in关键词来判断这些元素是否存在于b列表中. 实例 def similarity(a, b): return [item for item in a if item in b] # EXAMPLES similarity([1, 2, 3], [1, 2, 4]) # [1, 2] 知识点扩充: python 语义similarity_Python:string的

  • python copy模块中的函数实例用法

    1.copy.copy()函数可用于复制列表或字典等可变值,复制后的列表和原列表是两个独立的列表. import copy origin = [1,2,3] new = copy.copy(origin) new[0] = 0 print("origin = ",origin) print("new = ",new) 2.如果要复制的列表中有列表,则使用deepcopy()函数完全复制. import copy origin =[[1,2,3],['a','b','

  • 基于python中__add__函数的用法

    运算符重载 _add ##定义:让自定义的类生成的对象(实例)能够使用运算符进行操作 class Vector01: '''定义一个一维向量''' def init(self,x): self.x = x def str(self): '''定义新生成的返回值是什么,如果没有这个之间返回的是类的特点''' return ('一维向量的分量是:%d' % (self.x)) def add(self, other): #表示print内的+ # print('参数是:',other) return

  • python中count函数简单用法

    python中count函数的用法 Python count()方法 描述 Python count() 方法用于统计字符串里某个字符出现的次数.可选参数为在字符串搜索的开始与结束位置. count()方法语法: str.count(sub, start= 0,end=len(string)) 参数 sub -- 搜索的子字符串 start -- 字符串开始搜索的位置.默认为第一个字符,第一个字符索引值为0. end -- 字符串中结束搜索的位置.字符中第一个字符的索引为 0.默认为字符串的最后

  • python中reload重载实例用法

    当我们想对python中原有的模块进行覆盖,又不希望退出当前的程序,就需要用到重载的概念.这样既能使模块得到更新,又不影响解释器的使用.在导入的模块上,也是对之前原有模块的一次覆盖,包括最初导入时所加载的各种过程.下面我们学习reload的一些基础内容,在实例中体会加载功能. 1.装载MyModule语法演示: from imp import reload reload(MyModule) 2.参数 module -- 模块对象. 3.返回值 返回模块对象. 4.实例 当前目录下有一个test.

  • python中Mako库实例用法

    Mako是一个模板库.一种嵌入式的语言,能够实现简化组件布局以及继承,主要的用途也是和作用域有关,但是效果是最直接切灵活的,这些都是mako的基本功能,掌握了基础内容,接下来就是详细的了解讲述,从几个方面为大家详细讲述,首先在众多模板库中的优点,以及实例应用等等,一起来了解学习下吧. Mako的优点: 学习成本低,能够在结构上进行转义. 应用方向: 文本文件生成. 模块引用: from mako.template import Template 基本用法: from mako.template

  • python中pdb模块实例用法

    大家可能都不大熟悉关于pdb这个模块,实际上就是python中的内置模块,主要作用于命令行调试代码,下面我们将通过是哪个小结给大家详细介绍下使用该内容的方式,首先是简单介绍,然后为大家呈现实例,最后就是总结啦,小伙伴是不是相当期待呢,那就板正做好,一起来详细了解下吧~ 简单介绍: 添加断点-代码后添加一行 pdb.set_trace() 命令行添加断点 b line_number 常见命令: 进入命令行Debug模式,python -m pdb xxx.py h:(help)帮助 w:(wher

  • python中time.ctime()实例用法

    在对于时间准确度的把握上,为了使操作的更加细化,很多人习惯把时间精确到秒.但在实际程序操作中,虽然秒数方便我们的查阅,但是计算机并不能直接的识别,所以还需要借助time.ctime()函数转换成字符串的形式.下面我们就time.ctime()的说明.语法.参数.返回值分别介绍,最后分享代码实例. 1.说明 该函数把时间秒数转为字符串. 2.语法 time.ctime([ sec ]) 3.参数 sec -- 要转换为字符串时间的秒数. 4.返回值 该函数没有任何返回值. 5.实例 //连续每隔1

  • python中namedtuple函数的用法解析

    源码解释: def namedtuple(typename, field_names, *, rename=False, defaults=None, module=None): """Returns a new subclass of tuple with named fields. >>> Point = namedtuple('Point', ['x', 'y']) >>> Point.__doc__ # docstring for

  • Python中int()函数的用法浅析

    int()是Python的一个内部函数 Python系统帮助里面是这么说的 >>> help(int) Help on class int in module __builtin__: class int(object) | int(x[, base]) -> integer | | Convert a string or number to an integer, if possible. A floating point | argument will be truncated

随机推荐