搜索历史基本原理实现即时自动补全联想搜索技巧

目录
  • 实现搜索历史-[即时自动补全&联想搜索]
  • 如何实现基于个人搜索历史的联想推荐
    • 架构图
    • 词汇表实现
  • 实现原理
    • 新增关键字操作
    • 删除关键字操作
    • 查询推荐列表操作

实现搜索历史-[即时自动补全&联想搜索]

无论是新闻、内容、还是电商平台,联想输入已经成为搜索功能的标配,早已不是什么新鲜事物。我们随便打开一个搜索引擎或者是电商平台,当我们在输入框输入拼音或者文字时就会看到输入框下方弹出有意义的搜索建议,提示我们是不是想要输入“以下”内容,帮助我们补齐输入或是修正错误的输入,优化我们的搜索体验。

在上图示例中,我们可以看到,输入关键字 联想搜索,Google 搜索会联想到联想搜索elasticsearch联想搜索,好处就是,我们无须输入完整的关键字即可轻松完成针对这些 topics 的搜索。

今天我们实现的功能和联想搜索有一点差别,我们是根据用户隔离,基于个人搜索历史的联想搜索

如何实现基于个人搜索历史的联想推荐

一个好的自动补全器必须是快速的,并且在用户键入下一个字符后立即更新联想词列表。自动补全器的核心是一个函数,它接受输入的前缀,并搜索以给定前缀开头的词汇或语句列表。通常来说,只需要返回少量的数目即可。

架构图

词汇表实现

实现方式有很多种,例如前缀树实现,有限状态自动机(DFA)实现等等。

这里采用Redis ZSET数据结构快速实现。

  • Redis 有序集合和集合一样也是 string 类型元素的集合,且不允许重复的成员
  • 不同的是每个元素都会关联一个 double 类型的分数。redis 正是通过分数来为集合中的成员进行从小到大的排序。
type zset
key search-history-common
key search-history-user:1
key search-history-user:2
key search-history-user:3

备注:

  • 常用搜索词库数据统计规则:定时取出所有人词库中排名靠前n位的搜索项并放入常用搜索库中
  • 分数值 = 原有分数值*1.01+1.01 (为什么用一元函数,因为可以让常用词和不常用词更快的区分开)
  • 分数值初始值为 1

实现原理

新增关键字操作

  • 直接添加 默认score = 1
  • 添加失败查询score
  • 设置新score = score*1.1+1.1 (注意zset不能重新设置score
  • 缓存完成

# 计算新score
# 新score应该 = score*1.1+1.1 但是 需要用ZADD,所以需要换算,(score*1.1+1.1)-score = a
ZADD key a member
# 化简得到
ZADD key score*0.1+1.1 member
# 添加 member = 1 返回 score
# 如果存在则添加失败 返回 0
ZADD key 1 member
# 获取分,不存在返回 null
ZSCORE key member
# 对某个键加上增量
ZADD key 1 member

删除关键字操作

  • 直接删除
# 删除成功返回 1,如果一个zset下没有item, zset也会被自动删除
ZREM key member

查询推荐列表操作

  • 全量查询当前用户词汇表
  • 使用String.contains 或者其他框架过滤出推荐词
  • 返回推荐列表到前端

# 全量查询 zset key(从小到大)
ZRANGE key 0 -1
member2
member
# 全量查询 zset key(从大到小)
ZRANGE key 0 -1 WITHSCORES
member2
2
member
6

以上就是搜索历史基本原理实现即时自动补全联想搜索技巧的详细内容,更多关于搜索历史自动补全联想搜索的资料请关注我们其它相关文章!

(0)

相关推荐

  • react+antd select下拉框实现模糊搜索匹配的示例代码

    我们在开发过程中,经常会出现下拉框数据很多得情况,这个时候客户一个个得找就很浪费时间,那该怎么办呢? 我们可以实现一边输入一遍模糊匹配. 实现后的效果是 具体代码实现请看下面: 我们可以在Select.Option 里面返回我们想要搜索得字段,然后通过filterOption这个属性去获取和操作. 到此这篇关于react+antd select下拉框实现模糊搜索匹配的示例代码的文章就介绍到这了,更多相关react antd select模糊搜索内容请搜索我们以前的文章或继续浏览下面的相关文章希望

  • Sklearn调优之网格搜索与随机搜索原理详细分析

    目录 前言 网格搜索(Grid Search) 随机搜索(Randomized Search) 前言 超参调优是“模型调优”(Model Tuning)阶段最主要的工作,是直接影响模型最终效果的关键步骤,然而,超参调优本身却是一项非常低级且枯燥的工作,因为它的策略就是:不断变换参数值,一轮一轮地去“试”,直到找出结果最好的一组参数.显然,这个过程是可以通过编程封装成自动化的工作,而不是靠蛮力手动去一遍一遍的测试.为此,Sklearn提供了多种(自动化)超参调优方法(官方文档),其中网格搜索(Gr

  • 详解elasticsearch实现基于拼音搜索

    目录 1.背景 2.安装拼音分词器 3.拼音分词器提供的功能 4.简单测试一下拼音分词器 4.1 dsl 4.2 运行结果 5.es中分词器的组成 6.自定义一个分词器实现拼音和中文的搜索 1.创建mapping 2.插入数据 3.搜索数据 1.背景 一般情况下,有些搜索需求是需要根据拼音和中文来搜索的,那么在elasticsearch中是如何来实现基于拼音来搜索的呢?可以通过elasticsearch-analysis-pinyin分析器来实现. 2.安装拼音分词器 # 进入 es 的插件目录

  • 搜索历史基本原理实现即时自动补全联想搜索技巧

    目录 实现搜索历史-[即时自动补全&联想搜索] 如何实现基于个人搜索历史的联想推荐 架构图 词汇表实现 实现原理 新增关键字操作 删除关键字操作 查询推荐列表操作 实现搜索历史-[即时自动补全&联想搜索] 无论是新闻.内容.还是电商平台,联想输入已经成为搜索功能的标配,早已不是什么新鲜事物.我们随便打开一个搜索引擎或者是电商平台,当我们在输入框输入拼音或者文字时就会看到输入框下方弹出有意义的搜索建议,提示我们是不是想要输入“以下”内容,帮助我们补齐输入或是修正错误的输入,优化我们的搜索体验

  • 使用Bootstrap typeahead插件实现搜索框自动补全的方法

    这就是贴代码的坏处之一:搜索框快被网友玩儿坏了!!!有故意输入空格的,有输入or 1=1的,有alert的,有html乱入的.......而且好像还在玩儿,随他们去吧,只要开心就好. 在项目中,经常会用到输入框的自动补全功能,就像百度.淘宝等搜索框一样:当用户输入首字母.关键词时,后台会迅速将与此相关的条目返回并显示到前台,以便用户选择,提升用户体验.当然本项目的补全功能和这些大厂的技术是没有可比性的,但用于站内搜索也是绰绰有余了. 接触到的自动补全插件主要有两个:autocomplete和ty

  • Python实现Tab自动补全和历史命令管理的方法

    本文实例讲述了Python实现Tab自动补全和历史命令管理的方法.分享给大家供大家参考.具体分析如下: Python的startup文件,即环境变量 PYTHONSTARTUP 对应的文件 1. 为readline添加tab键自动补全的功能 2. 像Shell一样管理历史命令 代码如下: 复制代码 代码如下: import rlcompleter import readline import atexit import os # http://stackoverflow.com/question

  • JQuery搜索框自动补全(模糊匹配)功能实现示例

    本地实现了一个搜索框自动补全的小功能,在JQuery UI的autocomplete插件的基础上,加入了自己的业务代码,贴出来回顾一下,同时可以给大家一个参考 首先贴出的是JQuery Ui 的自动补全插件部分的代码,后面的功能都是在其基础上追加的,直接拷贝到你的本地就可以直观的看到运行效果,也可以到官网上面体验和查看,为了方便,我这里是直接引入的JS链接点击下载JQuery UI的源码 <!doctype html> <html lang="en"> <

  • C++实现LeetCode(642.设计搜索自动补全系统)

    [LeetCode] 642. Design Search Autocomplete System 设计搜索自动补全系统 Design a search autocomplete system for a search engine. Users may input a sentence (at least one word and end with a special character '#'). For each character they type except '#', you ne

  • 给Python IDLE加上自动补全和历史功能

    许多时候,我们使用Python,并不用写一个程序,一些不复杂的任务,我更喜欢在 IDLE(也就是交互式提示模式)下输入几行代码完成.然而,在这个模式下编辑代码,也有不够便利的地方,最主要的就是,不能用Tab自动补全,不能记忆 上一次输入的命令(没办法,谁让我们在Shell下习惯了呢). 这时候,我们可以直接使用Python启动脚本,解决这个问题. 启动脚本的程序非常简单,这里不多说明,只给出代码: import readline import rlcompleter import atexit

  • PHP自动补全表单的两种方法

    效果图: 第一种:从数据库中检索之后补全 第二种:邮箱等纯前端的补全 先说第二种,使用开源的插件,所以相对简单. github上面的项目 completer. https://github.com/fengyuanchen/completer 做法特别容易,github上面有详细的文档. 一开始尝试用这个来配上自己的后台代码,做成第一种的自动补全,搞了半天失败了.可能本人js太差,改动太多的话,代码很复杂,除非认真研究上面这个开源项目. 主要失败在我在后台数据库找出来的完整的模糊查询得到的数据,

  • JSP + ajax实现输入框自动补全功能 实例代码

    下面是我用ajax实现的输入框自动补全功能,数据库数据很少,大体模仿出了百度首页的提示功能,当然,人家百度的东西不只是这么简单的!先看运行效果: index.jsp(包含主要的js代码) 复制代码 代码如下: <%@ page language="java" import="java.util.*" pageEncoding="utf-8"%> <% String path = request.getContextPath();

  • 基于jquery实现的自动补全功能

    本文实例讲述了基于jquery实现的自动补全功能的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: $(function() {     // 自动补全     var maxcount = 0;// 表示他最大的值     var thisCount =0;// 初始化他框的位置     $("body").prepend("<div style='width:120px; display:none; background:#FFFFFF; pos

  • 详解jQuery UI库中文本输入自动补全功能的用法

    自动补全(autocomplete),是一个可以减少用户输入完整信息的UI 工具.一般在 输入邮箱.搜索关键字等,然后提取出相应完整字符串供用户选择. 一.调用autocomplete()方法 $('#email').autocomplete({ source : ['aaa@163.com', 'bbb@163.com', 'ccc@163.com'], }); 二.修改autocomplete()样式    由于autocomplete()方法是弹窗,然后鼠标悬停的样式.通过Firebug

随机推荐