MySQL连表查询分组去重的实现示例

2025-04-01 20:47:58

业务逻辑

通过多种渠道将小程序的活动页链接发布出去，比如通过多多种短信附带链接( channel 就记为 sms1，sms2，sms3 )，或者海报上面贴微信小程序的二维码( channel 记为 qrcode1，qrcode2，qrcode3 )，线下会员通过扫描二维码也能进入小程序指定的活动页，亦或者是通过其他会员分享的小程序链接也可以进入小程序( channel 记为 share)。这些不同的进入方式在我这篇文章统称为不同的渠道，也就是提到的 channel 字段。从不同的渠道进入活动页就会产生一条页面访问记录。会被计入 page_view 这张表里。

会员进入小程序的指定活动页后，在页面上面触发一系列操作后，会得到相应的反馈，比如获得积分，或者获得优惠券等等。这步操作称为参与活动。这条数据会被记入 activity_record 这张表里。

现在呢，运营小姐姐要求得到一份数据报表。每位参与活动的会员是从什么时间,哪个渠道里面进活动的？

数据表结构

表名	member_id	participate_time
activity_record	会员号	活动参与时间

表名	member_id	channel	view_time
page_view	会员号	渠道	页面访问时间

查询逻辑

因为每位会员只能参加一次活动，也就是活动期间只能获得过一次积分，或者领取过一次优惠券等等这种意思，也就是每位会员最多只会产生一条 activity_record 记录。

可是 page_view 这张表的记录方式就不一样了。会员可能既收到过短信链接，又扫描过活动二维码，又被好友分享过活动链接，这下，对于这位会员来说，就会产生多条页面访问记录，即在 page_view 里产生多条数据。

你想想，会员肯定是先通过某一个渠道进入到活动页面，才能去参加活动。也就是有多条 page_view 的数据，按照 view_time 倒序排列，总有一条的 view_time 是小于且最接近于 activity_record 的 participate_time，下一条 page_view 的 view_time 就会大于 activity_record 的 participate_time。

SQL脚本

select c.member_id,c.view_time,.channel from (
SELECT
 member_id,
 SUBSTRING_INDEX( GROUP_CONCAT( view_time ORDER BY view_time DESC ), ',', 1 ) AS view_time,
 SUBSTRING_INDEX( GROUP_CONCAT( channel ORDER BY channel DESC ), ',', 1 ) AS channel
FROM
 page_view a LEFT JOIN activity_record b
        on a.member_id = b.member_id
        where a.view_time < b.participate_time
GROUP BY
 member_id) c;

脚本说明

GROUP_CONCAT：通过使用distinct可以排除重复值； group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator '分隔符'] )
SUBSTRING_INDEX：字符串截取函数。substring_index(str,delim,count)。str:要处理的字符串；delim:分隔符；count:计数

到此这篇关于MySQL连表查询分组去重的实现示例的文章就介绍到这了,更多相关MySQL连表查询分组去重内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

MySQL 数据查重、去重的实现语句

有一个表user,字段分别有id.nick_name.password.email.phone. 一.单字段(nick_name) 查出所有有重复记录的所有记录 select * from user where nick_name in (select nick_name from user group by nick_name having count(nick_name)>1); 查出有重复记录的各个记录组中id最大的记录 select * from user where id in (se
mysql中各种常见join连表查询实例总结

本文实例讲述了mysql中各种常见join连表查询.分享给大家供大家参考,具体如下: 通常我们需要连接多个表查询数据,以获取想要的结果. 一.连接可以分为三类: (1) 内连接:join,inner join (2) 外连接:left join,left outer join,right join,right outer join,union,union all (3) 交叉连接:cross join 二.准备需要演示的表: CREATE TABLE `a` ( `id` int(11) uns
mysql自联去重的一些笔记记录

我先把功能场景简要阐述下: 数据行字段如下: name started_at type 在这张表里,name有重复值现在需要在type确定的情况下,筛选出一个列表,满足,name不重复,找出的记录为同name下started_at为最小的记录举个例子: 活动1 2019-06-01 type1 活动1 2019-06-02 type1 活动1 2019-06-03 type1 活动2 2019-06-03 type1 活动2 2019-06-05 type1 活动2 2019-06-07 t
MySQL中使用去重distinct方法的示例详解

一 distinct 含义:distinct用来查询不重复记录的条数,即distinct来返回不重复字段的条数(count(distinct id)),其原因是distinct只能返回他的目标字段,而无法返回其他字段用法注意: 1.distinct[查询字段],必须放在要查询字段的开头,即放在第一个参数: 2.只能在SELECT 语句中使用,不能在 INSERT, DELETE, UPDATE 中使用: 3.DISTINCT 表示对后面的所有参数的拼接取不重复的记录,即查出的参数拼接每行记录
Mysql中distinct与group by的去重方面的区别

distinct简单来说就是用来去重的,而group by的设计目的则是用来聚合统计的,两者在能够实现的功能上有些相同之处,但应该仔细区分. 单纯的去重操作使用distinct,速度是快于group by的. distinct支持单列.多列的去重方式. 单列去重的方式简明易懂,即相同值只保留1个. 多列的去重则是根据指定的去重的列信息来进行,即只有所有指定的列信息都相同,才会被认为是重复的信息. group by使用的频率相对较高,但正如其功能一样,它的目的是用来进行聚合统计的,虽然也可能实现去
MySQL数据表合并去重的简单实现方法

场景: 爬取的数据生成数据表,结构与另一个主表相同,需要进行合并+去重解决:(直接举例) 首先创建两个表pep,pep2,其中pep是主表 CREATE TABLE IF NOT EXISTS `pep/pep2`( `id` INT UNSIGNED AUTO_INCREMENT, `no` VARCHAR(100) NOT NULL, PRIMARY KEY ( `id` ) )ENGINE=InnoDB DEFAULT CHARSET=utf8; 然后向pep中插入两条数据,pep2中插
MySQL连表查询分组去重的实现示例

目录业务逻辑数据表结构查询逻辑 SQL脚本脚本说明业务逻辑通过多种渠道将小程序的活动页链接发布出去,比如通过多多种短信附带链接( channel 就记为 sms1,sms2,sms3 ),或者海报上面贴微信小程序的二维码( channel 记为 qrcode1,qrcode2,qrcode3 ),线下会员通过扫描二维码也能进入小程序指定的活动页,亦或者是通过其他会员分享的小程序链接也可以进入小程序( channel 记为 share).这些不同的进入方式在我这篇文章统称为不同的渠道,
mysql 跨表查询、更新、删除示例

下面来谈谈跨表插入,更新和删除首先讨论的是跨表查询: insert into `table_A` select * from `table_B`;注意*代表全部插入. 接着又讨论关于跨表更新复制代码代码如下: update `table_A`, `table_B` set `table_A`.`name` = `table_B`.`name` where `table_A`.`id` = `table_B`.`id`;
MySQL单表查询操作实例详解【语法、约束、分组、聚合、过滤、排序等】

本文实例讲述了MySQL单表查询操作.分享给大家供大家参考,具体如下: 语法一.单表查询的语法 SELECT 字段1,字段2... FROM 表名 WHERE 条件 GROUP BY field HAVING 筛选 ORDER BY field LIMIT 限制条数二.关键字的执行优先级(重点) 重点中的重点:关键
MySQL单表查询实例详解

1.准备数据以下操作将在该表中进行 create table student ( id int unsigned primary key auto_increment, name char(12) not null, gender enum("male","famale") default "male", age tinyint unsigned not null, hoc_group char(12) not null, html tinyi
MySQL单表查询常见操作实例总结

本文实例总结了MySQL单表查询常见操作.分享给大家供大家参考,具体如下: 创建fruits表: CREATE TABLE fruits ( f_id char(10) NOT NULL, s_id INT NOT NULL, f_name char(255) NOT NULL, f_price decimal(8,2) NOT NULL, PRIMARY KEY(f_id) ) ; INSERT INTO fruits (f_id, s_id, f_name, f_price) VALUES(
MySQL多表查询实例详解【链接查询、子查询等】

本文实例讲述了MySQL多表查询.分享给大家供大家参考,具体如下: 准备工作:准备两张表,部门表(department).员工表(employee) create table department( id int, name varchar(20) ); create table employee( id int primary key auto_increment, name varchar(20), sex enum('male','female') not null default 'ma
MySQL多表查询详解下

好好吃饭,好好休息,听着很简单,实际落实缺失不那么容易. 继续回顾MySql的多表查询之1999语法 #二,SQL1999语法语法: SELECT 查询列表 FROM 表1 别名 [连接类型] JOIN 表2 别名 ON 链接条件 [WHERE 筛选条件] [GROUP BY 分组] [HAVING 筛选条件] [ORDER BY 排序列表ASC|DESC] 分类(连接类型): 内连接(★): INNER 外联结左外(★):LEFT [OUTER] 右外(★):RIGHT [OUTER] 全
MySQL多表查询详解上

时光在不经意间,总是过得出奇的快.小暑已过,进入中暑,太阳更加热烈的绽放着ta的光芒,...在外面被太阳照顾的人们啊,你们都是勤劳与可爱的人啊.在房子里已各种姿势看我这篇这章的你,既然点了进来,那就由我继续带你回顾MySql的知识吧! 回顾练习资料girls库以及两张表的脚本: 链接: https://pan.baidu.com/s/1bgFrP7dBBwk3Ao755pU4Qg 提取码: ihg7 引题:笛卡尔现象,先来观看一下两张表. SELECT * FROM boys; SELECT *
MySQL多表查询的具体实例

一使用SELECT子句进行多表查询 SELECT 字段名 FROM 表1,表2 - WHERE 表1.字段 = 表2.字段 AND 其它查询条件 SELECT a.id,a.name,a.address,a.date,b.math,b.english,b.chinese FROM tb_demo065_tel AS b,tb_demo065 AS a WHERE a.id=b.id 注:在上面的的代码中,以两张表的id字段信息相同作为条件建立两表关联,但在实际开发中不应该这样使用,最好用主外键
MySQL多表查询的案例详解

多表查询案列说明笛卡尔积的理解 select id,department_name from employees,departments;#错的 select id,department_id,department_name from employees CROSS JOIN departments;#错的每个员工和每个部门匹配了一遍(查出的条目数=id数*department数) 错误原因:缺少连接条件笛卡尔积的解决编写连接条件: 表1.列 = 表二.列(若多个表连接,至少要用n-1