Python Pyecharts绘制桑基图分析用户行为路径

目录
  • 读取数据
  • 生成节点数据
  • 组织数据:定义节点和流量
  • 数据可视化

桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。很多工具都能实现桑基

图,比如:Excel、tableau,我们今天要用 Pyecharts 来绘制。

因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的

数据,来分析流向路径。学会思路,你也可以换成自己公司的用户行为埋点数据。

读取数据

数据来源:https://www.kaggle.com/c/titanic

from pyecharts import options as opts
from pyecharts.charts import Sankey
import pandas as pd
data = pd.read_excel('/Users/wangwangyuqing/Desktop/train.xlsx')
data

整理数据结构:父类→子类→值

从父类到子类,每相邻的两个分类变量都需要计算,使用 Pandas 中数据透视表,计算后的数据纵向合并成三列。

lis = data.columns.tolist()[:-1]
lis1 = lis[:-1]
lis2 = lis[1:]
data1 = pd.DataFrame()
for i in zip(lis1,lis2):
    datai = data.pivot_table('ID',index=list(i),aggfunc='count').reset_index()
    datai.columns=[0,1,2]
    data1 = data1.append(datai)
data1

生成节点数据

需要把所有涉及到的节点去重规整在一起。列表内嵌套字典的形式去重汇总。

# 生成nodes
nodes = []
# 先添加几个顶级的父节点
nodes.append({'name':'C港口'})
nodes.append({'name':'Q港口'})
nodes.append({'name':'S港口'})
# 添加其他节点
for i in data1[1].unique():
    dic = {}
    dic['name'] = i
    nodes.append(dic)
nodes

组织数据:定义节点和流量

数据从哪里流向哪里,流量(值)是多少,循环+字典来组织数据

links = []
for i in data1.values:
    dic = {}
    dic['source'] = i[0]
    dic['target'] = i[1]
    dic['value'] = i[2]
    links.append(dic)
links

数据可视化

c = (
    Sankey(init_opts=opts.InitOpts(width="1200px", height="800px",theme='westeros'))
    .add(
        "",
        nodes=nodes,
        links=links,
        linestyle_opt=opts.LineStyleOpts(opacity=0.2, curve=0.5, color="source"),
        label_opts=opts.LabelOpts(position="right"),
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="桑基图"))
    .render("/Users/wangwangyuqing/Desktop/image.html")
)

桑基图是分析用户路径的有效方法之一,能非常直观地展现用户旅程,帮助我们进一步确定转化漏斗中的关键步骤,发现用户的

流失点,找到有价值的用户群体,看用户主要流向了哪里,发现用户的兴趣点以及被忽略的产品价值,寻找新的机会。

以上就是Python Pyecharts绘制桑基图分析用户行为路径的详细内容,更多关于Pyecharts绘制桑基图的资料请关注我们其它相关文章!

(0)

相关推荐

  • Python绘制惊艳的桑基图的示例详解

    目录 桑基图简介 什么是桑基图? 如何绘制桑基图? 桑基图绘图基础 调整节点位置和图表宽度 添加有意义的悬停标签 桑基图简介 很多时候,我们需要一种必须可视化数据如何在实体之间流动的情况.例如,以居民如何从一个国家迁移到另一个国家为例.这里演示了有多少居民从英格兰迁移到北爱尔兰.苏格兰和威尔士. 从这个 桑基图 (Sankey)可视化中可以明显看出,从England迁移到Wales的居民多于从Scotland或Northern Ireland迁移的居民. 什么是桑基图? 桑基图通常描绘 从一个实

  • python pyecharts库的用法大全

    目录 什么是pyecharts? pyecharts安装 加载 折线图的绘制 条形图和折线图的结合 绘制漏斗图 什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库. echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生成 Echarts 图表的类库.实际上就是 Echarts 与 Python 的对接. 使用 pyecharts 可以生成独立的网页,也可以在 flask , Django 中集成使用.

  • Python使用pyecharts绘制世界地图,省级地图,城市地图实例详解

    目录 1.世界地图绘制演示 ① 世界地图数据准备 ② 世界地图生成 2.省份(河北省)地图绘制演示 ① 省份地图数据准备 ② 省份地图生成 3.城市(承德市)地图绘制演示 ① 城市地图数据准备 ② 城市地图生成 1.世界地图绘制演示 先给大家看下效果图哈. ① 世界地图数据准备 地图数据如下: 因为是世界地图,所以对标的国家,我设置了 2 组,里面的数据是随机生成的. # -*- coding:utf-8 -*- # 2022-2-14 # 作者:小蓝枣 # pyecharts地图 # 需要引用

  • Python 绘制桑基图全面解析

    目录 前言 题目再现 题目拆解 创建桑基图 添加桑基图选项 返回桑基图绘制完成的对象 3.完整源码 总结&后记 大家好,我是执念斩长河,一个刚刚学习python绘图的学渣,今天愉快学习<python数据可视化>(黑马程序员编著),其中的"绘制桑基图"内容,我将其成功实现,特此写博文纪念一下. 前言 桑基图亦称为桑基能量分流图.桑基能量平衡图,是一种特定类型的流程图,用于展示数据的"流动"变化.桑基图中包含若干条从左到右延展的分支,每条分支的宽度代

  • Python数据可视化Pyecharts库实现桑葚图效果

    目录 基本思路我总结大概有三步: 1. 先申明使用sankey 2. 使用add 添加对sankey图的配置信息 3. 最后render生成html文件展示 首先介绍一下什么是桑葚图? 桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图. 它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源.材料成分.金融等数据的可视化分析. 因1898年Matthew Henry Phineas Riall Sankey绘制的"蒸汽机的能源效率图"

  • Pyecharts可视化图片渲染的方法详解

    使用 pyecharts 渲染成图片一直是开发者比较关心的功能,pyecharts提供了 selenium.phantomjs 和 pyppeteer 三种方式. 更多介绍可以学习官方文档:https://pyecharts.org/#/zh-cn/render_images 首先需要安装上snapshot-selenium pip install snapshot-selenium -i http://pypi.douban.com/simple --trusted-host pypi.dou

  • Python Pyecharts绘制桑基图分析用户行为路径

    目录 读取数据 生成节点数据 组织数据:定义节点和流量 数据可视化 桑基图,它的核心是对不同点之间,通过线来连接.线的粗细代表流量的大小.很多工具都能实现桑基 图,比如:Excel.tableau,我们今天要用 Pyecharts 来绘制. 因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的 数据,来分析流向路径.学会思路,你也可以换成自己公司的用户行为埋点数据. 读取数据 数据来源:https://www.kaggle.com/c/titanic fro

  • Python可视化神器pyecharts绘制桑基图

    目录 桑基图 桑基图系列模板 第一个桑基图 复杂桑基图 桑基图 桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图.它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于​​能源​​​.材料成分.​​金融​​​等数据的可视化分析.因1898年Matthew Henry Phineas Riall Sankey绘制的“​​蒸汽机​​的能源效率图”而闻名,此后便以其名字命名为“桑基图”. 桑基图最明显的特征就是,始末端的分支宽度总和相等,即所有主支宽度

  • Python Pyecharts绘制象形柱图

    目录 1.准备工作 1.1 导入模块 1.2 部分参数 2.基础象形图 3.自定义图例 3.1 图片图例 3.2 生成象形图 在可视化展示过程中,为了达到更形象的展示效果,我们往往需要自定义一些直观的图例,本期给大家介绍可视化库Pyecharts中的象形柱图,希望对你有所帮助. 1.准备工作 1.1 导入模块 from pyecharts import options as opts from pyecharts.charts import PictorialBar from pyecharts

  • 详解Matlab如何绘制桑基图

    目录 详细用法 1使用示例 2输入参数 3输出 函数完整代码 使用示例代码 这次主要是分享自己写的一个函数,用来绘制桑基图,效果大概是下面这样子: 先说明函数(sankey2)怎么用,函数完整代码放在博客最后 详细用法 1 使用示例 新建一个m文件,运行如下代码 List={'a1',1,'A'; 'a2',1,'A'; 'a3',1,'A'; 'a3',0.5,'C'; 'b1',1,'B'; 'b2',1,'B'; 'b3',1,'B'; 'c1',1,'C'; 'c2',1,'C'; 'c

  • Python pyecharts绘制折线图详解

    一.绘制折线图 import seaborn as sns import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif']=['Microsoft YaHei'] # 用来正常显示中文标签 plt.rcParams['axes.unicode_minus']=False

  • 利用Python matplotlib绘制风能玫瑰图

    概述 在之前的风资源分析文章中,有提到过用widrose包来进行玫瑰图的绘制,目前的可视化绘图包有很多,但是最基础和底层的,本人认为还是matplotlib,有时候为了画1-2个图就去安装一个包,好麻烦,我就是个安装软件的渣渣,所以,推己及人,我也研究了一下,matplotlib画玫瑰图的方法,废话不多说,开始咯~~~ 风能玫瑰图 玫瑰图是气象科学专业统计图表,用来统计某个地区一段时期内风向.风速发生频率,又分为"风向玫瑰图"和"风速玫瑰图".本文中的玫瑰图是将风速

  • 利用Python pyecharts绘制饼图

    目录 一.pyecharts绘制饼图语法简介 二.绘制普通饼图 三.绘制圆环图 四.绘制饼图-玫瑰图 一.pyecharts绘制饼图语法简介 饼图主要用于表现不同类目的数据在总和中的占比.每个的弧度不是数据量的占比 pie.add()方法的用法 add(name, attr, value, radius=None, center=None, rosetype=None, **kwargs) name->str 图例名称 attr->list 属性名称 value->list 属性所对应的

  • Python pyecharts绘制条形图详解

    目录 一.简介 二.整理数据 1.配置主题 2.柱状图 Bar - Bar_base_dict_config 3.样例数据 Faker.choose() 4.滚动条 Bar - Bar_datazoom_slider 5.鼠标移动效果 Bar - Bar_datazoom_inside 6.显示最值 Bar - Bar_markpoint_type 7.改变滚动条在侧面 Bar - Bar_datazoom_slider_vertical 8.多个Y轴 9.直方图 Bar - Bar_histo

随机推荐