python数据可视化使用pyfinance分析证券收益示例详解

2025-03-30 00:05:59

pyfinance简介

在查找如何使用Python实现滚动回归时，发现一个很有用的量化金融包——pyfinance。顾名思义，pyfinance是为投资管理和证券收益分析而构建的Python分析包，主要是对面向定量金融的现有包进行补充，如pyfolio和pandas等。

pyfinance包含六个模块

datasets.py ：金融数据下载（基于request进行数据爬虫，有些数据由于外网受限已经无法下载）；

general.py：通用财务计算，例如主动份额计算，收益分配近似值和跟踪误差优化；

ols.py：回归分析，支持pandas滚动窗口回归；

options.py：期权衍生品计算和策略分析；

returns.py：通过CAPM框架对财务时间序列进行统计分析，旨在模拟FactSet Research Systems和Zephyr等软件的功能，并提高了速度和灵活性；

utils.py：基础架构。

本文主要围绕returns模块，介绍pyfinance在证券投资分析中的应用，后续将逐步介绍datasets、options、ols等模块。

returns模块应用实例

pyfinance的安装比较简单，直接在cmd（或anaconda prompt）上输入"pip install pyfinance"即可。returns模块主要以TSeries类为主体（暂不支持dataframe），相当于对pandas的Series进行类扩展，使其实现更多功能，支持证券投资分析中基于CAMP（资本资产定价模型）框架的业绩评价指标计算。引用returns模块时，直接使用"from pyfinance import TSeries"即可。

下面以tushare为数据接口，先定义一个数据获取函数，在函数里对收益率数据使用TSeries进行转换，之后便可以直接使用TSeries类的相关函数。

import pandas as pd
import numpy as np
from pyfinance import TSeries
import tushare as ts
def get_data(code,start='2011-01-01',end=''):
    df=ts.get_k_data(code,start,end)
    df.index=pd.to_datetime(df.date)
    ret=df.close/df.close.shift(1)-1
    #返回TSeries序列
    return TSeries(ret.dropna())
#获取中国平安数据
tss=get_data('601318')
#tss.head()

收益率计算

pyfinance的returns提供了年化收益率（anlzd_ret）、累计收益率（cuml_ret）和周期收益率（rollup）等，下面以平安银行股票为例，计算收益率指标。

#年化收益率
anl_ret=tss.anlzd_ret()
#累计收益率
cum_ret=tss.cuml_ret()
#计算周期收益率
q_ret=tss.rollup('Q')
a_ret=tss.rollup('A')
print(f'年化收益率：{anl_ret*100:.2f}%')
print(f'累计收益率：{cum_ret*100:.2f}%')
#print(f'季度收益率：{q_ret.tail().round(4)}')
#print(f'历年收益率：{a_ret.round(4)}')

输出结果：

累计收益率：205.79%

年化收益率：12.24%

可视化每个季度（年）收益率

from pyecharts import Bar
attr=q_ret.index.strftime('%Y%m')
v1=(q_ret*100).round(2).values
bar=Bar('中国平安各季度收益率%')bar.add('',attr,v1,)
bar

from pyecharts import Bar
attr=a_ret.index.strftime('%Y')
v1=(a_ret*100).round(2).values
bar=Bar('中国平安历年收益率%')
bar.add('',attr,v1,is_label_show=True,
       is_splitline_show=False)
bar

CAPM模型相关指标

基于CAPM模型计算alpha、beta、回归决定系数R2、t统计量和残差项等。实际上主要使用了ols回归，因此如果要获得这些动态的alpha和beta值，可以进一步借助ols模块的滚动回归函数（PandasRollingOLS）了，这将在后续推文介绍其应用。

#以沪深300指数为基准
#为保证二者长度一致，以中国平安的索引为准
benchmark=get_data('hs300')
benchmark=benchmark.loc[tss.index]
alpha,beta,rsq=tss.alpha(benchmark),tss.beta(benchmark),tss.rsq(benchmark)
tstat_a,tstat_b=tss.tstat_alpha(benchmark),tss.tstat_beta(benchmark)
print(f'alpha:{alpha:.4f}，t统计量：{tstat_a:.2f}')
print(f'beta :{beta:.4f}，t统计量：{tstat_b:.2f}')
print(f'回归决定系数R2：{tss.rsq(benchmark):.3f}')

alpha:0.0004，t统计量：1.55
beta :1.0634，t统计量：60.09
回归决定系数R2：0.606

风险指标

风险指标主要包括标准差和最大回撤。在计算标准差时，注意需要修改默认参数，打开pyfinance安装包所在路径，如果是安装了Anaconda，进入以下路径：

c:\Anaconda3\Lib\site-packages\pyfinance，打开returns源文件，找到anlzd_stdev和semi_stdev函数，将freq默认None改成250（一年的交易天数）。

#年化标准差
a_std=tss.anlzd_stdev()
#下行标准差
s_std=tss.semi_stdev()
#最大回撤
md=tss.max_drawdown()
print(f'年化标准差：{a_std*100:.2f}%')
print(f'下偏标准差：{s_std*100:.2f}%')
print(f'最大回撤差：{md*100:.2f}%')

年化标准差：31.37%
下偏标准差：0.43%
最大回撤差：-45.76%

下偏标准差主要是为解决收益率分布的不对称问题，当收益率函数分布左偏的情况下，使用正态分布会低估风险，因此使用传统夏普比率分母使用全样本标准差进行估计不太合适，应使用收益对无风险投资收益的偏离。

基准比较指标

基准比较指标是需要指定一个基准（benchmark），如将沪深300指数作为中国平安个股的基准进行比较分析。

bat=tss.batting_avg(benchmark)
uc=tss.up_capture(benchmark)
dc=tss.down_capture(benchmark)
tc=uc/dc
pct_neg=tss.pct_negative()
pct_pos=tss.pct_positive()
print(f'比基准收益高的时间占比：{bat*100:.2f}%')
print(f'上行期与基准收益比：{uc*100:.2f}%')
print(f'下行期与基准收益比：{dc*100:.2f}%')
print(f'上行期与下行期比：{tc*100:.2f}%')
print(f'个股下行（收益负）时间占比：{pct_neg*100:.2f}%')
print(f'个股上行（收益正）时间占比：{pct_pos*100:.2f}%')

比基准收益高的时间占比：47.83%
上行期与基准收益比：111.70%
下行期与基准收益比：105.32%
上行期与下行期比：106.06%
个股下行（收益负）时间占比：48.94%
个股上行（收益正）时间占比：50.00%

此外，信息比率和特雷诺指数是两个常用的基准比较评价指标，特别是用于对基金产品或投资组合的业绩进行量化评价。

信息比率（information ratio）：以马克维茨的均值方差模型为基础，衡量超额风险所带来的超额收益，表示单位主动风险所带来的超额收益。IR=α ∕ ω (α为组合的超额收益，ω为主动风险），分子α为真实预期收益率与定价模型所计算出的收益率的差，分母为残差风险即残差项的标准差。

特雷诺指数（Treynor ratio）：衡量单位风险的超额收益，计算公式为:TR=（Rp―Rf）/βp，其中：TR表示特雷诺业绩指数，Rp表示某投资组合平均收益率，Rf为平均无风险利率，βp表示某投资组合的系统风险。

ir=tss.info_ratio(benchmark)
tr=tss.treynor_ratio(benchmark)
print(f'信息比率：{ir:.3f}')
print(f'特雷诺指数：{tr:.3f}')
信息比率：0.433
特雷诺指数：0.096

风险调整收益指标

风险调整收益率指标比较常用的有夏普比率（sharpe ratio）、索提诺比率（sortino ratio）和卡玛比率（calmar ratio），这三个指标都是风险调整后收益比率，因此分子都是收益指标，分母都是风险指标。

夏普比率（Sharpe Ratio）：风险调整后的收益率，计算公式：＝[E(Rp)－Rf]/σp，其中E(Rp)：投资组合预期报酬率，Rf：无风险利率，σp：投资组合的标准差。计算投资组合每承受一单位总风险，会产生多少的超额报酬。
索提诺比率（Sortino Ratio）：与夏普比率思路一致，核心在于分母应用了下行波动率概念（Downside Risk），计算标准差的时候，不采用均值，而是一个设定的可接受最小收益率（r_min），收益率序列中，超出这个最小收益率的收益距离按照0计算，低于这个收益率的平方距离累积，这样标准差就变成了半个下行标准差。对应的，索提诺比率的分子也采用策略收益超出最低收益的部分。与夏普比率相比，索提诺比率更看重对（左）尾部的预期损失分析，而夏普比率则是对全体样本进行分析。
Calmar比率(Calmar Ratio) ：描述收益和最大回撤之间的关系，计算方式为年化收益率与历史最大回撤之间的比率。Calmar比率数值越大，投资组合业绩表现越好。

sr=tss.sharpe_ratio()
sor=tss.sortino_ratio(freq=250)
cr=tss.calmar_ratio()
print(f'夏普比率：{sr:.2f}')
print(f'索提诺比率：{sor:.2f}')
print(f'卡玛比率：{cr:.2f}')

夏普比率：0.33
索提诺比率：28.35
卡玛比率：0.27

综合业绩评价指标分析实例

下面将上述常用指标进行综合，并获取多只个股进行比较分析。

def performance(code,start='2011-01-01',end=''):
    tss=get_data(code,start,end)
    benchmark=get_data('hs300',start,end).loc[tss.index]
    dd={}
    #收益率
    #年化收益率
    dd['年化收益率']=tss.anlzd_ret()
    #累积收益率
    dd['累计收益率']=tss.cuml_ret()
    #alpha和beta
    dd['alpha']=tss.alpha(benchmark)
    dd['beta']=tss.beta(benchmark)
    #风险指标
    #年化标准差
    dd['年化标准差']=tss.anlzd_stdev()
    #下行标准差
    dd['下行标准差']=tss.semi_stdev()
    #最大回撤
    dd['最大回撤']=tss.max_drawdown()
    #信息比率和特雷诺指数
    dd['信息比率']=tss.info_ratio(benchmark)
    dd['特雷纳指数']=tss.treynor_ratio(benchmark)
    #风险调整收益率
    dd['夏普比率']=tss.sharpe_ratio()
    dd['索提诺比率']=tss.sortino_ratio(freq=250)
    dd['calmar比率']=tss.calmar_ratio()
    df=pd.DataFrame(dd.values(),index=dd.keys()).round(4)
    return df

获取多只个股（也构建投资组合）数据，对比评估业绩评价指标：

#获取多只股票数据
df=pd.DataFrame(index=performance('601318').index)
stocks={'中国平安':'601318','贵州茅台':'600519',\
        '海天味业':'603288','格力电器':'000651',\
        '万科A':'00002','比亚迪':'002594',\
        '云南白药':'000538','双汇发展':'000895',\
        '海尔智家':'600690','青岛啤酒':'600600'}
for name,code in stocks.items():
    try:
        df[name]=performance(code).values
    except:
        continue

d

结语

pyfinance主要为证券投资管理和绩效评价指标而设计的python包，对于考CFA和FRM的读者相当实用。实际上，pyfinance的returns模块是对pandas的Series类进行了扩展，从而支持证券投资收益分析和绩效评价。Python是建立在各种轮子上（module）的“胶水”语言，因此善于借用已有的包进行计算和编程，可以提高效率，减少自己“造轮子”的时间和精力。

以上就是python数据可视化使用pyfinance分析证券收益示例详解的详细内容，更多关于pyfinance分析证券收益的资料请关注我们其它相关文章！

python实现股票历史数据可视化分析案例

投资有风险,选择需谨慎. 股票交易数据分析可直观股市走向,对于如何把握股票行情,快速解读股票交易数据有不可替代的作用! 1 数据预处理 1.1 股票历史数据csv文件读取 import pandas as pd import csv df = pd.read_csv("/home/kesci/input/maotai4154/maotai.csv") 1.2 关键数据--在csv文件中选择性提取"列" df_high_low = df[['date','high',
Python数据可视化图实现过程详解

python画分布图代码示例: # encoding=utf-8 import matplotlib.pyplot as plt from pylab import * # 支持中文 mpl.rcParams['font.sans-serif'] = ['SimHei'] # 'mentioned0cluster', names = ['mentioned1cluster','mentioned2cluster', 'mentioned3cluster', 'mentioned4cluster'
Python数据可视化 pyecharts实现各种统计图表过程详解

1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图等统计图表. 2.柱状图适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况. 优点: 利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感. 缺点: 只适用中小规模的数据集. 柱状图最基本用法 from pyechart
Python数据可视化库seaborn的使用总结

seaborn是python中的一个非常强大的数据可视化库,它集成了matplotlib,下图为seaborn的官网,如果遇到疑惑的地方可以到官网查看.http://seaborn.pydata.org/ 从官网的主页我们就可以看出,seaborn在数据可视化上真的非常强大. 1.首先我们还是需要先引入库,不过这次要用到的python库比较多. import numpy as np import pandas as pd import matplotlib as mpl import matpl
利用Python进行数据可视化常见的9种方法！超实用！

前言如同艺术家们用绘画让人们更贴切的感知世界,数据可视化也能让人们更直观的传递数据所要表达的信息. 我们今天就分享一下如何用 Python 简单便捷的完成数据可视化. 其实利用 Python 可视化数据并不是很麻烦,因为 Python 中有两个专用于可视化的库 matplotlib 和 seaborn 能让我们很容易的完成任务. Matplotlib:基于Python的绘图库,提供完全的 2D 支持和部分 3D 图像支持.在跨平台和互动式环境中生成高质量数据时,matplotlib 会很有帮助
python数据可视化使用pyfinance分析证券收益示例详解

目录 pyfinance简介 pyfinance包含六个模块 returns模块应用实例收益率计算 CAPM模型相关指标风险指标基准比较指标风险调整收益指标综合业绩评价指标分析实例结语 pyfinance简介在查找如何使用Python实现滚动回归时,发现一个很有用的量化金融包--pyfinance.顾名思义,pyfinance是为投资管理和证券收益分析而构建的Python分析包,主要是对面向定量金融的现有包进行补充,如pyfolio和pandas等. pyfinance包含六个模块
基于Python数据可视化利器Matplotlib,绘图入门篇,Pyplot详解

Pyplot matplotlib.pyplot是一个命令型函数集合,它可以让我们像使用MATLAB一样使用matplotlib.pyplot中的每一个函数都会对画布图像作出相应的改变,如创建画布.在画布中创建一个绘图区.在绘图区上画几条线.给图像添加文字说明等.下面我们就通过实例代码来领略一下他的魅力. import matplotlib.pyplot as plt plt.plot([1,2,3,4]) plt.ylabel('some numbers') plt.show() 上图是我们通
Python数据可视化常用4大绘图库原理详解

今天我们就用一篇文章,带大家梳理matplotlib.seaborn.plotly.pyecharts的绘图原理,让大家学起来不再那么费劲! 1. matplotlib绘图原理关于matplotlib更详细的绘图说明,大家可以参考下面这篇文章,相信你看了以后一定学得会. matplotlib绘图原理:http://suo.im/678FCo 1)绘图原理说明通过我自己的学习和理解,我将matplotlib绘图原理高度总结为如下几步: 导库;创建figure画布对象;获取对应位置的axes坐标
Python数据可视化正态分布简单分析及实现代码

Python说来简单也简单,但是也不简单,尤其是再跟高数结合起来的时候... 正态分布(Normaldistribution),也称"常态分布",又名高斯分布(Gaussiandistribution),最早由A.棣莫弗在求二项分布的渐近公式中得到.C.F.高斯在研究测量误差时从另一个角度导出了它.P.S.拉普拉斯和高斯研究了它的性质.是一个在数学.物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力. 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人
python数据可视化自制职位分析生成岗位分析数据报表

目录前言 1. 核心功能设计可视化展示岗位表格数据分析岗位薪资情况分析岗位公司情况数据分析导出 2. GUI设计与实现 3. 功能实现 3.1 职位数据爬虫 3.2 数据预处理 3.3 岗位数据展示 3.4 薪资图表可视化 3.5 岗位公司情况统计 3.6 预览保存前言为什么要进行职位分析?职位分析是人力资源开发和管理的基础与核心,是企业人力资源规划.招聘.培训.薪酬制定.绩效评估.考核激励等各项人力资源管理工作的依据.其次我们可以根据不同岗位的职位分析,可视化展示各岗位的数据分析
python数据可视化pygal模拟掷骰子实现示例

目录可视化包Pygal生成可缩放矢量图形文件分析结果,计算每个点数出现的次数绘制直方图同时投掷两个骰子同时投掷两个面数不同骰子可视化包Pygal生成可缩放矢量图形文件可以在尺寸不同的屏幕上自动缩放,显示图表 #安装pygal pip install pygal ''' 想要了解Pygal可生成什么样的图表,可访问http://www.pygal.org/ 单击document,点击chart types,每个示例都包含源代码 ''' from random import randi
Python数据合并的concat函数与merge函数详解

目录一.concat函数 1)横向堆叠与外连接 2) 纵向堆叠与内链接二.merge()函数 1)根据行索引合并数据 2)合并重叠数据一.concat函数 1.concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并pandas.concat(objs, axis=0, join=’outer’, join_axes=None, ignore_index=False, keys=None, levels=None, verify_integrity=Fals
Python数学建模StatsModels统计回归之线性回归示例详解

目录 1.背景知识 1.1 插值.拟合.回归和预测 1.2 线性回归 2.Statsmodels 进行线性回归 2.1 导入工具包 2.2 导入样本数据 2.3 建模与拟合 2.4 拟合和统计结果的输出 3.一元线性回归 3.1 一元线性回归 Python 程序: 3.2 一元线性回归程序运行结果: 4.多元线性回归 4.1 多元线性回归 Python 程序: 4.2 多元线性回归程序运行结果: 5.附录:回归结果详细说明 1.背景知识 1.1 插值.拟合.回归和预测插值.拟合.回归和预测
利用Python打造一个多人聊天室的示例详解

一.实验名称建立聊天工具二.实验目的掌握Socket编程中流套接字的技术,实现多台电脑之间的聊天. 三.实验内容和要求 vii.掌握利用Socket进行编程的技术 viii.必须掌握多线程技术,保证双方可以同时发送 ix.建立聊天工具 x.可以和多个人同时进行聊天 xi.必须使用图形界面,显示双方的语录四.实验环境 PC多台,操作系统Win7,win10(32位.64位) 具备软件python3.6 . 五.操作方法与实验步骤服务端 1.调入多线程.与scoket包,用于实现多线程连接
对python实现二维函数高次拟合的示例详解

在参加"数据挖掘"比赛中遇到了关于函数高次拟合的问题,然后就整理了一下源码,以便后期的学习与改进. 在本次"数据挖掘"比赛中感觉收获最大的还是对于神经网络的认识,在接近一周的时间里,研究了进40种神经网络模型,虽然在持续一周的挖掘比赛把自己折磨的惨不忍睹,但是收获颇丰.现在想想也挺欣慰自己在这段时间里接受新知识的能力.关于神经网络方面的理解会在后续博文中补充(刚提交完论文,还没来得及整理),先分享一下高次拟合方面的知识. # coding=utf-8 import