首页> 中国专利> 一种基于机器学习的基金经理个人真实业绩曲线计算方法

一种基于机器学习的基金经理个人真实业绩曲线计算方法

摘要

本发明涉及金融科技机器学习技术领域,具体说是一种基于机器学习的基金经理的个人真实业绩曲线计算方法,包括数据准备、机器学习模型构建和绩效曲线的合成。其中,模型采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中。本发明所述方法中,PCA降维能够消除各个变量共线性,提高聚类准确率;DBSCAN能够自动排除类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;能够剥离出大部分基金经理的真实业绩,误差部分较小,并且不影响整体业绩曲线计算。

著录项

  • 公开/公告号CN116227957A

    专利类型发明专利

  • 公开/公告日2023-06-06

    原文格式PDF

  • 申请/专利权人 北京汇成基金销售有限公司;

    申请/专利号CN202211487478.2

  • 发明设计人

    申请日2022-11-25

  • 分类号G06Q10/0639;G06Q40/06;G06F18/232;G06F18/2135;

  • 代理机构北京卫平智业专利代理事务所(普通合伙);

  • 代理人闫萍

  • 地址 100053 北京市西城区宣武门外大街甲1号4层401-2

  • 入库时间 2024-04-18 19:53:33

说明书

技术领域

本发明涉及金融科技机器学习技术领域,具体说是一种基于机器学习的基金经理的个人真实业绩曲线计算方法。

背景技术

随着资管行业的发展,基金的投资成为越来越多个人与机构的重要配置方向,基金经理的分析成为基金筛选的重要参考指标。如何准确的计算一个基金经理的个人业绩曲线成为一个重要的技术难题,由于基金可以分为股票型、债券型、混合型、货币型、FOF型等多种类型,一个人可能挂名多种类型的基金,同一个基金可能会发生投资方向和类型的变化,同一只基金也可能并非基金经理自己一直管辖,存在大量的基金经理变更情况,也存在基金经理只挂名而不实际管理的情况,导致很难通过传统的技术手段计算基金经理合理的业绩曲线。

情况1:基金经理同时管理多只偏股基金,其中某只基金仅仅是挂名,并未实际管理。

情况2:基金经理管理多只偏股基金,其中某几只基金实际管理过,后期移交给其他人管理,但是依然挂自己的名字。

情况3:基金经理管理多只偏股基金,其中有一只基金中途变更为偏债型基金。

以上情况下,如果简单把多只基金收益算作是基金经理管理的偏股型基金,会有失公允,不便于用户掌握该基金经理的真实收益情况。

发明内容

针对现有技术中存在的缺陷,本发明的目的在于提供一种基于机器学习的基金经理个人真实业绩曲线计算方法,基于基金经理过往管理的基金业绩曲线、持仓以及公告的文本资料,通过机器学习的技术剥离其管辖的各类基金,并计算基金经理个人真实的含权分类(指分类允许持有股票)基金业绩曲线。

为达到以上目的,本发明采取的技术方案是:

一种基于机器学习的基金经理个人真实业绩曲线计算方法,包括以下步骤:

S1、数据准备:获取不同类型的基金从成立至今的累积净值数据、基金经理任职与离职日期数据、基金每个报告期的持仓数据、区分类型变动的基金公告数据,将各类型的所有基金按照时间维度区分个人管辖与非个人管辖的基金,并贴上对应标签;

S2、机器学习模型构建:对多人管理中实际个人管辖的对应类型基金按照时间戳打标签,对每个类型的每个基金经理构建模型,将挂该基金经理名称的所有对应类型基金从具体持仓和历史收益率两个维度构建多因子模型,采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中,从而为与基金经理存在实际关系的基金打上对应的标签,自动排除了类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;

S3、绩效曲线的合成:对每个基金经理管理的每类基金产品(如偏股、纯债),在管理该类产品期间计算对应的基金经理历史绩效,计算方式为,用管理期间所有的该类基金进行每天的收益率市值加权处理,得到每天的加权收益率,然后基于每天的加权收益率计算历史累计净值曲线,净值曲线从1开始计算从而得到所有对应类型基金经理的历史业绩。

进一步地,步骤S2包括以下步骤:

S21、获取区间基金经理管理的全部某类基金日收益率并计算基金的行业收益,得到每只基金的区间收益率矩阵,其中,行业收益采用该基金持有的最近一期全部股票持仓计算得到,基金行业收益率计算公式为:

其中,M

S22、对每只基金的区间收益率矩阵进行PCA降维;

S23、对每只基金的降维后的日度时间序列指标按日期做聚类,每个日期由L个基金和S个维度构成L×S矩阵,对该矩阵进行DBSCAN聚类,以基金经理单独管理的基金A为目标基金,所有分类不为-1且与A分类一致的基金与A归为一类,认为是基金经理真实管理的基金。

进一步地,步骤S2中所述日收益率为32维,由申万1级行业分类的31个行业的行业收益率和一个基金收益率组成,降维后的维度数为5。

进一步地,所述DBSCAN聚类算法的参数Eps由K距离曲线算法得出,MinPts设置为2,其中,Eps代表样本邻域距离阈值,MinPts代表样本距离为Eps的邻域中样本个数的阈值。

进一步地,步骤S3中所述绩效曲线的合成计算公式如下:

Curve(m)

其中R(m)

本发明所述的基于机器学习的基金经理个人真实业绩曲线计算方法,相比于现有技术,具有以下有益效果:

PCA降维能够消除各个变量共线性,提高聚类准确率;DBSCAN能够自动排除类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程;本方法能够剥离出大部分基金经理的真实业绩,误差部分较小,并且不影响整体业绩曲线计算。

附图说明

本发明有如下附图:

图1本发明机器学习模型构建流程图;

图2本发明方法实施效果图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

本发明所述的基于机器学习的基金经理个人真实业绩曲线计算方法,包括如下步骤:

S1、数据准备:获取不同类型的基金从成立至今的累积净值数据、基金经理任职与离职日期数据、基金每个报告期的持仓数据、基金的公告数据(区分类型变动),将各类型的所有基金按照时间维度区分各个人管辖与非个人管辖的基金,并贴上对应标签。

S2、机器学习模型构建:主要目标是对多人管理中实际个人管辖的对应类型基金打标签(按照时间戳打),对每个类型的各个基金经理构建模型,将挂该基金经理名称的所有对应类型基金从具体持仓和历史收益率两个维度构建多因子模型,采用PCA模型提取个人管理基金的对应特征,通过DBSCAN聚类算法将该基金分类到对应的基金经理中,从而为与基金经理存在实际关系的基金打上对应的标签,自动排除了类型不符合或者特征不符合的基金进入基金经理个人业绩曲线的计算过程。

S3、绩效曲线的合成:对每个基金经理管理的每类基金产品(如偏股、纯债),在管理该类产品期间都需要计算对应的基金经理历史绩效,计算方式为,用管理期间所有的该类基金进行每天的收益率市值加权处理,得到每天的加权收益率,然后基于每天的加权收益率计算历史累计净值曲线,净值曲线从1开始计算从而得到所有对应类型基金经理的历史业绩。

如图1所示,步骤S2所述的机器学习模型构建过程如下:

S21、获取区间基金经理管理的全部某类基金日收益率并计算基金的行业收益得到每只基金的区间收益率矩阵,其中行业收益采用该基金持有的最近一期全部股票持仓计算得到,基金行业收益率计算公式为:

其中,M

S22、对每只基金的区间收益率矩阵(含各个行业收益和基金收益率)进行PCA降维,如果采用申万1级行业,则每日一共有31个行业收益率和一个基金收益率,一共32个维度,可以通过PCA最低降低至2维,经过实验发现降低至5维效果比较好,降维的目的是消除各个变量共线性,提高聚类准确率。

S23、对每只基金的降维后的日度时间序列指标按日期做聚类,每个日期由L个基金和S个维度构成L×S矩阵,对该矩阵进行DBSCAN聚类,其中Eps的值可以由K-距离曲线算法得到(参见《浅析DBSCAN算法中参数设置问题的研究》,侯雄文,2017),MinPts参数固定为2,以基金经理单独管理的基金A为目标基金,所有分类不为-1且与A分类一致的基金与A归为一类,认为是基金经理真实管理的基金。其中,Eps代表样本邻域距离阈值,MinPts代表样本距离为Eps的邻域中样本个数的阈值。

步骤S3中所述绩效曲线的合成计算公式如下:

Curve(m)

其中R(m)

本发明的实施例:

取某基金经理管理的10只基金任意5日基金收益以及行业收益,如表1。

表1

/>

其中基金6为目标基金,对收益率指标进行PCA降维,得到5维度因子,如表2:

表2

/>

对基金进行聚类后得到结果如表3。

表3

从聚类结果可以看出,基金4、基金6、基金7稳定的分为一类,基金1、8、9大概率不为一类,其他基金存在一定的概率与基金6为一类,我们按照稳定的基金类别,基金4、基金6和基金7构建业绩曲线,见表4。

表4

绘制出的曲线图如图2所示。需要特别说明的是,本实施例是为了进一步说明本发明方法的实施过程,由于样本量较小,结果存在一定的误差,而实际情况有31个行业,并且时间区间有60个交易日时,本方法的实施效果更好。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号