公开/公告号CN114862595A
专利类型发明专利
公开/公告日2022-08-05
原文格式PDF
申请/专利权人 杭州丙丁网络科技有限公司;
申请/专利号CN202210610877.7
申请日2022-05-31
分类号G06Q40/06(2012.01);G06Q40/04(2012.01);
代理机构
代理人
地址 310000 浙江省杭州市经济技术开发区杭州电子科技大学科技园2楼253室
入库时间 2023-06-19 16:17:34
法律状态公告日
法律状态信息
法律状态
2022-10-21
实质审查的生效 IPC(主分类):G06Q40/06 专利申请号:2022106108777 申请日:20220531
实质审查的生效
2022-08-05
公开
发明专利申请公布
技术领域
本发明属于金融行业数据分析领域,具体涉及一种高压缩无损量化价格或指数变化的编码算法。
背景技术
随着人们生活水平的提高,我国金融产品也迎来发展热潮,截至2022年,两市股票多达4600只,总市值接近100万亿,全国股民突破2亿,金融数据与金融资讯规模庞大,受此影响,网络媒体与金融业非常发达。金融标的在价格走势上常用K线进行表达,K线首创于德川幕府时代的一位叫做本间宗久的日本粮食商人,用于预测米价的涨跌,距今已有300多年历史。K线在显示金融产品价格及指数变化方面非常直观,取得了巨大的成功,但基于图形化的表达也存在空间占用过大、数据量化不足、难以查询分析等缺陷。
本发明采用一种全新的数字、字母和字符组合的方式描述价格或指数的变化。采用该编码算法的优点在于高压缩、无损量化表达了变化趋势,可直接或借助工具如正则表达式对金融数据进行解析、查询、统计、计算、分析及趋势预测等,并可以衍生各种大数据和人工智能产品。同时,通过颜色、错行显示等,可以形象的对标的变化进行展示,方便阅读。对于金融数据庞大的当下,该编码算法具有巨大且长远的推广价值。
发明内容
当前,金融数据与金融资讯规模日益庞大,传统K线存在占用位置大、数据量化不足、缺乏查询和解析的手段,本发明发明了一种高压缩无损量化金融产品价格或指数变化的编码算法。
本发明的目的是通过以下技术方案来实现的:某时段内的价格或指数变化编码包括多个编码单元,编码单元为所述时段内单位时段的价格或指数变化,每个编码单元包括多个指标项,指标项为某一具体指标的价格或指数变化百分比,即±p
进一步地,所述的指标项,当±p
进一步地,所述的指标项,当±p
进一步地,所述的特殊字符也可采用汉语拼音音调符号“ˉˊˇˋ”, 4个音调符号“ˉˊˇˋ”分别与50个字母“A-Y、a-y”进行两两组合,将(-10% ,10%)区间等分为200个涨跌区间,1个字母和1个汉语拼音音调符号组合形成1个新的字符。
进一步地,所述的字母或字符“A-Z”、“a-z”、“0”、“-”也可以采用其他任意类型或个数的字母或字符表示。
进一步地,所述的4个特殊字符“;<=>”也可以采用其他任意类型或个数的字母或字符表示。
进一步地,所述的编码单元之间根据时间先后顺序可以进行同行顺序排列,也可以根据不同变化区间进行错行异列排列。
进一步地,所述的指标项之间可以按照约定的次序同行顺序排列,也可以根据不同变化区间进行错行同列排列。
进一步地,所述的指标项、编码单元之间可以辅以特殊符号加以区分。
进一步地,所述的指标项、编码单元中的数据、字母或字符可以使用文字修饰符号,包括但不限于前景色、背景色、粗体、斜体、下划线。
本发明的有益效果:1、编码后的数据高压缩。编码后的数据更加简洁,缩短了原数据的长度,数据记录最长可以缩短50%,数据显示最长可以缩短75%,如跌幅为-0.1%时,-0.1%可以编码为a>,长度由4个缩短为2个,在显示时利用声调符号可以显示为á,长度进一步缩短为1个,节省了75%的显示空间。
2、编码后的数据无损。可以通过“前缀+字母+后缀+特殊字符”的方式金融数据或指数的变化进行无损表达,保证了数据精度。
3、编码后的数据利用字符串形式对金融数据或指数的变化进行了量化表达,方便直接或间接采用软件工具如正则表达式对数据进行查找、解析、查询、统计、计算、分析及趋势预测等。
4、编码后的数据可读性强。各编码单元可以根据时间先后顺序可以进行同行顺序排列,也可以根据不同变化区间进行错行异列排列。各编码单元内的指标项之间可以按照约定的次序同行顺序排列,也可以根据不同变化区间进行错行同列排列,并可为编码单元内的字符赋予不同的颜色,可让用户对数据一目了然,并在此基础上,可以衍生各种大数据和人工智能产品。
附图说明
图1:量化金融产品价格或指数变化的编码计算流程图。
图2:精度为0.4%的指标项字母与变化区间对照图。
图3:精度为0.1%的指标项字母和特殊字符组合与变化区间对照图。
图4:实施案例的编码算例。
图5:实施案例的编码单元异列错行排列图(5日内)。
具体实施方式
以下在具体实施中详细叙述本发明的详细特征及优点,其内容足以使任何熟悉相关技艺者了解本发明的技术内容并据以实施,并理解本发明相关的目的和优点。
下面以一具体实施案例进行阐述,以助于理解。
案例描述:已知某金融产品5日内的收盘价原始数据,利用本发明所述的编码算法对该案例进行编码、编码流程按照图1进行,编码算例,如图4所示,采用本发明,对该金融产品5日内的收盘价涨跌百分比进行编码,具体实施方式如下所述。
步骤1:获取某金融产品5日内的收盘价原始数据,具体数据见图4第1行数据。
步骤2:计算每日的收盘价涨跌差值,
步骤3:计算第i日的收盘价涨跌百分比,计算公式为:
步骤4:前缀。前缀等于第i日的收盘价涨跌百分比的绝对值除以10%所得数,仅取其整数部分后所得的整数,当绝对值为0时,前缀要省略,计算公式为:
步骤5:查询编码字母。根据第i日收盘价涨跌百分数的符号和个位及小数的数据部分,查图2获取对应变化区间的字母,即对于百分比:±
如果精度满足要求则执行步骤8,如果对精度要求较高,执行步骤6:
步骤6:查询编码字母和特殊符号。根据第i日收盘价涨跌百分比的符号和个位及小数的数据部分,查图3获取对应变化区间的字母和特殊符号组合,即对于百分比:±
如果精度满足要求则执行步骤8,如果对精度要求较高,继续执行步骤7:
步骤7:编码后缀。后缀等于对应指标项的价格或指数变化百分比的百分位及其后的小数数字,即对于百分比:±
步骤8:获得收盘价编码。收盘价编码=“前缀+字母+后缀+特殊字符”,具体对应的字母见图4第8行数据。
步骤9:获得编码单元。编码单元等于各指标编码的组合,因只有一个收盘价指标,所以编码单元等于指标编码,具体对应的字母见图4第9行数据。
步骤10:获得5日编码。5日编码等于编码单元的时间顺序组合,编码单元等于收盘价的编码组合=“前缀+字母+后缀+特殊字符”,编码数据见图4第10行数据。
步骤11:压缩5日编码。特殊字符采用汉语拼音音调符号“ˉˊˇˋ”组合,对5日编码进行压缩,压缩后的编码数据见图4第11行数据。
步骤12:步骤11的编码根据不同时间和变化区间进行错行异列排列,如图5所示。
由以上案例可知:(1)案例中的5日收盘价涨跌幅“12.39%-6.51%-6.22%13.71%-30.85%”,通过本发明所述的编码算法编码后的编码为“1F9>q1 (2)案例中的5日收盘价涨跌幅“12.39%-6.51%-6.22%13.71%-30.85%”,通过本发明所述的编码算法编码后的编码与编码前的数据精度完全一致,做到了无损。 (3)案例中的5日收盘价涨跌幅“12.39%-6.51%-6.22%13.71%-30.85%”,通过本发明所述的编码算法编码后的编码,方便使用软件工具如正则表达式进行数据查询、统计、计算,分析,并可在此基础上衍生各种大数据和人工智能产品。例如采用正则表达式 (4)案例中的编码可以根据不同时间和变化区间进行错行异列排列,也可以给编码中的数据、字母或字符可以使用文字修饰符号,包括但不限于前景色、背景色、粗体、斜体、下划线,方便了用户阅读使用。 虽然本发明披露如上,但本发明并非限定于此。任何不脱离本发明精神范围内的各种修改,如股东股本、换手量等金融数据的量化,将英文字母改为其他字母等,下跌改用大写表达,以及各种文本修饰等,均在本发明的保护范围内。
机译: “财产识别方法”(“ PIM”)是一种新颖的算法,通过该算法,可以通过对文件(如市议会/房屋价格通知)进行图像处理来创建房地产管理局和/或产权转让数据。本发明建立了一种独特的算法,该算法结合了诸如深度学习分段和计算机视觉之类的技术来解码属性信息。该应用程序利用以某种方式配置的计算机实现的技术,以使运输商和房地产经纪人能够自动创建客户端文件。
机译: 语音参数编码设备,用于同一设备的编码系统,适用于同一设备的计算机可读记录介质状态编码算法,用于该设备的语音参数量化设备,用于该设备的量化方法以及计算机可读的已记录编码
机译: 一种基于大数据的评估产品批发价格指数的系统以及使用该方法评估产品的批发价格指数的方法