首页> 中国专利> 基于人工智能的翡翠分级估值评估方法、系统及应用

基于人工智能的翡翠分级估值评估方法、系统及应用

摘要

本发明属于智能终端信息处理技术领域,公开了一种基于人工智能的翡翠分级估值评估方法、系统及应用,确定已售翡翠图片的HSV颜色域的统计分布,将所述统计分布作为所述已售翡翠图片的特征向量,建立起翡翠分级估值信息数据库;确定待估翡翠图片的HSV颜色域的统计分布,计算所述待估翡翠图片与所述数据库包含图片的相似度,查询所述数据库,找到相似度小于5的已售翡翠图片;搜寻所述数据库,若存在图片距离小于1的已售翡翠图片,利用所述已售翡翠图片代表的价格作为待估翡翠价格估计;若不存在,对查询到的最相似的历史图片,选取相关性符合设定数值的特征进行回归分析,预测待估翡翠的价格。本发明提高了线下的鉴定服务的效率。

著录项

  • 公开/公告号CN112685589A

    专利类型发明专利

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 深圳市对庄科技有限公司;

    申请/专利号CN202011557382.X

  • 发明设计人 高凡启;易金鹏;王秀辉;

    申请日2020-12-24

  • 分类号G06F16/583(20190101);G06K9/34(20060101);G06Q10/06(20120101);G06T7/194(20170101);G06T7/90(20170101);

  • 代理机构11541 北京知果之信知识产权代理有限公司;

  • 代理人卜荣丽

  • 地址 518000 广东省深圳市福田区福田街道岗厦社区彩田路3069号星河世纪A栋601

  • 入库时间 2023-06-19 10:41:48

说明书

技术领域

本发明属于智能终端信息处理技术领域,尤其涉及一种基于人工智能的翡翠分级估值评估方法、系统、介质、终端以及翡翠分级估值设备。

背景技术

目前:被称为“玉石之王”的翡翠在我国有着悠久的历史,同时也有着巨大的翡翠珠宝消费市场。翡翠市场的交易与消费者的购买热情息息相关;为了解决翡翠市场的交易、消费者的购买热情的问题,行业内目前全国大小有100多的检测机构,主要业务包括翡翠真假鉴定、出评估证书等。同时存在多个智能翡翠交易平台,主要提供安全的、先进的在线交易模式,并且提供真假鉴定服务。一般来说,一件翡翠真假评估大概需要10分钟,而翡翠的估值却需要1-2周的时间。从效率上看,智能翡翠交易平台提供线下的鉴定服务,远远不能满足大量消费者的翡翠评估需求;从标准上看,目前翡翠没有统一的质量分级标准;从价格上看,由于信息和专业的不对称,商家操纵着翡翠的价格市场。

通过上述分析,现有技术存在的问题及缺陷为:

(1)目前的智能翡翠交易平台提供线下的鉴定服务的效率较低,远远不能满足大量消费者的翡翠评估需求。

(2)目前翡翠没有统一的质量分级标准,信息和专业的不对称,导致翡翠的价格与实际价值相差较大。

发明内容

针对现有技术存在的问题,本发明提供了一种基于人工智能的翡翠分级估值评估方法、系统、介质、终端。

本发明是这样实现的,一种基于人工智能的翡翠分级估值评估方法,所述基于人工智能的翡翠分级估值评估方法包括:

步骤一,确定已售翡翠图片的HSV颜色域的统计分布,将所述统计分布作为所述已售翡翠图片的特征向量,建立起翡翠分级估值信息数据库;

步骤二,确定待估翡翠图片的HSV颜色域的统计分布,计算所述待估翡翠图片与所述数据库包含图片的相似度,查询所述数据库,找到相似度小于设定阈值(设定为5)的已售翡翠图片;

步骤三,搜寻所述数据库,若存在图片距离小于设定阈值(设定为1)的已售翡翠图片,利用所述已售翡翠图片代表的价格作为待估翡翠价格估计;若不存在,对查询到的最相似的历史图片,选取相关性符合设定数值的特征进行回归分析,预测待估翡翠的价格。

进一步,所述翡翠分级估值评估方法进一步包括价格区间估计方法,具体为:

在步骤二价格预测过程中,通过回归分析得到预测值的,待估翡翠价格区间采用置信度为50%下的区间估计结果;如区间覆盖范围较大,则适当降低置信度,选取更小的区间;

对于通过相似度加权平均得到的价格,则区间估计下限为估计值*0.7,上限为估计值*1.3。

进一步,在步骤一和步骤二中,对于历史交易的已售翡翠和待估翡翠图片在确定统计分布之前,需要使用深度学习中的语义分割模型进行背景去除预测以及高光去除预测。

进一步,所述HSV颜色域采用色调H,饱和度S,明度V三个参数。

进一步,步骤三中,通过选取相关性符合设定数值的特征进行回归分析,预测待估翡翠的价格的方法对于查询到的最相似的已售翡翠图片进行分析,获取所代表的待估翡翠的价值信息,基于这些价值信息对待估翡翠进行估值;

根据价值信息中的特征和价格的相关性,选取相关性大于某一个阈值的特征去做回归分析,选取特征时,有多少特征与价格的相关性超过预设的阈值就用多少个特征;当这些特征都没有显示出和价格有明显的相关性时,对待估翡翠的价格估计则是通过对不同相似程度的商品的价格作加权平均,然后给出预测价格结果。

本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。

本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。

本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现上述的基于人工智能的翡翠分级估值评估方法。

本发明的另一目的在于提供一种实施上述基于人工智能的翡翠分级估值评估方法的基于人工智能的翡翠分级估值评估系统,其特征在于,所述基于人工智能的翡翠分级估值评估系统包括:

估值数据库建立模块,用于历史交易的商品图片使用深度学习中的语义分割模型进行背景去除预测以及高光去除预测;统计经过背景和高光处理的图片的HSV颜色域的统计分布;以统计分布作为图片的特征向量;

相似图片查询模块,用于进行价值估计时,对翡翠做背景去除和高光去除处理,统计处理后图片的HSV颜色域的统计分布;计算图片与全库图片的相似程度;

价格预测模块,用于在整个商品库里如果存在距离<1的数据,则认为待估翡翠与商品库内的该件品质一致,以这种最相似的图片所代表的商品的价格作为待估翡翠的价格估计;否则,查询到的最相似的图片,得到所代表的商品的其它信息,基于其它信息可以对待估商品进行估值;

价格区间估计模块,用于通过回归分析得到预测值的,商品价格区间采用置信度为50%下的区间估计结果。

本发明的另一目的在于提供一种设置有上述翡翠分级估值评估系统的翡翠分级估值设备。

结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明解决了目前的智能翡翠交易平台提供线下的鉴定服务的效率较低,远远不能满足大量消费者的翡翠评估需求的问题;采用本发明的技术方案后提高了线下的鉴定服务的效率,满足了大量消费者的翡翠评估需求。

本发明解决了目前翡翠没有统一的质量分级标准,信息和专业的不对称,导致翡翠的价格与实际价值相差较大的问题;采用本发明的技术方案后使得翡翠有了统一的质量分级标准,使得信息和专业对称。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于人工智能的翡翠分级估值评估方法流程图。

图2是本发明实施例提供的基于人工智能的翡翠分级估值评估系统的结构示意图;

图中:1、估值数据库建立模块;2、相似图片查询模块;3、价格预测模块;4、价格区间估计模块。

图3是本发明实施例提供的基于人工智能的翡翠分级估值评估方法的实现流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

针对现有技术存在的问题,本发明提供了一种基于人工智能的翡翠分级估值评估方法、系统、介质、终端,下面结合附图对本发明作详细的描述。

如图1所示,本发明提供的基于人工智能的翡翠分级估值评估方法包括以下步骤:

S101:历史交易的已售翡翠图片使用深度学习中的语义分割模型进行背景去除预测以及高光去除预测;统计经过背景和高光处理的图片的HSV颜色域的统计分布,以统计分布作为图片的特征向量,建立数据库。

S102:进行价值估计时,对待估翡翠做背景去除和高光去除处理,统计处理后图片的HSV颜色域的统计分布;计算待估翡翠图片与数据库图片的相似程度。

S103:在整个商品库里如果存在距离<1的数据,则认为待估翡翠与商品库内的该件品质一致,以这种最相似的图片所代表的商品的价格作为待估翡翠的价格估计;否则,查询到的最相似的图片,得到所代表的商品的其它信息,基于其它信息可以对待估商品进行估值。

S104:通过回归分析得到预测值的,商品价格区间采用置信度为50%下的区间估计结果。

本发明提供的基于人工智能的翡翠分级估值评估方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的基于人工智能的翡翠分级估值评估方法仅仅是一个具体实施例而已。

如图2所示,本发明提供的基于人工智能的翡翠分级估值评估系统包括:

估值数据库建立模块1,用于历史交易的商品图片使用深度学习中的语义分割模型进行背景去除预测以及高光去除预测;统计经过背景和高光处理的图片的HSV颜色域的统计分布;以统计分布作为图片的特征向量。

相似图片查询模块2,用于进行价值估计时,对翡翠做背景去除和高光去除处理,统计处理后图片的HSV颜色域的统计分布;计算图片与全库图片的相似程度。

价格预测模块3,用于在整个商品库里如果存在距离<1的数据,则认为待估翡翠与商品库内的该件品质一致,以这种最相似的图片所代表的商品的价格作为待估翡翠的价格估计;否则,查询到的最相似的图片,得到所代表的商品的其它信息,基于其它信息可以对待估商品进行估值。

价格区间估计模块4,用于通过回归分析得到预测值的,商品价格区间采用置信度为50%下的区间估计结果。

下面结合附图对本发明的技术方案作进一步的描述。

如图3所示,本发明提供的基于人工智能的翡翠分级估值评估方法包括以下步骤:

第一,建立估值数据库:

对庄平台的历史交易的商品图片使用深度学习中的语义分割模型进行背景去除预测以及高光去除预测;统计经过背景和高光处理的图片的HSV颜色域(Hue,Saturation,Value,色调H,饱和度S,明度V)的统计分布;在后续的图片搜索时,以该统计分布作为图片的特征向量。

第二,查询图片相似的图片:

当对某个蛋面翡翠进行价值估计时,对蛋面翡翠做同样的背景去除和高光去除处理,统计处理后图片的HSV颜色域的统计分布;计算该图片与全库图片的相似程度;计算相似程度所采用的度量方法为Wasserstein distance(Wasserstein距离),找出最相似度小于5阈值的图片。

第三,价格预测:

(1)在整个商品库里如果存在距离<1的数据,则认为待估翡翠与商品库内的该件品质一致,以这种最相似的图片所代表的商品的价格作为待估翡翠的价格估计;否则,按下面的估计逻辑进行。

(2)查询到的最相似的图片,得到所代表的商品的一些其它信息,比如尺寸、种、水头等,基于这些信息可以对待估商品进行估值;首先去分析在这样一个小的区域内,一些可能和价格相关的因素,比如尺寸、种、水头等和价格的相关性;然后选取相关性大于某一个阈值的特征去做回归分析,皮尔逊相关系数的合理范围是-1到1之间,最后计算的数值的绝对值越接近于1,表示这两个属性的线性相关性越强。在实际应用时,0.6或0.7及以上是可用的,通常会选择这个范围,如果实际的数据表现了更强的相关性,这个阈值也会适当提高。但当相关性的值小于0.6时,不进行回归分析。

当有特征的相关性大于预设阈值时,做“回归分析”;当没有特征显示出相关性时,做“加权平均”。回归分析旨在使用最小二乘法去找一组参数(a,b,c,d…,constant),使得price=a*因素1+b*因素2+c*因素3+…+constant这个方程能去尽可能的去拟合数据。加权平均则是通过将搜索到的商品的相似度距离换算成权重,再分别乘以搜索到的商品的价格,得到最终的价格。

权重具体的数值是实时计算的,假设某一次搜索到的图片共三张距离分别是0.1,0.2,0.5,则先得到它们的倒数10,5,2,再归一化为0.588,0.294,0.118,然后再分别乘以它们的价格作为最终的价格。选取特征时,有多少特征与价格的相关性超过预设的阈值就用多少个特征;当这些特征都没有显示出和价格有明显的相关性时,对商品的价格估计则是通过对不同相似程度的商品的价格作加权平均,然后给出预测价格结果。

在本发明实施例之中,待售翡翠的某个信息(如尺寸、种、水头)和价格的相关性的计算方法是采用皮尔逊相关系数。

在“相关性大于某一个阈值”中,阈值的确定方法为:

皮尔逊相关系数的合理范围是-1到1之间,最后计算的数值的绝对值越接近于1,表示这两个属性的线性相关性越强。在实际应用时,0.6或0.7及以上是可用的,通常会选择这个范围,如果实际的数据表现了更强的相关性,这个阈值也会适当提高。但当相关性的值小于0.6时,再去做回归分析的意义就不是很大。

当有特征的相关性大于预设阈值时,做回归分析;当没有特征显示出相关性时,做“加权平均”。回归分析旨在使用最小二乘法去找一组参数(a,b,c,d…,constant),使得price=a*因素1+b*因素2+c*因素3+…+constant这个方程能去尽可能的去拟合数据。加权平均则是通过将搜索到的商品的相似度距离换算成权重,然后再分别乘以搜索到的商品的价格,得到最终的价格。权重具体的数值是实时计算的,假设某一次搜索到的图片共三张距离分别是0.1,0.2,0.5,则先得到它们的倒数10,5,2,然后再归一化为0.588,0.294,0.118,然后再分别乘以它们的价格作为最终的价格。

第四,价格区间估计:

在第三步价格预测过程中,通过回归分析得到预测值的,商品价格区间采用置信度为50%下的区间估计结果;如区间覆盖范围较大,则适当降低置信度,选取更小的区间。对于通过相似度加权平均得到的价格,则区间估计下限为估计值*0.7,上限为估计值*1.3。本发明中的置信度是指统计学中的置信,置信度即为区间估计的可靠程度。

区间覆盖较大的量化指标是(置信上限-置信下限)/(置信上限+置信下限)当这个值大于0.5时,即到了不可接受的区间覆盖范围较大的程度。通常会通过将置信度到这个区间的指标小于0.5时就不再调低置信度了。置信度是衡量应用统计学的方法去做价格估计时,估计结果的可靠程度。置信度越低,那估计结果的可靠程度也就越低,结果失去意义。

应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号