您现在的位置: 首页> 研究主题> 人类视觉系统

人类视觉系统

人类视觉系统的相关文献在1987年到2022年内共计563篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、数学 等领域,其中期刊论文509篇、会议论文33篇、专利文献3754084篇;相关期刊231种,包括中国图象图形学报、电视技术、电子与信息学报等; 相关会议31种,包括浙江省电子学会2014学术年会、2012年西南三省一市自动化与仪器仪表学术年会、第13届全国计算机模拟与信息技术学术会议——信息化、工业化融合与服务创新等;人类视觉系统的相关文献由1194位作者贡献,包括杨恒伏、谢胜利、陈孝威等。

人类视觉系统—发文量

期刊论文>

论文:509 占比:0.01%

会议论文>

论文:33 占比:0.00%

专利文献>

论文:3754084 占比:99.99%

总计:3754626篇

人类视觉系统—发文趋势图

人类视觉系统

-研究学者

  • 杨恒伏
  • 谢胜利
  • 陈孝威
  • 金渊智
  • 易开祥
  • 石教英
  • 郁梅
  • K·M·费尔古森
  • 刘万军
  • 毕笃彦
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 王茜; 郑斌军; 孔玲君; 顾萍
    • 摘要: 目的图像质量评价(IQA)旨在使用计算模型自动衡量和评价图像质量,以代替人类视觉系统的主观意见,并应用到相关实际问题中。方法首先将参考图像与失真图像进行输入,使用视觉显著性模型计算图像局部相似度的特征映射,并在质量得分池化阶段作为加权函数,同时,针对视觉显著性图作为单一特征映射的不足,增加了梯度幅度,然后将图像进行颜色空间的转化提取颜色特征,最后分配相应的权重来计算图像相似度。结果在4个大型数据集上的对比测试显示,在保持适度计算复杂度的同时,VSPSI相比其他有代表性的模型在预测精度上得到了一定的提升,特别是在TID2013数据集上的SROCC达到了0.9055。结论研究结果表明,VSPSI是一个性能优良的IQA方法,在不同数据集和不同失真类型中都有良好的表现,具有较强的鲁棒性,可胜任多类失真图像的客观质量评价,同时可通过优化视觉显著性模型进一步提升VSPSI的性能。
    • 鹿婷; 侯国家; 潘振宽; 王国栋
    • 摘要: 因为水的吸收和散射效应,导致水下图像普遍存在模糊、低对比度和色彩不均衡等问题,而自然图像质量评价方法没有考虑水下成像的特殊性,难以应用于水下图像;同时目前有效的水下图像的质量评价方法较少,且存在一定局限性。针对此问题,提出了一种新的与主观感知密切相关的无参考水下图像质量评价方法,选择与视觉感知相关性高的色度特征(Col)、基于人类大脑视觉皮层的对比度特征(Con)、反映图像信息丰富程度的清晰度特征(Sharp)这3种属性,来构成水下图像质量评价模型,简称CCS。这些视觉特征对水的物理特性比较敏感,而且人类视觉系统(Human Visual System,HVS)易受色彩、对比度和边缘结构等视觉特性变化的影响。为了验证所提方法的性能,在自建小型水下图像数据集上与CPDB,BRISQUE,UCIQE,UIQM这4种无参考评价算法进行了大量的对比实验,在与主观评价相关性度量方面,CCS方法比UIQM方法的RMSE度量指标提升了大约13%,比UCIQE和UIQM方法的PLCC,SROCC和KROCC度量指标提升均超过10%。实验结果表明,CCS算法与人类视觉感知具有高度一致性,能有效、准确地评估水下图像的质量。
    • 马畅; 张选德
    • 摘要: 图像质量评价(Image Quality Assessment,IQA)是计算机视觉领域研究的基本问题之一。目前,绝大多数图像质量模型都是基于灰度图像构建的,而彩色图像质量评价至今依然是IQA领域的开放性问题。彩色图像质量评价研究的关键在于建立与人类色彩认知能力相一致的色彩信息的量化描述。本文基于颜色名称(Colornames,CN)构建彩色图像质量评价模型,将图像的每个像素值映射为CN概率向量,利用Wasserstein距离计算两幅图像的感知色差,以亮度和梯度特征作为补充,在池化阶段采用显著性加权得到客观图像质量评分。在公开测试数据集上的实验结果表明,提出的模型在TID2008、TID2013和最新的KADID-10k数据集上表现最佳,其SROCC值分别为0.9009,0.8901,0.8637。总体评价效果与目前最好的传统方法(非深度学习方法)相当;而对于颜色失真,则具有明显的优势。
    • 楼鑫杰; 李小薪; 刘志勇
    • 摘要: 现有的图像超分辨率重建方法充分利用了强大的深度学习模型,但忽略了人类视觉系统中普遍存在的反馈机制。提出一种新型图像超分辨率重建算法,通过具有约束条件的递归神经网络中包含的隐藏状态实现反馈机制,旨在处理网络间的反馈连接并生成更具说服力的高级表示形式,提供更多的上下文信息,从而帮助低分辨率图像完成高分辨率图像的重建。此外,具有较强早期图像重建能力的反馈网络可逐步生成最终的高分辨率图像。为解决低分辨率图像因多种类型的退化而导致的细节损失问题,引入课程学习策略,使网络适用于更复杂的任务,提升模型的鲁棒性。实验结果表明,该算法能有效提升图像超分辨率重建的准确性,与SRCNN、VDSR、RDN等算法相比,其PSNR值最高提升了7.15 dB。
    • 王宽; 杨环; 潘振宽; 司建伟
    • 摘要: 在立体图像质量评价领域,有效地模拟人类视觉系统对图像质量进行评价具有重要意义,考虑到人眼的视觉感知特性,基于单目和双目视觉信息构建一种立体图像质量评价模型MB-FR-SIQA。采用基于结构相似性的立体视差算法得到参考和失真立体图像的视差矩阵,结合Gabor能量响应图、显著性图和视差矩阵生成中间视图,并优化左右眼加权系数计算方法,以提高生成中间视图的准确性。分别利用单目图像和中间视图提取单目和双目视觉信息,计算单目质量分数和双目质量分数,并融合得到立体图像的质量分数,达到评价立体图像质量的目的。实验结果表明,MB-FR-SIQA模型在LIVE-I数据库上具有较高的预测精度,其斯皮尔曼等级相关系数、皮尔森线性相关系数、均方根误差分别为0.945、0.951、5.318,且预测的质量分数符合人类主观评估。
    • 申天啸; 韩怡园; 韩冰; 高新波
    • 摘要: 驾驶员的危险行为会增加交通事故的发生率,目前对驾驶员行为的研究中大多通过面部识别等方法对异常行为如疲劳驾驶、接电话等进行识别。这种方法仅客观地对驾驶员行为进行分类,而忽略了他们在驾驶过程中的主观心理。眼动仪是记录和分析驾驶员眼动数据的有效工具,可以清晰地了解驾驶员的想法并总结其视觉认知模式。因为目前还没有针对驾驶员眼动行为的数据库,首先构建了真实道路场景下的眼动视频数据集VIPDAR_5,与传统数据相比,它存在更多的摄像机运动、光照变化、视线遮挡等情况。针对这些问题提出了一个基于人类视觉皮层双通路的模型TWNet,通过模拟视觉机制,提高了驾驶员眼动行为的识别性能。另一方面,通过自适应最大池化层和通道权重设置,减少参数,提高准确率。在VIPDAR_5数据集上的实验结果表明,与现有方法相比,该模型能有效识别驾驶员眼动行为。
    • 摘要: 宁波大学信息科学与工程学院蒋刚毅教授等著的《三维视频处理》,2020年11月由科学出版社出版。该书系统地论述了三维视频处理的原理和算法,以三维视频系统为主线,结合人类视觉系统的感知特性进行展开。
    • 杨永锋; 武文才; 杨羽
    • 摘要: 一直以来不可见性和鲁棒性是数字水印算法两个相互制衡的因素,结合人类视觉系统提出了一种建立在离散小波变换基础之上的图像数字水印算法,该算法依据人类视觉系统的光学特性在图像的蓝色通道实施2层离散小波变换,利用小波变换后的高频系数之和的近零性这一统计特性量化嵌入二值水印图像,水印实现了盲提取。同时水印在嵌入前实施了Arnold变换,在嵌入过程中利用密钥控制水印嵌入位置的随机选择,从两方面保证了水印算法的安全性。实验表明算法对压缩、添加噪声等攻击有抵抗力,同时确保算法的不可见性得以很好地维持,而且在针对图像的局部篡改可以定位篡改,能够实现版权保护和内容认证的功能。
    • 路平; 张地; 肖俊峰; 毕科
    • 摘要: 获取立体视觉信息是人们感知世界的基本能力之一,其中运动立体视觉信息的获取不仅是生物视觉系统在动态世界中生存的关键能力,也是人工视觉系统高效处理立体视频的重要手段。为了设计出贴合人眼视觉特性的3D深度运动感知模型,需要明确挖掘人类对立体运动感知的显著特征后再设计主观实验。文中根据单目和双目线索设计了立体运动视觉刺激视频,并采用控制变量的方法,分别探究了目标球体运动速度、参考球体旋转半径及被试正确感知的相互关系,并分析了目标运动方向与被试感知方向之间的关系。首先对实验条件进行探究,结果发现目标与参考的相对距离越小拦截成功率越高,该结果表明目标同参考之间的相对位置关系会影响被试的感知正确性。其次,采用了拦截成功百分比和感知偏差两个行为测量标准对被试感知能力进行分析,结果发现相比横向运动,深度运动正确感知的成功率超出约42.67%~47.01%。这表明不同运动方位的感知不对称,且深度运动带来的视觉刺激更明显。该研究探索了人类对运动感知的显著特征,并为后续设计3D运动感知模型提供了一种新的判断模型感知效果的主观对比标准,使原有立体感知能力的指标更加细化。
    • 沈丽丽; 王丹; 徐珂
    • 摘要: 近年来,深度学习在无参考图像质量评价领域的应用获得了广泛的关注.然而,复杂的双目视觉机制和立体图像的多维特性使得立体图像的质量评估更具有挑战性.基于人类视觉皮层的交互作用,提出一个多级表示网络用于无参考立体图像质量评价.为了克服缺乏具有主观质量分数的大规模训练数据问题,将图像的主观平均意见分数分配给图像中的所有小图像块.同时,考虑到大量来自同质区域的图像块会混淆网络训练和质量分数预测过程,采用基于方差的阈值指标来过滤部分同质图像块.多级表示网络由初级子网和高级子网两部分组成,在初级子网中,将视差图加入网络构成三通道卷积神经网络,分别提取并交互立体视图和视差图的初级特征;在初级子网的输出端,将特征分别级联得到基于视差的交互式双目特征和无视差交互的单眼特征;高级子网采用二通道卷积神经网络,进一步提取高级融合特征信息,更好地模拟人类视觉系统的信息处理机制.最终,所提出的多级表示网络不仅提取了立体图像的单眼特征,还提取了基于视差/深度信息的双目特征.在公开的LIVE 3D PhaseⅠ和LIVE 3D PhaseⅡ数据库上进行测试,实验结果表明该网络在对称和非对称立体图像数据库上较其他方法均取得了较好的结果,能够与人类的主观感知保持良好的一致性.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号