您现在的位置: 首页> 研究主题> 特征抽取

特征抽取

特征抽取的相关文献在1980年到2022年内共计856篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、信息与知识传播 等领域,其中期刊论文666篇、会议论文81篇、专利文献70431篇;相关期刊295种,包括中国图象图形学报、计算机工程、计算机工程与设计等; 相关会议66种,包括2017年全国高性能计算学术年会 、第十六届中国管理科学学术年会、信息系统协会中国分会第五届学术年会等;特征抽取的相关文献由1706位作者贡献,包括杨静宇、陈才扣、吴小俊等。

特征抽取—发文量

期刊论文>

论文:666 占比:0.94%

会议论文>

论文:81 占比:0.11%

专利文献>

论文:70431 占比:98.95%

总计:71178篇

特征抽取—发文趋势图

特征抽取

-研究学者

  • 杨静宇
  • 陈才扣
  • 吴小俊
  • 杨健
  • 王士同
  • 金忠
  • 陈伏兵
  • 高秀梅
  • 宋晓宁
  • 严云洋
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 韩雨婷; 肖悦; 刘红云
    • 摘要: 基于计算机的问题解决测验可以实时记录被试探索环境和解决问题时的详细行动痕迹,并保存为过程数据。首先介绍了过程数据的分析流程,然后从问题解决测验入手,分别对过程数据的特征抽取和能力估计建模两方面的研究进行了梳理和评价。未来研究应注意:提高分析结果的可解释性;特征提取时纳入更多信息;实现更复杂问题情景下的能力评估;注重方法的实用性;以及融合与借鉴不同领域的分析方法。
    • 周黎源
    • 摘要: 针对传统的数字图书馆文本特征抽取方法存在特征抽取不完整,抽取准确率低的问题,提出基于多标签分类的数字图书馆文本特征抽取方法。从引文功能标签集合中选取元子集,确定样本的引文全局功能集合。根据引文句功能合并示例,研究词汇、句法、物理、整体特征。构建基于多标签分类的数字图书馆文本特征提取模型,分析特征之间相关性,采用绝对值法和增加概率系数法的改进措施,避免了特征词缺失,完成了数字图书馆文本特征抽取。由实验结果可知,该方法抽取的文本特征完整且准确率高,为数字图书馆高效管理提供保障。
    • 祁瑞华; 邵震; 关菁华; 郭旭
    • 摘要: 引文意图自动分类是文献计量领域的重要问题,现有的引文意图分类模型存在对文本特征抽取能力有限、无法融合引文上下文特征和引文外部特征的问题.因此,文中提出基于MPNet预训练和多头注意力特征融合的引文意图分类方法.引入位置补偿结构,改善掩码语言模型与排列语言模型存在的缺陷.联合引文的语法词频特征与引文结构特征,提出适用于引文意图分类任务的特征抽取方法.再引入多头注意力机制进行特征融合,提升分类效果.在ACL-ARC数据集上的实验表明,文中方法在引文意图分类任务上性能较优,同时还具有在不平衡数据上的鲁棒性.
    • 张杨; 乔柳; 东春浩; 高鸿斌
    • 摘要: 针对目前已有的基于深度学习的数据竞争检测方法提取特征单一和准确率低的问题,提出一种基于深度学习的数据竞争检测方法DeleRace,该方法首先利用程序静态分析工具WALA从多个实际应用程序中提取指令、方法和文件等多个级别的特征,对其向量化并构造训练样本数据;然后通过ConRacer工具对真实数据竞争进行判定进而标记样本数据,采用SMOTE增强算法使正负数据样本分布均衡化;最后构建并训练CNN-LSTM深度神经网络进行数据竞争检测.从DaCapo,JGF,IBM Contest,PJBench基准测试程序套件中分别选取26个不同应用领域的基准测试程序进行训练数据样本抽取和数据竞争检测,结果表明DeleRace的数据竞争检测准确率为96.79%,与目前已有的基于深度学习的检测方法DeepRace相比提升了4.65%.此外还将DeleRace与已有的动态数据竞争检测工具(Said和RVPredict)和静态数据竞争检测工具(SRD和ConRacer)进行比较,验证了DeleRace的有效性.
    • 向姝璇; 李睿
    • 摘要: [目的/意义]在自动摘要技术的基础上,结合专利特性,提出一种专利技术功效特征的自动抽取方法.[方法/过程]抽取对象包括核心技术内容、功能效用描述两部分;根据专利的文本结构特性设计抽取方案;对所抽取到的技术内容语句进行核心性计算和评价,对所抽取到的功能效用语句进行情感分析,凝练和筛选后得到专利技术功效特征.[结果/结论]样本对比试验显示,本文提出的方法较同类方法在ROUGE值上有所提升,能够较好地实现专利技术功效特征的自动抽取.
    • 郭磊; 周文杰; 高少伟
    • 摘要: 身处信息时代,为了保护信息安全,如何准确鉴定某个人的身份,已经成为社会各界的难点.作为生物识别技术的一个重要分支,人脸识别技术在商业、安全、身份认证等领域有着广泛的应用.通过对传统PCA、分块PCA、MPCA以及二维PCA的人脸识别算法中的特征抽取方法以及对算法取不同参数情况下的性能和算法间性能对比,得出二维PCA性能更优的结论,并以此为基础,通过软件工具设计出了基于以上四种方法的人脸识别技术的仿真系统.
    • 王宇
    • 摘要: 目前,各大金融机构在日常运营过程中,会产生大量非结构化的语音或文本数据,在这些数据中往往蕴含了用户对企业产品、营销活动等最真实的反馈信息.然而,运营部门对这些数据的分析、挖掘主要依赖人工处理,工作量大,时效性不高,基于文本挖掘技术的智能化分析与挖掘能力,不仅会显著降低运营部门的日常运营成本,还能大大提升公司营销活动、产品设计的运营水平.笔者首先分析了企业运营过程中产生的文本表达特征,提出基于用户数据否定窗口的用户关键意图抽取方法,对运营文本数据进行预处理,然后采用聚类算法对数据进行归类,并提出基于关键词连接矩阵的聚类合并算法,对聚类结果进行二次合并,最后提出基于关键词评分的聚类摘要自动提取模型,抽取类簇的描述信息.最后,使用62、双12等重大营销活动期间的网络客服对话数据对模型进行验证,取得良好的效果.
    • 郭磊; 周文杰; 高少伟
    • 摘要: 身处信息时代,为了保护信息安全,如何准确鉴定某个人的身份,已经成为社会各界的难点。作为生物识别技术的一个重要分支,人脸识别技术在商业、安全、身份认证等领域有着广泛的应用。通过对传统PCA、分块PCA、MPCA以及二维PCA的人脸识别算法中的特征抽取方法以及对算法取不同参数情况下的性能和算法间性能对比,得出二维PCA性能更优的结论,并以此为基础,通过软件工具设计出了基于以上四种方法的人脸识别技术的仿真系统。
    • 庄卫金; 方国权; 张廷忠; 陈中
    • 摘要: 随着电力工控系统内负荷终端的大量部署,系统遭受网络入侵的风险将极大提高.在将网络入侵检测技术应用于电力工控系统时,已开发的检测模型往往无法取得理想效果,而训练新的模型又将面临安全、隐私等原因造成的数据采集困难.因此,研究一种基于特征抽取的入侵检测方法,该方法通过堆叠稀疏自编码器结构提取抽象特征,以SVM(支持向量机)分类器为输出层实现入侵检测.在模型训练过程中引入迁移学习策略进行优化,经算例验证该方法能有效提升模型面向有限数量目标域内数据的检测效果和训练效率.
    • 卢浩; 郑文渊
    • 摘要: 2020年9月,国家医保局会同财政部印发《关于扩大长期护理保险制度试点的指导意见》,随即在社交媒体平台上引发网民广泛讨论。本研究将以网民关于长期护理保险(以下简称"长护险")政策的评论为研究对象,采用TF-IDF特征抽取、K-means聚类等方法,建立长护险舆情分布模型。结果显示,长护险政策舆情根据语义可分为五大主题,且舆情主题分布在地区上存在明显差异。本文在上述研究基础上进行深入分析,为我国长护险发展提出相关建议。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号