您现在的位置: 首页> 研究主题> CRF

CRF

CRF的相关文献在1989年到2022年内共计724篇,主要集中在外科学、自动化技术、计算机技术、中国医学 等领域,其中期刊论文521篇、会议论文3篇、专利文献200篇;相关期刊327种,包括现代图书情报技术、井冈山大学学报(自然科学版)、中华实用中西医杂志等; 相关会议3种,包括第六届全国信息检索学术会议、全国第15届计算机辅助设计与图形学学术会议、全国老年性痴呆发病机理和药物作用靶位研讨会等;CRF的相关文献由1919位作者贡献,包括L·E·J·肯尼斯、中里笃郎、伊维斯·圣丹尼斯等。

CRF—发文量

期刊论文>

论文:521 占比:71.96%

会议论文>

论文:3 占比:0.41%

专利文献>

论文:200 占比:27.62%

总计:724篇

CRF—发文趋势图

CRF

-研究学者

  • L·E·J·肯尼斯
  • 中里笃郎
  • 伊维斯·圣丹尼斯
  • 大久保武利
  • 张丹
  • 罗马诺·迪法比奥
  • 野泽大
  • 侯彪
  • 傅贵平
  • 刘芳
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 施寒瑜; 曲维光; 魏庭新; 周俊生; 顾彦慧
    • 摘要: 数量名短语的识别是识别由数量短语修饰的名词短语左右边界的研究.以往研究中,基于统计学习模型的数量短语识别方法依赖人工特征,需要通过专家知识构建知识库来实现对“数词+量词”短语的识别.本文在以往研究基础上纳入“名词”形成“数词+量词+名词”等八类数量名短语,并采用深度学习方法解决这一边界识别任务.通过BERT模型对原始文本进行上下文特征表示,利用Lattice LSTM模型字词结合的思想将标准分词作为软特征融入文本字符级的特征表示中,最后通过CRF全局约束识别数量名短语边界.实验结果表明,本文方法在AMR语料上达到较优结果,精确率、召回率、F1值分别为80.83%,89.78%,85.07%.
    • LI Daiyi; TU Yaofeng; ZHOU Xiangsheng; ZHANG Yangming; MA Zongmin
    • 摘要: Traditional named entity recognition methods need professional domain knowl-edge and a large amount of human participation to extract features,as well as the Chinese named entity recognition method based on a neural network model,which brings the prob-lem that vector representation is too singular in the process of character vector representa-tion.To solve the above problem,we propose a Chinese named entity recognition method based on the BERT-BiLSTM-ATT-CRF model.Firstly,we use the bidirectional encoder representations from transformers(BERT)pre-training language model to obtain the se-mantic vector of the word according to the context information of the word;Secondly,the word vectors trained by BERT are input into the bidirectional long-term and short-term memory network embedded with attention mechanism(BiLSTM-ATT)to capture the most important semantic information in the sentence;Finally,the conditional random field(CRF)is used to learn the dependence between adjacent tags to obtain the global optimal sentence level tag sequence.The experimental results show that the proposed model achieves state-of-the-art performance on both Microsoft Research Asia(MSRA)corpus and people’s daily corpus,with F1 values of 94.77% and 95.97% respectively.
    • 孙甜; 陈海涛; 吕学强; 游新冬
    • 摘要: 专业术语的自动抽取对于领域机器翻译、领域知识图谱等方面均具有重要作用.近年来,新能源领域专利文本的申请量逐年增加,我国科技文献走向世界有了更高需求,专业术语翻译质量直接影响专利文本的翻译质量.为了提高新能源领域专利文本术语抽取结果的准确率和召回率,构建新能源领域术语库以及提高新能源领域专利文本的翻译质量打下基础.本文提出了基于BERT-BiLSTM-CRF的新能源专利术语抽取方法,以自建的3002条新能源领域专利文本作为实验对象,在中文数据集上的实验结果达到了0.9211的精确率,0.9245的召回率以及0.9228的F1值.与其他经典深度学习术语抽取模型相比,基于BERT-BiLSTM-CRF的新能源专利术语抽取模型能有效地将新能源领域专利文本中字符较多的长序列术语识别出来,提高术语抽取在实际应用中的效果.
    • 樊海玮; 秦佳杰; 孙欢; 张丽苗; 鲁芯丝雨
    • 摘要: 针对现存交通事故文本信息中存在的大量时间、地点、伤亡损失等关键异构数据难以有效提取,以及用静态词向量深度学习模型提取交通事故文本信息精确度较低的问题,本文利用BERT(Bidirectional Encoder Representations from Transformers)对文本字符进行动态向量映射,从数据表达源头解决一词多义、上下文依赖不充分等问题;利用BiGRU(Bi-Gate Recurrent Unit)提取文本向量化后的特征,输出高特征的文本序列;利用CRF(Conditional Random Fields)计算全局最优输出节点的概率优势,优化文本序列特征结果,提出一种基于动态字向量的BERT-BiGRU-CRF融合模型,用于交通事故文本关键信息提取。通过对比实验表明,该模型在交通事故文本信息提取中平均准确率为0.952,F1为0.925,比基于静态词向量Word2Vec模型的精确率与F1值分别提高了6.3个百分点和7.9个百分点。
    • 韩娜; 张昊洋
    • 摘要: 针对现有事件抽取模型事件数据集规模较小、存在开销与性能不平衡问题,采用ALBERT预训练语言模型生成词向量,将其输入BiLSTM+CRF模型完成句子级事件的特征向量提取,抽取出事件触发词、论元和角色等中文事件要素,在大规模中文事件数据集DuEE上进行验证。结果表明,该模型与其他同类型模型相比,准确率和F_(1)值均有所提升,在大规模事件数据集上的准确率、召回率和F_(1)值分别为95.4%、77.8%和85.7%。
    • 龚艳; 汪玉; 梁昌明; 黄林钰; 乐汉; 徐圣婴; 王本强
    • 摘要: 针对警情数据中日益增长的不同种类要素提取需求,提出一种多模型融合的要素提取方法。对于警情数据中人名、地名、机构名等无明显规律的要素,采用BERT+BiLSTM+CRF模型结合文本上下文信息的方法,抽取包含语义信息的关键要素;对于时间、车牌号等具备一定规律的数据,采用模式识别方法抽取符合定义规则的相关要素;然后将上述两种方法融合,形成一体化模型进行要素提取。验证实验结果表明,与传统命名实体识别方法相比,BERT+BiLSTM+CRF模型在测试集上的F1值均提高3%以上,模式识别效果提高1%以上,可满足日常警情的要素提取需求。
    • 孔令巍; 朱艳辉; 张旭; 欧阳康; 黄雅淋; 金书川; 沈加锐
    • 摘要: 为提高传统命名实体识别模型在中文电子病历上的准确性,提出一种在基线模型BERTBiLSTM-CRF中加入对抗训练的方法,该方法在词嵌入层添加扰动因子从而生成对抗样本,并利用对抗样本进行迭代训练,从而优化模型参数。CCKS2021评测数据集实验结果表明,加入FGM和PGD两个对抗训练模型后,其精准率、召回率以及F_(1)值相比于基线模型均有所提升。并且通过对比实验,验证了加入对抗训练能够提高模型的预测能力和鲁棒性。
    • 傅源坤; 柳先辉; 赵卫东
    • 摘要: 为了提高智能制造装备方面的命名实体识别能力,提出了一种融合语言模型的智能制造装备命名实体识别模型。首先采用BERT语言模型对智能制造装备专利进行上下文的特征提取获取字粒度的向量矩阵,然后采用BiLSTM进行上下文信息的特征提取,并通过CRF模型增添约束得到全局最优序列,最终通过序列识别出智能制造装备的命名实体。根据实验表明,提出的模型与其它模型相比各项指标均有提升,能较好地应用于智能制造装备命名实体识别的任务。
    • 顾乾晖; 徐力晨; 涂振宇; 黄逸翠
    • 摘要: 在水利领域中,传统的命名实体识别方法存在有效性差、精度不高、无法解决一词多义和缺乏水利领域语料等问题。基于此,利用BERT语言模型对自建水利文本语料进行训练,并引入FreeLB对抗训练模型增强模型的泛化能力,最后通过条件随机场(CRF)来得到水利实体识别方法。实验结果表明,相对于其他模型,本文提出的FreeLB-BERT-CRF模型对水利领域文本实体识别效果更好。
    • 周翔; 刘杨
    • 摘要: 证件信息识别是当前重要的人工智能应用领域,可以在金融服务和电商等多个场景提升经济活动效率和商业流程、办事流程的自动化水平。该文使用百度PaddlePaddle深度学习框架和基于双向LSTM+CRF+XGBoost模型的信息抽取与分类矫正方法,融合人工规则,在统一社会信用代码证书、民办非企业单位登记证书、事业单位法人证书等为代表的证件信息识别任务上取得了超越当前商业应用的效果。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号