为了改善在字嵌入层中的字向量嵌入方式单一问题,提出一种结合实体关联标注器的中文命名实体识别模型。在标准命名实体识别模型之前,先利用句向量与句中实体词向量训练实体关联标注器,再将实体关联标注器产生的标记信息融入字嵌入层。最后,通过双向长短期记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)级联条件随机场层(Conditional Random Field,CRF)生成最优标签序列。通过Resume和人民日报数据集进行命名实体识别实验,结果表明,改进模型的准确率、召回率和F_(1)值均高于其他模型,F_(1)值达到了94.81%和90.19%。
展开▼