本发明公开了一种基于机器阅读理解的桥梁检测领域文本实体识别方法,包括:S1、获取问题文本及目标文本;S2、从问题文本及目标文本中提取字符嵌入、二元字嵌入和加权词嵌入;S3、将字符嵌入、二元字嵌入和加权词嵌入拼接得到联合特征表达;S4、将联合特征表达输入神经网络,完成实体识别。由于字符嵌入仅提取的是上下文字符级别的特征,为了能提取到语义更加丰富的特征,本发明有针对性的引入了外部辞典信息以增强模型输入的特征表达,即引入由大规模语料训练的二元字嵌入(Bigram Embedding)单元和加权词嵌入(Weighted Word Embedding)单元,从而使得实体识别的效果更好。
展开▼