基于BERT的图像和文本多模态融合分类模型

李佳欣; 苏曙光

首页> 中文期刊> 《计算机应用》 >基于BERT的图像和文本多模态融合分类模型

基于BERT的图像和文本多模态融合分类模型

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

在临床诊断过程中,医生会同时结合医学图像和病理报告文本综合判定病情。针对现有的人工智能(AI)辅助诊断系统未充分利用文本检查内容的问题,提出一种基于BERT模型的图文多模态分类模型(ITMMB),在特征层实现医学图像和病理文本的多模态融合和分类。采用残差网络(ResNet)对图像预处理获得图像词嵌入向量,同时采用分词技术处理文本获得文本嵌入词向量,并将两类嵌入词向量送入BERT模型完成最终分类;此外,为适应BERT模型需要并获得更好的分类性能,优化了ResNet的残差模块、学习权重、损失函数和池化层。在Open Images数据集上的实验结果表明,与仅通过单一的医学图像或病理文本进行辅助诊断的模型相比,ITMMB的微平均F1分数分别提高38.76和4.66个百分点,能有效辅助医生临床诊断。

著录项

来源
《计算机应用》 |2023年第s01期|39-44|共6页
作者
李佳欣; 苏曙光;
展开▼
作者单位

华中科技大学软件学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
多模态融合; 残差网络; 图像分类; 文字分类; 特征提取; BERT;

相似文献

中文文献
外文文献
专利

1. 基于Bert模型的文本多分类应用研究 [J] . 昌磊 ,王依伦 ,陈艳平 . 电脑知识与技术:学术版 . 2023,第4期
2. 融合BERT与标签语义注意力的文本多标签分类方法 [J] . 吕学强 ,彭郴 ,张乐 . 计算机应用 . 2022,第1期
3. BAG:基于注意力机制融合Bert和GCN的文本分类模型 [J] . 李想 ,马致远 ,汪伟 . 软件工程与应用 . 2023,第2期
4. 基于 CT 和磁共振 T2加权图像双模态分类模型的自发性脑出血后脑水肿在 CT 图像上的分割 [J] . 陈明扬 ,朱时才 ,贾富仓 . 集成技术 . 2016,第5期
5. 基于潜在语义的双层图像-文本多模态检索语义网络 [J] . 董永亮 ,柴旭清 . 计算机工程 . 2016,第7期
6. 基于多波段SAR图像目标检测决策级融合和图像分类的目标状态标注 [C] . 刘向君 ,杨泽刚 ,刘强 . 第十四届全国信号处理学术年会 . 2009

基于BERT的图像和文本多模态融合分类模型

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅