基于关键词自动提取的口述病历识别系统设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音识别技术在医疗信息化行业中的应用日益凸显。在电子病历EMR系统中，语音识别技术的应用可以有效提高病历文本的输入速度，省去医生手动输入病历的繁琐过程。目前，基于语音识别的EMR系统主要存在两大问题：一是自然口语中的犹豫停顿FP、重复、修改等不流利现象给识别带来了困难；二是识别出的病历文本缺少必要的文本格式，致使其可读性、易读性不高。
　　为此，本文设计实现了医学环境下的自然口语语音识别系统；分析了病历文本的结构内容和关键词词性分布，在此基础上改进了词频-反向文档频率TF-IDF关键词提取算法，提高了识别结果的可读性、易读性；设计实现了基于自然口语语音识别和关键词自动提取的EMR系统。本文的创新之处在于，通过建立FP检测模型和面向医学的语音识别系统，提高了医学环境下的自然口语语音识别效果；完成了对TF-IDF关键词提取算法的改进，从病历文本关键词词位置、关键词词性分布、病历文本分类入手，对关键词提取中特征项权重进行修正，使提取的关键词能更好地反映病历文本主题和关键内容。
　　本文的主要研究工作包括：
　　(1)完成了基于高斯混合模型-多层感知器GMM-MLP的FP检测模型建模及训练，实现了自然口语语音中FP检测功能，模型查全率Recall达到60％，查准率Precision达到65%以上。
　　(2)构建了医学环境下的语音语料库。实现了基于FP检测和高斯混合隐马尔科夫HMM-GMM模型的自然口语语音识别系统。对于不同测试集A和B，FP检测模型的引入使得词错误率CER%平均下降1.94和2.37。
　　(3)研究了基于TF-IDF的关键词提取算法，针对病历文本的特定结构和内容从病历文本关键词词位置、词性分布、文本分类入手改进了传统TF-IDF算法。实验表明算法的Recall和Precision均能达到60%以上。在此基础上，实现了基于病历文本特征项余弦相似度的病历文本自动匹配。
　　(4)设计并实现了基于自然口语语音识别和关键词自动提取的EMR系统。该系统实现了口述医学病历的语音识别、关键词自动提取、相似病历自动匹配、长时语音自动切分与FP裁剪、多进程解码以及病历文本标点自动加注等功能。测试表明系统具备良好的使用效果，自然口语语音识别正确率平均达到85.09%。

著录项

作者
卞德忠;
展开▼
作者单位

武汉理工大学;

展开▼
授予单位武汉理工大学;
学科信息与通信工程
授予学位硕士
导师姓名阙大顺;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类业务管理;语音识别与设备;
关键词
电子病历; 自然口语; 语音识别; 关键词; 特征提取;

相似文献

中文文献
外文文献
专利

1. 基于Windows的离线关键词语音识别系统设计与实现 [J] . 孙林超 ,秦会斌 ,崔佳冬 . 软件导刊 . 2019,第009期
2. 基于Windows的离线关键词语音识别系统设计与实现 [J] . 孙林超1 ,秦会斌1 ,崔佳冬1 . 软件导刊 . 2019,第009期
3. 基于电子病历文档自动提取合理用药监测信息的方法研究 [J] . 王兴强 ,孟娜 . 中国卫生信息管理杂志 . 2018,第006期
4. 一种基于图和聚类的关键词自动提取方法 [J] . 谢勤政 ,谭庆平 ,颜颖 . 郑州大学学报（理学版） . 2018,第002期
5. 基于Scopus检索和TFIDF的论文关键词自动提取方法 [J] . 陈列蕾 ,方晖 . 南京大学学报：自然科学版 . 2018,第3期
6. 基于动态数量高斯分量的关键词识别系统 [C] . Zhang Yang ,张扬 . 第十一届中国智能机器人会议 . 2015
7. 基于关键字提取及标点加注技术的口述病历识别系统设计与实现 [A] . 缪辉 . 2016

基于关键词自动提取的口述病历识别系统设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅