中文病历文本分词方法研究

李国垒; 陈先来; 夏冬; 杨荣

首页> 中文期刊> 《中国生物医学工程学报》 >中文病历文本分词方法研究

中文病历文本分词方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础.分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义词典、ICTCLAS+统计分词和ICTCLAS+自定义词典结合互信息统计分词4种策略,对1 500份出院记录中的病历文本进行分词处理,并从准确率、召回率和综合指标值等3个方面对分词结果进行评价.以人工分词的50份出院记录结果为标准依据,4种分词策略的综合指标值分别为45.77％、58.76％、64.93％和78.06％.结果证实,自定义词典结合基于互信息的统计分词方法,能够有效地对病历中出院记录文本进行分词处理,可以满足临床数据分析的需求,具有良好的推广意义.

著录项

来源
《中国生物医学工程学报》 |2016年第4期|477-481|共5页
作者
李国垒; 陈先来; 夏冬; 杨荣;
展开▼
作者单位

中南大学信息安全与大数据研究院,长沙410013;

中南大学信息安全与大数据研究院,长沙410013;

医学信息研究湖南省普通高等学校重点实验室(中南大学),长沙410013;

湖南省高等学校医学大数据2011协同创新中心,长沙410013;

中国科学院成都文献情报中心,成都610041;

中南大学湘雅医院,长沙410078;

展开▼
原文格式 PDF
正文语种 chi
中图分类生物医学工程;
关键词
病历文本; 中文分词; 统计分词; 词典分词; 出院记录;

相似文献

中文文献
外文文献
专利

1. 中文电子病历命名实体识别方法研究 [J] . 马欢欢 ,孔繁之 ,高建强 . 医学信息学杂志 . 2020,第004期
2. 中文电子病历命名实体识别的主动学习方法研究 [J] . 王润奇 ,李雪莉 ,黄玉丽 . 中国数字医学 . 2017,第010期
3. 中文文本分词及其可视化技术研究 [J] . 石凤贵 . 现代计算机（专业版） . 2020,第012期
4. 隐马尔可夫模型在中文文本分词中应用研究 [J] . 王庆福 . 无线互联科技 . 2016,第013期
5. 一种基于互信息的串扫描中文文本分词方法 [J] . 赵秦怡 ,王丽珍 . 情报杂志 . 2010,第007期
6. 基于Re-entity-CRF的中文电子病历命名实体识别 [C] . PAN Cui-ran ,潘璀然 ,WANG Qing-hua . 中华医学会第二十四次全国医学信息学术会议 . 2018
7. 中文文本分词及词性标注自动校对方法研究 [A] . 钱揖丽 . 2003

中文病历文本分词方法研究

摘要

著录项

相似文献

相关主题

期刊订阅